NEC、音声認識技術活用したDX支援サービス - Web会議を即時にテキスト化

NECは3月7日、最新のディープラーニングを活用した独自の音声認識技術を採用したDX（デジタルトランスフォーメーション）支援サービス「NEC Enhanced Speech Analysis - 高性能音声解析 - 」を開発したことを発表した。従来は実用化が難しかった自由会話の認識や、耐騒音性、複数人が参加している会話でも発言ごとに話者を識別できる点が同サービスの特徴だ。

「NEC Enhanced Speech Analysis - 高性能音声解析 -」の特徴

同サービスの第一弾として、NECのクラウド基盤上でテキスト化した音声認識結果を返送する「APIサービス」と、Web会議の音声をリアルタイムでテキスト化し出力可能な「Meeting Assistant」の提供を開始する。2つのサービスの詳細は以下。

「APIサービス」
音声データをNECのクラウド基盤上でテキスト変換し、音声認識した結果を顧客のシステムへ返送する(別途、システム構築が必要)。騒音の多い屋外環境にも強いため、建設現場やプラント設備などにおける現場報告作業など、さまざまな業務の効率化を支援する。提供価格は900円/10時間～となり、3月7日より提供を開始する。

「Meeting Assistant」
Webアプリケーションを通じて発話内容をリアルタイムにテキスト化する。テキスト化は発話者名も自動付記できる他、テキスト変換された発話内容をテキスト形式で出力することも可能だ。これにより、議事録作成にかかる時間を削減できる。また、会議開始時に議事録タイトルや出席者などの情報を登録することで、過去の議事録の一覧管理も可能。提供価格は3000円/10時間～となり、3月31日より提供を開始する。