東芝は9月1日、クラウド型音声・映像活用サービス「RECAIUS」シリーズの一環として、音声を認識して可視化(テキスト化)し、キーワードをビジュアル表示するクラウドサービス「RECAIUS 音声ビューア」を提供開始すると発表した。

同サービスでは、スマートフォンやマイクを介して発話すると、その音声データがクラウド上で即時に音声認識されるとともに、テキスト化された内容からキーワードを自動抽出して時系列でビジュアル表示する。

音声ビューアは現時点では日本語のみに対応しているが、英語と中国語版は開発中となっている。音声認識のWeb APIは日本語、英語、中国語に対応している。

RECAIUS 音声ビューアの概要

また、ディープラーニング手法によって音声認識を高精度化したほか、利用企業(利用ドメイン)ごとの辞書カスタマイズを少ない手間でできるため、固有の単語や話し言葉の認識精度を高めることが可能。

同サービスの活用シーンとしては、オフィス会議での発話内容を記録・テキスト化し共有する場合、声でつぶやいた内容をテキスト化してSNSなどで共有する場合、講演内容をリアルタイムにテキスト化して多目的に活用する場合などが考えられるという。

RECAIUS 音声ビューアの利用シーン