東芝は、クラウド型音声・映像活用サービス「RECAIUS(リカイアス)」シリーズのサービスとして、これまで商品化した「音声ビューア」「音訳エディタ DaisyRings」「音声書き起こしエディタ」の各サービスに加え、音声を活用する「音声クリエータ」「同時通訳」「音声対話」のサービス提供を11月4日から開始すると発表した。
「RECAIUS」は、音声や映像から人の意図や状況を理解し、人にわかりやすく伝える、音声・映像・知識処理の統合型クラウドサービス。
今回、商品化される「音声クリエータ」は、テキストを音声化する音声合成機能を提供するクラウドサービス(SaaS)で、ナビゲーションや店舗案内といった各種音声案内、eラーニングやオーディオブックなどのコンテンツ作成に活用できるものとなっている。幅広い年代・性別の声で自然な音声を制作でき、日・英・中・韓・仏・独など11言語に対応しており、喜びや怒りなどの感情表現も可能だとしている。声質や韻律といった人の音声の特徴を短時間の録音音声から高速学習する技術により、タレントやキャラクターの似声制作も可能で、エンターテインメントや広告のコンテンツ作成にも活用できるという。
また、音声合成エンジンをPaaS(WebAPI)としても提供し、アプリケーションや既存システムへの音声合成機能の組み込みを可能としている。
「同時通訳」では、発話を音声認識し、認識結果を翻訳する機能が提供される。日英/英日、日中/中日の3カ国語に対応し、空港や駅など公共の交通機関や店舗、観光地などでの外国人とのスムーズなコミュニケーションを可能としている。音声認識と機械翻訳の並列動作により、話していることをリアルタイムで次々に翻訳でき、さらに辞書をカスタマイズすることで、翻訳精度を高めることも可能なほか、翻訳結果のテキスト表示や、合成音声での応答もできるという。
「音声対話」では、発言者の意図を捉えて応える音声対話を実現しており、対話に必要な音声認識や音声合成に加え、意図理解のための知識処理機能が提供される。利用シーンや業務用途に応じた対話知識(シナリオ)や辞書を構築することで、適用範囲を拡大できるとしている。例えば、引っ越しをして区役所に連絡した場合、「先週、引っ越して来たのですが」という問いかけに対して「住民票の移動手続きはお済みですか?」と、発言者の意図を捉えて応答する対話システムの構築などが考えられるという。テキストでの対話にも対応しており、対話型の店舗案内や相談サービス、自動音声応答システムへの活用も可能としている。