NTTビズリンクは、クラウド型映像コミュニケーションサービス「SMART Communication & Collaboration Cloud」のオプションサービスとして、「Smart翻訳」を発表した。遠隔コミュニケーションにおける音声のテキスト化とリアルタイム翻訳を実現する。
会話の切れ目に応じてテキストがリアルタイムで画面上のチャットエリアに表示。どのクライアントからの発言であるかも記録が残り、テキストもダウンロードも可能で、あとで記事録などに活用できる。
テキスト化と翻訳は、NTTコミュニケーションズの「COTOHA API」(翻訳は今後対応)、Google Cloud Speech-to-text/Google Cloud Translation、Microsoft Azure Speech to Text/Microsoft Azure Translator Textのいずれかを切り替えて利用できる。複数のAPIを組み合わせた利用も可能だという。
翻訳は現在、最大20カ国に対応し、日本語-英語-中国語など、3言語以上での会話も可能だという。また、翻訳したテキストを合成音声が読み上げることもできる。 ただ、くだけた表現、クロストーク、雑音のある環境では精度が下がるという。
オプション価格は、月額3万円からで、別途、テキスト化と翻訳のAPI利用料も必要になる。Microsoft Azure Speech to Text/Microsoft Azure Translator Textを利用した場合(1時間を20日間)は、合計で33,136円ほどになるという。
利用シーンとしては、会議、講演・研修、面談などを想定している。今後はこれまでのSkype for Business、WebRTCに加え、Microsoft Teamsを接続ラインナップに追加していくほか、録画済みのコンテンツの音声認識や翻訳機能、画像認識、要約機能を追加していく。
NTTビズリンク 代表取締役社長 大井貴氏は、「既存の基盤の上に新しい機能をつけて利用シーンを広げていく。今後はソリューションだけでなく、使い方も含めて提供していく」と語った。