NTTドコモは1月22日、英語音声を自動で文字起こしする音声認識AIサービス「Otter」の日本での事業展開に向けて、Otterを提供するAISense(Otter.ai)と協業を開始すると発表。ドコモとOtter.ai、機械翻訳サービスを手掛けるみらい翻訳の3社で連携し、新たなサービスの開発を進める。
Otterは、スマートフォンで録音した英語音声をリアルタイムにテキスト化できるWebサービス。講演や会議を録音した長時間の英語音声や、複数人の音声識別に対応しているほか、AIによる高精度な文字起こしが可能で、「英語でのレポートや議事録の作成時間を削減できる」としている。テキスト化された内容のキーワード検索や、テキストをタップするだけで聞き直しができるなど、録音内容の振り返りもしやすくした。
主な特徴は以下の通り。また、YouTube動画でOtterの利用イメージを紹介している。
- 前後の文脈に合わせて文章を自動で修正しながらリアルタイムに精度の高い文字起こしが可能
- ユーザーの音声をAIが学習して話し手を明確に識別し、ラベリングして記録
- 録音した音声を再生する際、該当のテキスト部分をハイライト表示
- テキスト化された部分をタップすると該当箇所を再生
グローバル企業では現在、多くの時間を要する翻訳業務の効率化の需要が高まっている。今回の協業を通じて、ドコモは「Otter」の普及に向けて日本市場での需要や有用性などについて調査を開始。その一環として、語学教育のベルリッツ・ジャパンが全国で展開する「ベルリッツ・ランゲージセンター」において、受講生へのOtterの利用案内を実施する。レッスンをOtterで録音することで、授業内での会話が文字として記録され、Otterの機能を生かした学習の振り返りによって効果を検証する。
また、1月23日〜24日に開催されたイベント「DOCOMO Open House 2020」では、英語でのプレゼンテーションをOtterで書き起こし、みらい翻訳とドコモが共同開発した機械翻訳エンジンでリアルタイムに日本語訳し、双方をスクリーンに表示するデモを実施していた。
2020年度から国内企業へのOtterの導入支援に取り組む予定。また、みらい翻訳のサービスとOtter.aiのサービスを組み合わせた、セキュアな環境での高度な翻訳を行うサービスの実現に向けて、検討を開始する。
なお、この発表に先立ち、ドコモは子会社のNTTドコモ・ベンチャーズを通じて、2019年12月12日にOtter.aiへ出資している。