富士通研究所は10月13日、スマートフォンにおいて画面を見ずに音声だけでさまざまな情報を取得できる音声インタフェース技術を開発したと発表した。

スマートフォンなどのモバイル端末を見ず/触れずの状態で、ニュースなどの情報サービスを受けるには、音声による入出力がスムーズに行われる必要がある。具体的には、システムがコンテンツを正しく読み上げたり、ユーザーが発した言葉を正確に認識したりするには、時代とともに増えていく新しい言葉に対応すること、場面に応じて正しい言葉を理解することが課題となっている。

同社はこれらの課題を解決し、アイズフリー、ハンズフリーの状態で、ユーザーが気になる言葉を話すだけで、それに関連した情報を次々と引き出し、システムが読み上げる新しい音声インタフェースを開発した。

例えば、システムが読み上げたニュースのヘッドラインから気になった言葉を発すると、さらにそれに関する詳細記事をシステムが読み上げることが可能になる。

開発した技術の特徴は、「最新の時事用語・新語を正しく聞き、正しく読み上げる技術」、「過去のやり取りから同音異義語を判断する技術 」、「快適なレスポンスを実現する技術」。

日々増加する時事用語や時代とともに変化する言葉に対応するため、インターネット上から最新の用語に関して「表記(かな)」のパターンを自動抽出し、単語辞書に自動登録する技術が開発された。

過去のやり取りから同音異義語を判断する技術では、同音異義語など、曖昧性のある単語も正しくシステムが認識するため、ユーザーの意図に沿った応答をすることが実現される。

音声だけでモバイル端末から情報を取得できるインタフェース技術の仕組み

音声だけでモバイル端末から情報を取得できるインタフェース技術の利用シーン

同社では、同技術をモバイル向けのクラウドサービスのユーザーインタフェース機能として2012年度中の実用化を目指し、本年度中に実証実験を行うとともに、さまざまな利用シーンへの適用を検討していく。