ヤフーは5月19日、人工知能技術「ディープラーニング」を同社で開発した音声認識エンジン「YJVOICE(ワイジェイボイス)」に実装し、認識精度を大幅に改善させたと発表した。

「ディープラーニング」のサービスへの実装は初めてのことで、同日より18のスマートフォン・タブレットアプリとウィジェットで、精度が向上した音声認識機能が利用できるようになった。

YJVOICEのシステム構成とDNN実装範囲

この人工知能技術は脳神経細胞の働きを工学的にモデル化した手法。通常、こうした技術では様々な事例を学習させるための膨大なデータが必要だが、同社では、「Yahoo!検索」や「音声検索」などで蓄積したビッグデータを生かし、2013年より研究を開始していた。また、東京工業大学の篠田研究室の篠田 浩一教授との共同研究なども進めている。

今回の実装によって特に向上したのは、騒音下における認識精度。従来は騒音などの影響で一定の場面で誤認識があったもののうち、約1/3で精度が改善された。例えば、駅ホームでの「Yahoo!乗換案内」、街頭での「音声検索」などが、従来より快適に利用できるようになったという。

音声区間検出を用いた音声認識処理の流れ

「YJVOICE」を搭載するスマートフォン・タブレットアプリ、ウィジェットは、iOS、Android用が、Yahoo! JAPANYahoo!音声アシストYahoo!カーナビYahoo!地図Yahoo!乗換案内の10種。

その他、iOS用は、音声検索など3種。Android用は、Yahoo!ブラウザーなど3アプリ、2ウィジェットとなる。