NECは5月7日、雑音除去技術と音声強調技術を組み合わせることで、家電やスマートフォン・タブレット端末などを離れたところから声で操作できる、音声認識技術を開発したと発表した。
同技術は従来、利用が難しかった雑音下においても、マイクから離れて発話した音声を正確に検知し、機器の操作ができる音声インタフェースを実現。この技術により音声を用いて、騒がしいリビングルームやキッチンで約1m離れた場所から機器を操作したり、走行中の車内でカーナビをスムーズに操作したりすることが可能になる。また、工場などの生産現場、店舗や倉庫などの流通現場においても、音声を利用したデータ入力にも応用できる。
開発した技術は、機器に搭載した二つのマイクに入る音(音声+雑音)の信号から、雑音成分を逐次推定・除去して音声成分だけを残す技術と、雑音除去を行った結果、歪みが発生し認識が難しくなった音声に対して、モデルに基づいて音声成分を強調する技術。
雑音除去技術は、時間とともに変化する雑音にも正確に追従し除去することで、従来の雑音除去技術よりも正確に音声だけを検知することができ、これにより、機器のボタンを押す、機器に向かって手を叩くなど、操作を開始する際に行っていた動作が不要となる。
モデルに基づいて音声成分を強調する技術では、歪んだ音声を音声認識に適した音に調整することが可能となり、モバイル端末向け音声認識の世界標準規格よりも優れた音声認識精度を実現する。
NECは今後も、音声認識技術のさらなる強化を図り、人にやさしい情報社会の実現を目指して研究開発を進めていく。