Googleの音声検索、新たなニューラルネットワークでより正確に

Google Web Search

Googleは9月24日(米国時間)、「Research Blog: Google voice search: faster and more accurate」において、「Connectionist Temporal Classification」および「sequence classification criteriaの最適化」という2つの技術を活用することで従来よりも優れたニューラルネットワークによる音声処理技術を実現したと伝えた。この技術は、Googleの音声検索の精度と処理速度の向上に貢献する。

今回、リカレントニューラルネットワークを拡張した技術がGoogle検索に搭載された。この技術は、従来のDeep Neural Networksによる音声入力処理技術よりも処理速度が大幅に高速化されたうえ、騒音がひどいような状況においてもより正確に音声内容を解析できるようになったとしている。

この新しい音声処理技術はすでに実際のサービスで使われており、デスクトップ版の音声検索やAndroid/iOS上のGoogleアプリ、Androidデバイスにおけるディクテーション機能で活用されている。スマートウォッチなどの音声入力を主なテキスト入力源とするデバイスも普及が始まっており、こうした音声認識技術は今まで以上に重要になっている。