日立製作所は11月17日、多言語音声翻訳サービスの実現に向け、スマートデバイスに対応した音声処理技術を開発したことを発表した。

今回、音声信号のタイミングのずれの影響を受けにくい音量比を用いて認識対象の音声と雑音とを簡易的に分離し、さらに分離後の音声を比較しながら音声信号のタイミングのずれによる時間差の変化を補正することにより、専用デバイスと同様に、汎用的なスマートデバイスでも時間差を使った高精度な雑音除去を適用することを実現した。

ユーザー音声以外の雑音を除去することで、街頭の騒音レベルに匹敵する70dBの雑音環境でも音声認識が可能となる。

また、今回開発した音声処理技術により、雑音が少なくなり、ユーザー音声が強調されるため、発話と発話の区切りを明確に自動認識することができるようになった。

これにより、ボタン押下で発話区間を知らせることが不要となったことに加え、発話と発話の区切りが明確になったことで、1回の音声入力時間が短縮し、チャットのように会話の区切りごとに随時翻訳を可能とする連続文入力に対応することが可能になった。

同技術はクラウド上で音声処理および翻訳処理を行うため、既存のスマートデバイスに専用アプリケーションをダウンロードするだけで、使用することができる。