Google、The Live Transcribe Speech Engineをオープンソースで公開

Googleは同社Androidアプリケーション「Live Transcribe」のエンジンをオープンソースでGitHubに公開したことを現地時間16日に公式ブログで発表した。

リアルタイムに音声を文字へと転写する「Live Transcribe」は、耳の不自由な方や難聴者のために今年初めに同社が公開したAndroid用のアプリで、日本語を含む70言語に対応している。

「Live Transcribe」公式Webサイト

音声の認識は先端のGoogle Cloud Speech APIによりほとんどの条件下では高精度の転写精度を実現するが、Cloud Speech APIが無制限に長いオーディオストリームの送信をサポートしていないことやクラウドに依存することでネットワーク遅延、データコストなどの国毎に異なる課題が生じる、など数カ月のユーザーテストの課題を紹介したうえで各地、各所で誰しもがアクセスしやすい世界を構築して欲しいと公式ブログを締めている。