次世代の操作方法として注目される音声認識。いま、この分野でもっとも熱い視線を浴びているのが米Amazon.comの「Alexa(アレクサ)」だ。数ある音声認識サービスの中で注目を集める理由はどこにあるのだろうか。

マイクで音声を拾い、クラウドで音声認識

Alexaの使い方は簡単だ。室内に家庭用スピーカーのAmazon Echoを置き、「アレクサ、音楽をかけて」と話しかけると、言葉を理解して音楽をかけてくれる。リモコン操作なども必要なく、音声だけで使えるのがAlexaの特徴だ。

Alexaに対応した米Amazon.comの家庭用スピーカー「Amazon Echo」

Alexaの実体はクラウド上にある。Echoは「アレクサ」と話しかけられるまで常時待機しており、その後に続く音声データをクラウドに送信する。クラウド上では「音楽」「かけて」といった単語を認識し、Echoにフィードバックする仕組みだ。

高性能マイクが音を拾ってくれる

マイクの性能もポイントだ。iPhoneを手に持って話しかけるSiriとは異なり、Echoのマイクは部屋全体の音を拾う。リビングのソファや寝室のベッドで、あるいはキッチンで洗い物をしながら話しかけるだけで、Echoは反応してくれるというわけだ。

これが普及すれば、家庭内のインターネット体験はスマホからEchoに置き換わるかもしれない。その可能性を悟ったグーグルは、2016年に「Google Home」というスピーカーを発売して対抗している。