スマートフォンは、携帯電話とコンピュータ両方の顔を持ちます。ですから、スペック表を見れば専門用語のオンパレード……これではおいそれと比較できません。このコーナーでは、そんなスマートフォン関連の用語をやさしく解説します。今回は「音声アシスタント」についてです。

***

音声アシスタントとは、人の話し言葉を集音して分析し、その結果をコンピュータに命令としてフィードバックする一連の機能/サービスです。コンピュータ1台で完結するタイプもありますが、現在ではスマートフォンが集音とデータ化を行い、それをクラウド上に存在する音声分析用サーバに送信、そこで認識処理を行い命令用のデータに変換したうえで送信元のスマートフォンへ戻す、というクラウドを組み合わせた形式が増えています。

現在、音声アシスタントとして知られる機能/サービスとしては、Appleの「Siri(シリ)」、Amazonの「Alexa(アレクサ)」、Googleの「Google Assistant」、NTTドコモの「しゃべってコンシェル」などが挙げられます。2011年にSiriが登場した当初は、スマートフォン(iPhone)のアプリに口頭で命令することが機能の主眼と見られていましたが、2014年にAmazonが「Echo」を発表した頃からトレンドに変化が生じています。

Amazonは、高い音声認識性能を持つ処理エンジン「Alexa」を提供するほか、Alexaと連携した各種機能/サービスを提供するアプリをつくるための開発キットを公開しました。メーカーは、任意の語いやさまざまな追加機能をパッケージ化したソフトウェア「Skill」を用意することにより、Alexa対応の自社製品に音声認識+αの機能を持たせることができるのです。

そのような音声アシスタントを搭載したデバイスは「スマートスピーカー」と呼ばれ、急速に数を伸ばしています。人の話し声を周囲の雑音に影響されず入力するマイク、音楽再生にも耐えうる音質を備えたスピーカーが求められることから、オーディオメーカーが積極的な製品展開を始めています。

音声認識にはディスプレイやキーボード/マウスが必要ないため、スマートスピーカーは小型化や車載化に適しています。ワイヤレス通信を前提としているため、いつでも命令できるよう各部屋・自家用車内に設置するという使いかたが一般化すれば、消費者の生活に大きな変化を与えるかもしれません。

音声アシスタントがいろいろな命令を受け付ける「スマートスピーカー」が注目されています(写真はオンキヨーの「P3」)