SiriにGoogleアシスタント。最近、スマホの音声アシスタントを利用したという方はどれほどいるだろうか。

筆者はiPhoneとGoogle Pixelを併用しているが、「Hey Siri」も「OK Google」も言わないし、Pixelに採用されている「Active Edge」(本体をギュっと握ることでGoogleアシスタントを起動する機能)を使ったのも、Pixelを手にしてからのほんの数日だけだった。

デジタルパフォーマンス・マーケティングエージェンシー iProspectの調べでは、APAC地域における18~50歳の1800人以上のスマホ利用者のうち、過去6カ月以内に音声認識機能(音声検索、音声対応アプリなどを含む)を使った人の割合は62% 。この割合は日本では約40% といい、APAC平均にかなり見劣りし、中国(77% )やインド(82% )と比べると半分に過ぎない。

なぜ日本では普及しないのか。調査を発表したiProspect社に実態を取材し、その理由を探ると、スマホ、スマートスピーカーに限らない「音声アシスタント」の現状と未来が見えてきた。もしかすると、音声アシスタントを活用しない国は、世界市場から取り残されてしまうかもしれない。

  • 米iProspectがAPACにおける音声認識機能の使用率を調査。同社のAPAC Head of Innovation & North Asia Commerceのネイト・シュリラ氏(左)、COOの渡辺大吾氏に話を伺った

    米iProspectがAPACにおける音声認識機能の使用率を調査。同社のAPAC Head of Innovation & North Asia Commerceのネイト・シュリラ氏(左)、COOの渡辺大吾氏に話を伺った

地域によって「音声認識」への印象は違う?

――なぜ日本では音声アシスタントの使用率は低いのでしょうか

渡辺大吾氏(以下、渡辺) : 文化的な影響はあるでしょう。日本人は、集団の秩序を守る傾向にあります。注目されたくない、恥をかきたくないと思う人が多い。人前で「Hey Siri」と言って、認識されなかったら恥ずかしいですよね。

ネイト・シュリラ氏(以下、シュリラ) : 反対に、中国やインドなどの地域では音声アシスタントを使用しているのが「格好いい」というイメージを持っている人が多い。そもそも音声認識機能を使えるようなデバイスを持っていることが1つのステータスであり、彼女の前で「OK Google、美味しいレストランを教えて」と言うのが、スマートだという価値観があるのです。

――使っている姿を見られたくない?

渡辺 : かつての失敗体験も影響しているでしょうね。2011年にSiriが登場した時、人々は「人間の声を認識して機械が応えてくれるなんて、素晴らしい」と思ったことでしょう。しかし、いざ使ってみると誤認識することが多かった。

その頃のSiriの認識率は77% ほどでした。つまり4分の1ほどの言葉を間違って認識するのです。今では性能はかなり上がり、2017年には(英語で)95% ほどの認識率を達成しました。人間の認識能力と同程度です。しかし、当時の経験がもとになって未だに「大丈夫かな? 」と不安になる人も多い。

――地域によって音声アシスタントへの印象が異なるのはなぜなのでしょう

渡辺 : 頻繁に利用されている地域で共通しているのは、“テクノロジーの変化に慣れている”点。中国やインドは、ここ数年で急激にテクノロジーが成長しており、新たなテクノロジーに触れる機会が多い。しかし、日本はそうではありません。テクノロジーの進化は緩やかに市場に受け入れられてきました。日本は常に最新のテクノロジーに囲まれており、豊かな生活をおくっていました。だからこそ、急激な変化に保守的になってしまうのです。

「音声アシスタント」がもたらす市場への影響

――スマホに限らず、最近は「Google Home」「Amazon Alexa」など、音声認識技術を活用した「スマートスピーカー」が普及しています

渡辺 : 家では人の目を気にする必要がないこともあり、音楽を聴く、天気情報を確認する、照明やエアコンのオンオフを切り替える、といった用途でスマートスピーカーを使う人が増えてきています。

シュリラ : 最近は、メルセデスが音声アシスタントを取り入れたことも話題になりました。人前での音声認識機能の使用に抵抗のある日本人も、車や家などの「クローズな空間」で使用できるスマートスピーカーは、徐々に普及していくことでしょう。そうやって音声認識を使う人が増えてくると、デバイスに声をかけることへのハードルが下がります。

「Pokemon Go」のリリース当時、スマホを見ながら歩き、急に立ち止まるような人を見ると、違和感がありました。しかし、今はそんな人を見ても特に驚きはしません。これは私たちの慣れが原因でしょう。音声認識においても、いつかブレイクスルーのタイミングが来ることでしょう。

――現在のスマートスピーカーの市場規模はどれほど?

シュリラ : ニールセンの調査では、2018年の第2四半期、米国におけるスマートスピーカーの普及率は25% という結果も出ています。それに比べると日本はまだまだ普及が少ないですが、市場規模はこれから多くなっていくでしょうね。2018年、日本のスマートスピーカーの売り上げは46億円だと言われています。2025年にはその12.5倍にもなると言われています。

情報革命の主戦場は「デジタルアシスタント」へ

――今後のグローバル市場における音声アシスタントの役割はどのように変化していくのでしょう?

渡辺 : 注目すべきは、音声に限らない「IoT化の流れ」と言えるでしょう。音声は、消費者との接触ポイントとして注目すべきことの1つにすぎません。

シュリラ : そういう意味で言うと、音声アシスタントというよりも「デジタルアシスタント」について考えた方が良いでしょう。今は音声アシスタントが徐々に日常に入り込んでいますが、今後はビジュアル面で、ARやVR、ホログラムなどと連携していくことでしょう。

情報革命の主戦場はPCに始まり、モバイルへと続いてきました。その次に来るのが、デジタルアシスタントだと言われています。2017年に公開された映画『ブレードランナー 2049』では、物語の中で主人公は家庭用AIとともに暮らしていました。これは未来に起こり得ることでしょう。デジタルアシスタントはデバイスの壁を越えて、人とより密に接する存在になっていきます。

――パナソニックはIoT家電に舵を切り、AmazonもAlexa対応家電を増やことに力を入れているように、スマートホームの普及に合わせて、デジタルアシスタントの存在感は増していくことになりそうです

渡辺 : 利用者との接触ポイントが増えると、そこで新たなマーケティングのチャンスが生まれます。今のデジタルアシスタントは受動的にしか動きませんが、今後は能動的になってくるでしょう。例えば、冷蔵庫内にカメラやセンサを入れることによって、飲食料品の減少を検知し、「〇〇が少なくなってるので注文しますか? 」と購買を促したり。

シュリラ : スマートスピーカーの2台巨頭であるGoogle・Amazonは、デジタルアシスタントを、ありとあらゆる場所で使えるようにしようと考えています。例えば、個人の保有するデバイスに限らず、街の中に「スマートバス停」を作ったり、「スマート案内所」を作ったりすることによって、街全体をスマート化しようという動きを始めています。

自分好みにアシスタントをカスタマイズすることもできるようになるでしょう。Googleは今年、歌手のジョン・レジェンドの声をGoogleアシスタントに搭載すると発表しています。これは、想定されるすべての質問に対する返答を録音したわけではなく、いくつかのセリフを録音し、機械学習技術に基づいて、彼のクセや言葉遣いなどを分析して作られたものです。

Googleの発表後、ジョン・レジェンドの妻クリッシー・テイゲンは、「もう人間のジョン・レジェンドは必要ないね」とツイートしていた

デジタルアシスタントは、より人々に受け入れられやすい形に姿を変え、ライフスタイルに寄り添う存在となっていくことでしょう。

企業に求められる「ボイスストラテジー」とは

――私たちの生活はどう変化していき、企業にはどういった取り組みが求められるのでしょう?

シュリラ : マーケティングの観点から言えば、デジタルアシスタントが利用者の好みを深く理解することによって、“利用者にメリットがない広告を排除する”ようになることが考えられます。例えば、「ナイキが大好きな人」にアディダスが広告を打つ際に、アシスタントが「この人はアディダスの靴は履かないから」とブロックするようになるかもしれません。

私たちはGoogleアシスタントやAlexaを用いたマーケティング手法の研究をしていますが、それぞれのアルゴリズムは異なるため、当然アプローチの仕方は変わってきます。これは難しい作業です。しかし、そこで身を引いてしまったら、これからのデジタルアシスタントが普及する時代に取り残されていくことでしょう。将来のビジネスチャンスを見越して、今のうちにテクノロジーにキャッチアップしていくことが求められるのです。

***

現状の利用率は低いが、『ドラえもん』や『鉄腕アトム』を見て育った日本人に、デジタルアシスタントを受け入れる素地がないとは思えない。Googleがアシスタントにジョン・レジェンドの声をあてたように、日本向けにはドラえもんの声でも使ってくれれば、この現状は変わるのかもしれない。呼びかけるときはもちろん、「Hey」や「OK」といった横文字ではなく、「聞いてよドラえも~ん」なんかだと、楽しそうだ。