今、対話型のAIが加速度的に広がりを見せています。対話AIの代表的なものとしては、AIスピーカが思い浮かびますが、最近では車への搭載も進んでいます。例えば、メルセデス・ベンツは対話型インフォテイメントシステム「MBUX」というAIを搭載すると発表しました。先月TVCMも始まり、豪華声優陣の起用が話題になったので、ご存じの方もいるかもしれません。
対話AIは、「音声で実現しているもの」と「テキストで実現しているもの」の、大きく2種類に分類されます。音声で実現しているものが、先に挙げたAIスピーカや車に搭載されるような対話システムです。こちらは、音声を入力すると音声が返ってきます。
一方、テキストで実現された代表的な対話AIと言えば、Webサイト内から問い合わせが可能なチャットのシステムです。こちらは、テキストを入力すると、テキストで応答が返されます。
メルセデス・ベンツの対話AIは音声で実現するものです。運転中という、どうしても手が離せない状況だからこそ、音声で入力できることが生きてきます。音声で実現する対話AIは、第15回で解説したように、「音声認識システム」「音声合成システム」「対話システム」の3つのシステムから構成されています※1。これを踏まえ、車載向けの対話AIでは何を実現するために、どういうことを行っているのかについて考えてみましょう。
なお、車内では音声認識に特有の困難さがあるのですが、今回はその難しさについては言及しません。
※1 音声認識から音声合成まで、通信せずにオフラインで実行する場合もあります。
対話AIでエアコンの温度調整をするには?
メルセデス・ベンツの対話AIの特徴の1つとして挙げられているのが、エアコンの温度を変えたいときに「エアコンを23度にして」と頼むのではなく、「暑い」というような自然な発話で温度調整ができるという点です。
エアコンの温度調整は、第15回で説明した「タスク指向」型の対話にあたります。つまり、車に「エアコンの温度調整をする」というタスクを実行させたいわけです。
「暑い」という発話に対して「エアコンをちょうど良い温度に変更する」操作を実行する方法を考えるとき、これをまとめてコンピュータにやらせようとすると一気に課題の難易度が上がります。AIを開発する場合、課題ごとにコンピュータが判断しなければならない点は1つにすべきだからです。
「暑い」という発話に対して「エアコンをちょうど良い温度に変更する」操作を実行する際、コンピュータの判断ポイントは2つあります。
【コンピュータの判断ポイント】
1. 「暑い」から、「エアコンの温度を下げる」ことが必要だと判断※2
2. 「エアコンを何度に設定するのが良いのか」を判断
エアコンの温度調整におけるコンピュータの判断ポイントは2つある |
1と2を続けて解決することにより、「暑い」という発話に対して「エアコンをちょうどよい温度に変更する」ことが実現できるのです。課題をここまで細分化できれば、あとは1と2を順番に実現するだけです。
1は、実行すべきタスクが限られた数なのであれば、分類問題として解くことができるでしょう。「ユーザーの入力文」に対して「何のタスクを実行すべきか」を記載した教師データを準備できれば、機械学習によってコンピュータに分類モデルを学習させることができます。
【教師データの例】
入力文 | タスク |
---|---|
寒い | エアコンの温度を上げる |
肌寒いな | エアコンの温度を上げる |
暑い | エアコンの温度を下げる |
汗かいてきた | エアコンの温度を下げる |
暇だ | 音楽をかける |
…… | …… |
一方、2は、簡単にルールを記述しておくことで実現できます。例えば、エアコンの温度を下げる場合は25度までは2度ずつ下げ、24度からは1度ずつ下げる……といったようなルールです。
ここではタスク指向の対話例を示しましたが、私個人としては非タスク指向の対話AIに期待しています。非タスク指向ならば、例えば「暑い」に対してただ温度を調整するだけでなく「夏が近づいてきて、暑い日が増えましたね」というような、何気ない会話を行えるでしょう。コンピュータに仕事をさせることはもちろん有益ですが、ちょっとした会話もできたら楽しいと思いませんか。
メルセデス・ベンツの対話AIもそうですが、音声で行う対話AIは多くの場合、車の中や料理中といったシチュエーションで使われています。AIスピーカを買って、最も利用頻度が高いのはキッチンタイマーとしての用途だという話も聞いたことがあります。確かに、車内やキッチンのように、「手で操作をしづらい状況」は音声による対話AIと非常に相性が良いシチュエーションです。音声による対話AIが広がっていくのは、まずはそうした限定的な空間でしょう。
しかし本来、音声操作は特殊な状況であるかどうかに関わらず、便利でなければならないものです。限られた状況でないと使ってもらえない対話AIは、まだ便利になりきっていないのかもしれません。いつでもどこでも対話AIがユーザーに寄り添える世界が来ることを目指して、私たちは今、ようやく第一歩を踏み出したところなのです。
※2 1では「エアコンの温度を調整する」ことが必要だというところまでの判断とし、温度を上げるか下げるかについては2の判断に委ねるという方法もあります。
著者紹介
株式会社NTTドコモ
R&Dイノベーション本部 サービスイノベーション部
大西可奈子
2012年お茶の水女子大学大学院博士後期課程修了。博士(理学)。同年、NTTドコモに入社。2016年から国立研究開発法人 情報通信研究機構 研究員(出向)。2018年より現職。一貫して自然言語処理、特に対話に関する研究開発に従事。人工知能(主に対話技術)に関する講演や記事執筆も行う。
著書に『いちばんやさしいAI〈人工知能〉超入門』(マイナビ出版)。
twitter:@WHotChocolate