国立研究開発法人情報通信研究機構(NICT)は10月3日〜6日、幕張メッセで開催された「CEATEC JAPAN 2017」にて、Web駆動知識提供型音声対話エージェント「WEKDA(ウェクダ)」を展示した。同システムはAI(人工知能)を用いた自然言語処理による対話エージェントで、人と話しているかのような自然な会話を可能にするというもの。
開発メンバーの1人であり、IT Search+でも連載「教えてカナコさん! これならわかるAI入門」を執筆する大西可奈子氏に同システムについて解説してもらった。
混雑するCEATEC会場内でもAI関連の展示は盛況を博していた |
国立研究開発法人 情報通信研究機構 ユニバーサルコミュニケーション研究所 データ駆動知能システム研究センター 専門研究員 大西可奈子氏 |
「雑談」を可能にした対話エージェント
WEKDAは、人工知能と音声で対話できるシステムである。それ自体は珍しいものではない。話しかけると応答するシステムを見たことがある方もいるだろう。だが、多くの場合それらはルールベースで作られており、あらかじめ用意されたいくつかの文の中から選ばれたものが返答されているにすぎない。
それに対し、WEKDAの先進性はリアルタイムで生成される自然なやりとりにある。例えば「煮物が食べたい」とWEKDAに話しかけたとしよう。WEKDAには、それに対する応答分はあらかじめ用意されていない。では、どう返すのか。
「心が踊るよね。焼き魚に玉子に煮物で和風な朝御飯も良し」
実際の人間同士の会話とそう変わらない |
これはもう、立派な雑談になっていると言えるだろう。この応答をリアルタイムで生成できるのがWEKDAの画期的な部分だ。「『煮物』という単語が入っていれば『朝御飯も良し』と返す」といったプログラム、いわゆる”作り込み”は一切なく、WEKDA自身が判断して返答している。よって、開発者が想定していないようなかなりマニアックな内容であっても対応が可能になる。
自然な返答の秘密は「質問生成力」
なぜこうしたクオリティの高い雑談が可能なのか。秘密は同研究所が開発した大規模Web情報分析システム「WISDOM X」との連携にある。
2015年に開発されたWISDOM Xは、40億にも及ぶWebページを解析して質問に答えるシステムだ。WEKDAは自らの知識源として、このWISDOM Xを利用している。
つまり、こういうことだ。
「人間同士の会話で『煮物が食べたい』という言葉に適切な返事をするとき、その裏には無数の前提知識があるという仮説を立てました。まず、『煮物』が何なのかを理解していないといけないのはもちろん、『煮物を食べる状況』はどんなときなのか、『煮物を食べたい』と言うときの人の感情はどうなっているか……などを理解していないと、返答がとんちんかんなものになってしまいます」(大西氏)
一見、単純にも思える「煮物が食べたい」だが、この言葉に対して自然な返答をするためには、実はさまざまな前提知識を持っている必要があり、人間はその知識を無意識に取り出して会話を成立させているというわけだ。
もちろん、AIであるWEKDAにはその前提知識がない。そこで、WEKDAは「煮物が食べたい」を理解するために必要な質問を生成し、WISDOM Xに投げかけるのだ。この質問生成力こそが、WEKDAの真骨頂である。
WEKDAから質問を受け取ったWISDOM Xは、40億ものWebページを解析して作られたデータベースから必要な情報を瞬時に収集し、WEKDAに送り返す。WEKDAはその情報を基に「煮物が食べたい」に最も適した回答を生成するのである。
「人間同士の雑談とは、実際に交わされる言葉の合間に無数の質問と答えがあって成立しているのではないか、というのがWEKDAの基本的な設計思想です」(大西氏)
いろいろな雑談を試してみると……?
試しに、ほかにもいろいろな言葉を投げかけてみた。
「臓器移植って難しいね」という雑談に対しては、「はい。臓器移植で最大の壁となるのが、人体の免疫機構による拒絶反応だ」という言葉が返ってきた。
単に「臓器移植」という言葉の意味をWebで検索して答えるのではなく、「はい」という”同意”を挟んでから、臓器移植に関する話題を広げてくる |
また、「レッドブルが飲みたい」と話しかけると、「最高だね! 最近レッドブルで身体が保たれてる気がするよ」との回答。人間同士であればごく自然な会話だが、AIとしては極めて高度なやりとりだ。
「会話」という最も複雑な機能をAIが手に入れる日も、そう遠くないのかもしれない。