これまで長らく、AIのなかでも使われることの多い機械学習技術について説明してきました。教師あり学習、教師なし学習、強化学習、ディープラーニング、RNN、Encoder-Decoderなどさまざまな技術を取り上げ、その概要は理解いただけたかと思います。今回はそれらの知識を踏まえた上で、再度「AIとは何か」について考えてみましょう。
「どんなデータを学習するか」「何を判定するのか」を想像する
例として、次の2つのAIについて考えてみましょう。
1つは、本連載でもすでに何度か例に挙げたことのある「迷惑メールかどうかを判定するAI」です。メールが届いた際に、そのメールが迷惑メールかどうかを自動で判定し、迷惑メールだと判定したものは自動で迷惑メールフォルダに振り分けます。もう1つは、パン屋さんで見かけることが増えてきた、「トレイに乗せたパンをスキャンし、自動で会計してくれるシステム」です。
この2つのAIには、どちらも機械学習技術が使われています。そして、これまでに学習した機械学習の知識を持っていれば、これらがどんなデータを基に、どのような学習を行っているかを想像できるはずです。以降を読み進める前に、ぜひ一度考えてみてください。
機械学習について考えるときは、とにかく「どんなデータを学習させ、何を判定させたいのか」を想像することが重要です。
まずは迷惑メールの例を考えてみましょう。迷惑メールかどうかの判定をしたいのですから、まず学習用のデータとしては「大量のメール」を準備する必要があります。そして、機械学習技術によって迷惑メールとそうでないメールをコンピュータに学習させ、迷惑メールかどうかの判定が可能なモデルを作成すればよいでしょう。
この場合に使うのは、教師あり学習ができる機械学習です。例えばディープラーニングを用いるのであれば、入力は「迷惑メールの文章」で、出力は「迷惑メールらしさのスコア(場合によっては迷惑メールでないスコアも出力する)」となるでしょう。もちろんディープラーニング以外にもさまざまな手法がありますから、同じデータで別の手法を使って学習しても構いません。同じデータを学習したとしても、どの手法を使ったかによって出来上がるものは異なるので、複数の手法を試して、より精度の高い結果が出た手法を採用するのが一般的です。
次にパンの自動会計システムの例を考えてみましょう。このAIの本質を捉えるためには、まず課題を詳細化し、どこがAIなのかを探す必要があります。パンの自動会計は主に次のような流れで行われます。
- トレイに乗ったパンをレジ上部のカメラでスキャンする
- スキャンした画像から、どのパンがトレイに乗っているかを推定する
- トレイに乗っている全てのパンの価格を算出する
- 全てのパンの価格を合計する
パンの自動会計の流れ |
1~4までの全てのプロセスがAIというわけではありません。どの部分にAIが使われているか、わかりますか?
以前、「AIとは教えた以上のことができるもの」だと説明しました。その観点で考えると、1、3、4はAIではなく、ただ人間に教えられた動作をコンピュータが実行したに過ぎません。一方、2はAIであると考えることができます。そして実際に、2では機械学習技術が用いられています。
このように、一見1つの目的を達成するために開発されたように見えるAI搭載システムも、実は細分化することによって「単純作業」と「AI」に分割することができます。世の中にあるAIと銘打たれた製品やサービスを見るときは必ず、それが本当に1つの作業で出来上がっているものなのかを確認し、必要に応じて細分化して考えてみることが大切です。これにより、どの部分がAIなのかを適切に判断することができます。
それでは、2の作業はどのようなAIによって成り立っているでしょうか。2でやりたいことは、さまざまなパンの画像を見て、それがどんな(名前の)パンなのかを判別することです。すなわち、学習するデータは「大量のパンの写真」だと予測できます。そして、それらのパンの写真には、それぞれ何のパンなのかを記した「正解(名前)のラベル」が付与されている必要があります。
もし、全てのパンが毎日全く同じ焼き色や形で焼き上がるのであれば、機械学習を使う必要はありません。この画像ならこのパン、と決め打ちのルールを書いてやれば良いからです。
しかし、パンはたとえ同じ種類のパンであっても毎日、1つずつ焼き上がりが異なります。異なるパンの焼き上がりを、あらかじめコンピュータに全て教えることは不可能です。しかし、パンの自動会計をするコンピュータは、焼き上がりが異なるパンでも、正確にどのパンなのかを判別しなければいけません。すなわち、パンの判別をするコンピュータは「教えた以上のことができる」必要があるわけです。
例えばメロンパンをコンピュータに教える場合、機械学習であれば焼き上がりが異なるメロンパンの画像を正解のラベルと共に何枚かコンピュータに学習させることにより、これ以外の焼き上がりの時もメロンパンだと判定することができるようになります。ほかのパンに関しても同様です。
焼き上がりが異なるパンの画像を正解のラベルと共にコンピュータに学習させる |
もちろん、焼き上がりが非常に似ているパンがあれば誤認識をすることもあります。そういったときは、学習させるパンの画像を増やしてみると良いでしょう。
世の中には、今回例に挙げたもの以外にもAI搭載をうたった製品がたくさんあります。なかにはAIを名乗っているだけで、実は「教えた以上のこと」はできていないものも少なくありません。これまでに身に付けた知識を持って、身近にあるAI製品/サービスがどんなデータからどのようにして作られたものなのか考えてみてください。今までは気づけなかった、その製品の本質にたどり着けるかもしれません。
著者紹介
株式会社NTTドコモ
R&Dイノベーション本部 サービスイノベーション部
大西可奈子
2012年お茶の水女子大学大学院博士後期課程修了。博士(理学)。同年、NTTドコモに入社。2016年から国立研究開発法人 情報通信研究機構 研究員(出向)。2018年より現職。一貫して自然言語処理、特に対話に関する研究開発に従事。人工知能(主に対話技術)に関する講演や記事執筆も行う。
著書に『いちばんやさしいAI〈人工知能〉超入門』(マイナビ出版)。
twitter:@WHotChocolate