5月23日から24日にかけて開催された「ガートナー データ&アナリティクス サミット 2017」では、AI(人工知能)も大きなテーマの1つであった。本稿では、ガートナー リサーチ バイスプレジデント アレクサンダー・リンデン氏の講演「人工知能と機械学習における主要なトレンド」で議論された内容についてお届けする。

機械学習・ディープラーニングの仕組み

講演冒頭、リンデン氏は「今起きていることは問題解決のパラダイムシフトだ」と指摘した。従来の問題解決は、「問題を小さく分解して解を出し、それぞれの解を統合して全体の解にする」というものであった。当然だが、このやり方は一部の領域にしか適用できない。ところが、2012年にディープラーニングによって画像認識という難しい問題を解決したことがブレイクスルーとなり、AIは2014年後半から2016年にかけて飛躍的な進歩を遂げた。こうしたAIの現状について、リンデン氏は「コンピュータが目を覚ました」と表現する。

ガートナー リサーチ部門 バイスプレジデント アレクサンダー・リンデン氏

ディープラーニングの基礎となる機械学習の仕組みとは、どのようなものなのか。リンデン氏は「機械学習とは、入力と出力のペアから得られる情報をマッピングし、パターンを特定すること」だと説明する。

例えば、故障予知の場合、入力はセンサーデータで出力は期間あたりの故障発生の有無になるし、顧客の離脱予測の場合は、顧客のプロフィールと行動に関するデータが入力で、解約の可能性が出力になるといった具合だ。機械学習の適用領域はほかにも多いが、データをできるだけ多く集め、機械にパターンを学習させる点は共通する。機械学習で正しい解を得るためのポイントは、「『質問が正しいこと』と『適切なデータを探すこと』の2点」(リンデン氏)だという。

そして、ディープラーニングは、入力と出力の間の中間層を表現し、機械学習をさらに改善する試みである。例えば人間の顔認識では、たくさんの画像を機械に読ませ、画像に顔が含まれるか否かを学習させる。次に顔が含まれる画像について、輪郭の識別、目や鼻などの基本的なパーツの識別といった段階的な探索を経て、最終的には複雑な顔全体の識別まで、総当たり的に演算を繰り返す。

このような複雑な処理には、非常に高い演算能力を持つコンピュータが必要になるため、従来型のソフトウェアエンジニアリングでは難しい。しかし、ディープラーニングのアルゴリズムであれば、比較的早いスピードで「解」を得られる。ディープラーニングが期待されているのはこのためだとリンデン氏は解説した。

ディープラーニングが企業にもたらすベネフィット

では、ディープラーニングが効果を発揮するのはどんな領域だろうか。リンデン氏によれば、「大半のデータ要素が単独では意味を持たない場合」「データソースができるだけ多い場合」「領域の知見がほとんど・まったく利用できない場合」に効果を発揮するという。具体的には、需要予測、不正検知、故障予知の分野だ。

一方、「コンピューティングリソースやコスト節約のため、ディープラーニングを試す前に、もう少し中間層の少ない『浅層学習』を試すほうがよい場合もあるだろう」ともリンデン氏はコメントしていた。

ディープラーニングの優れている点は、非常にリッチなコンテンツを入力でも出力でも利用できるようにしたことだ。従来型のデータサイエンスでは、基本的に表形式のデータしか扱えなかったが、ディープラーニングは、文字列、音声、画像、動画とさまざまな形式のデータを扱えるように進化し、現在も発展を続けている。

画像を扱う例としては、似たような画像を探す「ビジュアル検索」や「画像フィルタリング」、低解像度の画像を鮮明なものにする「超解像」などが挙げられる。また、文字列を扱う代表例は、何と言っても機械翻訳だ。Googleの「Word2Vec」は、単語を数字で表した「ベクトル」に変換する自然言語処理手法であり、単語間の演算ができるようになった結果、翻訳精度が飛躍的に向上した。さらに、音声を扱う例としては「音声認識」や「発話模倣」、テキストから音声への変換を行う「音声合成」といった応用例が紹介された。