日本マイクロソフトは5月30日、記者説明会を開催し、R&D部門であるマイクロソフト リサーチ アジア(MSRA:Microsoft Research Asia)の副所長のDr. ミン・ジョウ氏が、同社が取り組んでいるAI研究の最新動向について説明した。同氏はコンピュータ言語/自然言語処理研究の学会「ACL(Association of Computational Linguistics)」の会長を務めており、今回特に自然言語処理研究の最新動向も紹介した。
マイクロソフト リサーチ アジアでは、AIに加えて、「ナチュラルユーザーインタフェース」「マルチメディア」「ビッグデータ/ナレッジマイニング」「クラウド、エッジコンピューティング」「コンピュータサイエンス基盤」の研究が行われている。
ジョウ氏は、マイクロソフト リサーチ アジアのAI研究のうち、飛躍的に進歩している技術として、画像認識、機械言語理解、機械翻訳、光学文字認識(OCR)を挙げた。これらを支えている技術に自然言語処理がある。
画像認識に関しては、152層のニューラルネットワークである「ResNet」(Deep Residual Network)によって、3.57%のエラー率を達成している。ジョウ氏によると、人間のエラー率は5.1%とのことで、ResNetは人間の能力を上回っていることになる。
機械言語理解に関しては、エンド・ツー・エンドのニューラルネットワークモデ「R-NET」を開発、2018年にはStanford Question Answering Database(SQuAD)を用いた質問と回答の完全一致において、82.650のスコアを達成した。ジョウ氏によると、人間のスコアは82.304とのことで、R-NETも人間を上回る能力を実証している。
機械翻訳に関しては、今年の機械翻訳会議(WMT19)で開催されたコンテストで、マイクロソフト リサーチ アジアのチームが19言語のうち8言語で首位を獲得したという。OCRについても、競合に比べて、高い認識率を達成している。
こうした技術は、Windows 10、Skype、Cortana、Microsoft Office、Microsoft Azur、Xboxなど、さまざまな同社の製品に生かされている。
続いてジョウ氏は、自然言語処理には、統計的手法による処理とニューラルネットワークによる処理があるが、同社は両方を提供していると説明した。マイクロソフト リサーチ アジアの自然言語処理が貢献している製品として、IME、Bing Dictionary、オンライン翻訳、手話、会話ボット、詩や音楽の創作を紹介した。
会話ボットはXioIceというフレームワークをベースに開発されている。日本では「りんな」が展開されているが、中国、米国、インド、インドネシアでもローカルの会話ボットが展開されている。ジョウ氏は「会話ボットは、質問に答えるだけではない。友達のような対話、エモーショナルなやり取りを行う」と述べた。
ジョウ氏は、機械翻訳を行うにあたり、利用している人が少ない「希少言語」は使えるリソースが少ないため、同社では3つのテクノロジーを使っていると説明した。
加えて、日本語は「英語と語順が異なる」「柔軟である」「敬語がある」「機能語がある」といった要素から、コンピュータは複雑な処理を行わなければならず、日本語の翻訳は難しいことも紹介された。
なお、マイクロソフト リサーチ アジアでは人材を育成するため、学術連携、イベント、フェローシップ、インターンなどのさまざまなプログラムを提供している。
例えば、インターンについては、年間に10人ほど日本の博士課程の学生も参加しており、3カ月北京に滞在できるという。
ジョウ氏は「自然言語処理は新たなステージ、オープンな時代に入ってきた。われわれはあらゆる企業が自然言語処理を使えるよう、イノベーションをつくっていく」と語っていた。