Googleは5月12日(米国時間)、「Research Blog: Announcing SyntaxNet: The World's Most Accurate Parser Goes Open Source」において、自然言語理解(NLU; Natural Language Understanding)を実装するための基板となるニューラルネットワークフレームワーク「SyntaxNet」を公開したと伝えた。機械学習を実現するためのプラットフォームであるTensorFlowが活用されており、最近Googleが積極的に公開を続けている機械学習系技術の最新の成果物の1つと言える。
公開された「SyntaxNet」には英語のテキストを理解するパーサ「Parsey McParseface」が搭載されている。これはGoogleが学習させ機能を強化した英語パーサで、英語テキストを解析する目的で利用できる。「SyntaxNet」にはParsey McParsefaceのように新しいモデルを学習させるために必要となるコードがすでに含まれており、目的に合わせて新しい自然言語の解析用に学習を進めさせることができるとされている。
Parsey McParsefaceでは、英語テキストの構文解析を実施する時に複数のパターンに分解可能なテキストに関してニューラルネットワークを使用した推測を実施するところに特徴がある。人間の理解能力を数値化して指針化することが難しいため、それと比較してどの程度の精度が実現できているかを示すことは難しいとしながらも、Parsey McParsefaceは適切な文法の英語テキストに関しては96%~97%、Webに掲載されているテキストで90%ほどの正確さで分析できるとしている。
ユーザーが求める検索を実現するには、対象となるWebページやデータがどのようなものであるかをより正確に理解する必要がある。「SyntaxNet」はこうした目的を実現するために取り組まれた研究啓発の成果物とされており、今後「SyntaxNet」を使ったほかの自然言語のパーサの実装が期待される。