独立行政法人 情報通信研究機構(NICT)は31日、大規模Web情報分析システム「WISDOM X(ウィズダム エックス)」を試験公開した。

「WISDOM X」では、ページ上部の検索ボックスに入力された質問に対し、Web上で公開されている10億以上のページを分析し、入力された質問中の語句やキーワード、質問とほぼ同義な表現などを表示する。

質問は、「なに?(いつ/どこ/だれ)」「なぜ?」「どうなる?」「それなに?」の4つの方式に沿って入力。回答は、例えば「~が心配」や「~が懸念」「~が危ぶまれる」など、異なる表現間の意味の同一性等を考慮して柔軟に抽出され、関連性の高い部分は太字になるなどグラフィカルに表示される。

「なに?」の質問への回答例(質問「キーマカレーに何を入れる?」)

「なぜ?」の質問への回答例(質問「なぜスペースシャトルは退役したのか?」)

「どうなる?」の質問への回答例(質問「地球温暖化が進むとどうなる?」)

「それなに?」の質問への回答例(質問「スマートハウスとは何ですか?」)

特徴として、「東京オリンピックで何を心配すべきか?」「キーマカレーに何を入れる?」「地球温暖化が進むとどうなる?」「なぜ日本はデフレに陥ったのか?」といった自然な質問文が入力できる。また、適切な自然文が思いつかない場合、「スマホ」のように単語だけを入力すると、「スマホで〇〇を解決する」など、システムがその単語に関する質問を提案する。

例えば、「ビッグデータで何を作るか?」といった質問では数百件の回答を表示。回答として「人工知能」「交通情報サービス」といった比較的知られているものから、「人気アニメ」「観光資源」「産業地図」「第4の科学」といった、意外なものも表示する。回答元のページにはリンクが貼られ、ユーザーは該当ページに遷移することも可能。なお、回答結果はWebページからの抽出となるため、正確性が低い情報や意図しない情報なども含む可能性がある。

「WISDOM X」の目的は、幅広い回答による「気付き」をユーザーに与え、日常生活からビジネスまでの広範囲にわたるイノベーションを促すこと。従来の検索エンジンでは、例えば「地球温暖化」のような、影響が多岐にわたる質問の場合、必要な情報を特定するには膨大な量のページを読まなければならなかった。このためNICTでは、多様な答えを持つ疑問に、端的に回答を抽出するシステムを研究開発してきたとする。

「WISDOM X」が分析できるWebページは現在10億ページ超。今後は40億ページまで増加させる予定。なお、システムはデータの更新やアルゴリズムの修正、負荷などで、機能が変更される場合があるという。