国立情報学研究所(NII)は12月18日、記者懇談会を開催し、NII情報学プリンシプル研究系教授の河原林健一氏が「理論研究とビッグデータ&人工知能」をテーマに講演し、日本におけるビッグデータ・AI業界の現状や同氏が研究総括を務める「河原林巨大グラフプロジェクト」について説明した。
冒頭に同氏はビッグデータの出現により「データ量の増大でコンピューターの演算処理が求められる速度に追い付かなくなってきたほか、無人センサーが過剰に情報を集めていることやSNSの出現で、最適な答えを長い時間(1週間~1カ月)で求めることよりも短時間で1%の改良に対する欲求があり、かつダイナミックな変化に追従する必要もある。そこでNIIはデータ量の増大に対し、コンピューター以外にビッグデータに関する理論研究と実用研究を行っている」と語った。
また「情報爆発時代(ビッグデータ処理)を迎え、理論研究者へのニーズの高まりを受け、理論研究の経験を有した意欲的な研究者が実用研究へ参入することで大きな成果を収められつつある。理論の導入による新しい実用手法としては情報爆発を計算理論で制御するほか、検索エンジン、データマイニング手法などがある。GoogleやマイクロソフトといったIT企業は理論分野で常に基礎研究と先端的な研究を行ってきた研究者を抱える勝ち組だ」と理論研究でも特に基礎研究の重要性を説いた。
同氏の説明によると、世界の理論研究の現状はGoogleやAmazon、Facebook、Microsoftなどの巨大IT企業の研究所がスタンフォード大学、マサチューセッツ工科大学といったトップ大学を凌駕しつつあるという。
さらに、コンピューターのハード面の進歩のみではなく、理論研究に基づく改善が実際のサービス改善につながっていることや、世界最先端の研究情報を無償で得られ、研究成果のみならずトップ研究者の知見(失敗や成功も含めたノウハウ)も無償で得られることから、巨大IT企業が基礎研究の重要性を認識しており、研究者が実データにアクセスできることはビッグデータ時代に必要不可欠だとしている。
加えて、人材についてはNASAやMicrosoft Research、Google Researchの研究員のうち3~5割を抱え、数理化学・理論研究とプログラミング能力を駆使し、産業界との密接なつながりを持つインドや、Facebook、Google、AppleをはじめとしたITトップ企業の雇用者は若手が多いことを例に挙げた。
一方、同氏は日本のビッグデータ、AI分野における世界のトップ会議への論文採用数は全体の2~3%程度で特定のワールドクラスの研究者を除くと惨憺たる状況だと指摘。「国内の理論・基礎研究の現状はGoogleやMicrosoft、Amazon、Facebookなどの巨大IT企業の研究所の基礎研究者と差があるほか、基礎研究の重要性が日本企業に認識されているとは言いがたい。今後10年の課題として世界的に評価される基礎研究者で、かつ実社会への問題にも貢献できる人材を多く輩出していくべきだ」と強調。「AI研究の現状として、近年では多くの企業がAIに対する投資を始め、海外の研究機関に多額の資金を投じている一方、日本の研究機関にはあまり投資していないほか、国内市場が大きいため世界的に展開する必要がないため、ますます差がついていく。国内から世界へ研究成果を発信していくことが重要だ」とも述べた
そのような状況を鑑み、河原林氏は科学技術振興機構(JST)の「戦略的創造研究推進事業・総括実施型研究(ERATO)」に採択された巨大なネットワークを膨大な点と辺の接続構造を「巨大グラフ」として表現し、理論計算機科学や離散数学などにおける最先端の数学的理論を駆使してそれを解析する、高速アルゴリズムの開発を目指す「河原林巨大グラフプロジェクト」を立ち上げた。
同プロジェクトでは世界のトップ会議における日本の論文採用数を全体の5~8%に向上させ、理論ベースの研究が世界のトップへ近づく最短距離だということを示し、離散数学、アルゴリズム、機械学習、データマイニング、統計物理学、データベース、最適化といった広範囲にわたる日本のトップ研究を行っている。研究員数は60人程度で半数以上が28~32才の優秀な若手研究者や大学院生で構成している。
同プロジェクトの研究アプローチは難しい研究課題に対し、理論ベースで未来の人材が国際的な研究成果を発揮することを掲げている。そのために必要なこととして河原林氏は「他分野の数学力と日本のスーパーエリートを結集し、1つの課題を追求することや優秀な大学院生を巻き込むことに取り組まなければならない。ビッグデータ・AI時代における5~10年後の達成目標としては日本の論文採用数の向上や5~10人のスーパーエリートを育成し、スーパーエリートの人材育成のエコシステムを軌道に乗せることだ。そして理論分野をほぼ全域カバーする研究組織の構築と総合力の向上が鍵になる」と日本のビッグデータ・AI業界に対して訴えた。