科学技術にAIを活用し、研究プロセスを加速化させる「AI for Science」に対する注目が高まっている。そんな中、2024年2月2日、会場とオンラインでのハイブリッド形式で『スーパーコンピュータ「富岳」シンポジウム AI for Science ~変える、変わる 科学技術イノベーション~』が理化学研究所計算科学研究センターの主催で開催された。本シンポジウムでは、AI for Scienceがもたらす価値について、各界の有識者の講演や議論のもと多くの知見が交わされた。

前編では、基調講演の内容をお届けした。後編の本記事では、パネルディスカッションの模様をお送りする。

■登壇頂いたパネリスト

(右から)
・内閣府AI戦略会議委員/東京大学大学院工学系研究科 教授 川原 圭博 氏
・富士通株式会社 執行役員 EVP CSuO/内閣府 総合科学技術・イノベーション会議非常勤議員 梶原 ゆみ子 氏
・理化学研究所 生命機能科学研究センター 副センター長 泰地 真弘人 氏
・理化学研究所 計算科学研究センター センター長 松岡 聡 氏
・理化学研究所 情報統合本部 先端データサイエンスプロジェクト
 医療データ深層学習チーム チームリーダー 清田 純 氏
・マイナビニュース TECH+編集長 小林 行雄 氏(モデレーター)

パネリストそれぞれの立場から見た「AI for Science」

冒頭、小林氏は全員の自己紹介を兼ねて現状と問題提起を促した。

東京大学大学院教授の川原氏は、工学系研究科の電気系工学専攻に所属しAIを研究してきたわけではないが、内閣府のAI戦略会議やJSTのCRDSの特任フェローとして、AIに関する調査に関わる機会があった。ヒアリングで科学者に5~10年の近未来に何が起こるかいう質問を行ったところ「AIを使用したデータ駆動科学でノーベル賞級の発見があるのではないか」と研究者は予感していると紹介した。

今後、サイエンスで幅広くAIが使われるための現状の課題としては、AIを使うための計算資源に加え、過去に扱ったことがないサイズのニューラルネットワークを使いこなせる人材育成がカギになるという。また、基盤モデルの構築に際し、いかに必要なデータをどう集めるか、協力していけるかがポイントであると説明した。

  • 内閣府AI戦略会議委員/東京大学大学院工学系研究科 教授 川原 圭博 氏

2024年4月から開始されるTRIP-AGISの責任者である理化学研究所 生命機能科学研究センターの泰地氏は、AI for Scienceに取り組むきっかけとして「AIの発展で科学全体のやり方を変えるような勢いとなっており、取り組みの必要性を痛感している」と発言した。

  • 理化学研究所 生命機能科学研究センター 副センター長 泰地 真弘人 氏

従来、人間は計算能力こそコンピュータに負けるものの、知識の統合という点では優れていた。しかし、言語モデルの発達によってデータの統合が可能となり、さらに従来シミュレーションが難しかった領域でもAIの発展によってコンピュータで扱える可能性が出てきている。

  • 科学研究において、マルチモーダル基盤モデルを活用することで科学研究を加速できるという

TRIP-AGISプロジェクトの目的は大きく3つある。一つ目は、科学研究向けの生成AIモデルの開発と、生成AIが提案した実験プランを、実際の実験システムやシミュレーションに落とし込むインターフェースを開発し、自動的に研究のループを回すシステムを開発することだ。二つ目は、科学分野向け生成AIモデルの開発だ。理化学研究所が強みを持つライフサイエンスとマテリアルサイエンスの領域を軸に開発を進め、将来的には他の分野にも拡大するという。三番目は革新的な計算基盤の開拓で、これは松岡氏が詳しく語ると振った。

  • TRIP-AGISでは科学研究用基盤モデルと共用基盤の生成、特定化学分野生成AIモデルの構築と革新的な計算基板の開拓が目的となっている

理化学研究所 計算科学研究センターの松岡氏は、HPCがシミュレーションを使わないと解けないような問題を解決したのが本質であるように、AI+HPCを適用してはじめて解決でき、かつ科学問題を解決するのがAI for Scienceの本質だと指摘した。

また、科学は仮説、検証、結果分析の上、新しい仮説を立てるPDCAサイクルを回している。松岡氏はこれがAI for Scienceによって自動化されると期待しており、従来は10~20年かかった研究が1年でできるようになるという。つまり、AI for Scienceに適合できない科学者は取り残され、この危機感からプロジェクトを進めていると語る。

一方で計算科学を行う研究者は、AI for Scienceあるいは高度なシミュレーションも併用する事で、科学研究を加速する手法を一部で実践している。特に「富岳」ユーザーでAI for Scienceを行っていないプロジェクトはないほどだと説明した。

この流れを科学の基盤モデルを作るTRIP-AGISのプロジェクトで加速させている。基盤モデルができてもまずは事前学習であるため、さらなる検証や、科学技術に対するファインチューニングが必要だという。すでに世にあるGPT-4は人間が介在してファインチューニングしていたのに対し、科学向けのモデルは、実験やシミュレーションを通じてファインチューニングができると説明した。

また計算資源に関しては、現在の16万ノードのCPUを持つ「富岳」でもAI for Scienceに対応するには不足しており、TRIP-AGISのための追加システムを「富岳」と密結合する事で対応する。その後、次世代の「富岳ネクスト」を構築することで、世界トップクラスの演算能力とAI学習・推論能力を達成する計画を紹介した。

  • 理化学研究所 計算科学研究センター センター長 松岡 聡 氏

理化学研究所の清田氏は元々心臓外科医だったが、外科医をしていた頃に再生医療が登場し研究を始めたという。その後、スタンフォード大学在籍中に医学・生物学のドメインにおいてもデータドリブンサイエンスが登場し、2017年から理化学研究所でパイロットプログラムとして、医学領域でのデータ駆動型研究をおこなうという事で移籍したと経緯を紹介した。

2020年には日米英の科学者による“2050年までにノーベル賞級の発見を自律的にできるAIを作る”というプロジェクトを始めたが、当時は夢物語過ぎてなかなかスポンサーが現れなかったという。しかし、2022年の11月末にChatGPTが登場したことで、世間の認識が大きく変わったと説明した。

医学・生物学の分野では研究対象が複雑すぎて支配方程式を作ることが極めて困難なため、対象を観察して共通原理を見出すことになる。ただし遺伝子情報の読み取りを例にとっても観察には多くの費用がかかるため、多数のサンプルを用意するわけにはいかない。そこで、仮説を立てて観察する対象を限定し知識を少しずつ増やすのが効率良い。しかし、このプロセスのほとんどは言語ではなく、言語以外の知識や概念をどうやってAIが学ぶかのテクノロジーを開発する必要があったという。

そこで清田氏は、観察して得られたデータを強化学習で解釈して次の実験を自動的に考えるパイロット的な施設を立ち上げた。現在では5回ほど実験を行えば、簡単なタスクならば人間並みの知識を取得するようになっていると成果を示した。

  • 理化学研究所 情報統合本部 先端データサイエンスプロジェクト
    医療データ深層学習チーム チームリーダー 清田 純 氏

富士通の梶原氏は今回のパネリストがアカデミアであることに対し、唯一の産業界のバックグラウンドを有し、内閣府 総合科学技術・イノベーション会議の非常勤議員を務めていると自己紹介。企業の立場としても政府の立場としてもサステナビリティに対して科学技術が果たす役割の重要性を認識しており、これらの問題解決にAIは必須な要素であり、産学官が革新的な取り組みで挑戦する必要があると主張した。

梶原氏は、技術にはよい事も悪い事もあるという理研 五神理事長のイベント冒頭の発言を受けて、AIにも「光と影がある」と表現。生成AIに関する影の部分は社会的に認識されており、社会全体が科学技術の光の部分を享受しつつ、影をどうコントロールしていくかが課題であると提起。産官学が連携しステークホルダーと協力してトラストを構築することが重要だという。

富士通では生成AIのリスクを正確性、公平性、著作権侵害、情報管理、悪用という形で整理しており、社内外にガイドラインとして周知している。AI for Scienceの文脈では、特にハルシネーション(幻覚)、著作権をはじめとする知財権、研究不正・倫理、サイバー攻撃、悪用という点が考慮すべきリスクになると分析。その中で研究者一人一人がどのようにリテラシーを持ち、どのような理念を持つかというマインドセットの変革が求められていると指摘した。さらにデータや研究成果を保護する技術と制度の面も、産官学で対策に取り組まなければいけない要素だという。

  • 富士通株式会社 執行役員 EVP CSuO/内閣府 総合科学技術・イノベーション会議非常勤議員
    梶原 ゆみ子 氏

AI活用の日本の現在地を議論。
サイエンスは遅れ気味だが、計算資源の確保は産官学で対応中?

各自の自己紹介を終えたところで、一つ目のテーマ「AI for Scienceとは何か?」に対して議論が行われた。

川原氏はAIにおける日本の立ち位置について説明した。日本での一般的なAIに対する反応は、ChatGPTに関して歓迎ムードで使いこなしており、AI活用に関しても日々話題が尽きない。対して欧米は必ずしもそうではないと、新技術に対して好意的な日本の文化を評価した。サイエンスの分野で中国や米国が進んでいるのは否定できないが、日本にもAI分野で活躍している方は多く、その存在を政府が認識し応援できている流れがあるという。

泰地氏はGoogle傘下のDeepMindが一歩抜き出ており、AlphaFoldの成功以外にも気象、物性、数学と次々と科学向けのモデルがリリースされている状況を見ると、日本はAI for Scienceの分野で遅れていると発言。

一方、すでに10年ほど前に、AI for Scienceの構想として、泰地氏は生命システム研究センターにおいて「DECODE project」というディープラーニングを使用したプロジェクトを行っていたことを紹介。当時と今回では基盤モデルの可能性が認識されていることが大きな違いだという。TRIP-AGISとしては細胞の遺伝子の発現状態のモデルを作るのが最初のゴールの一つとなっている。理化学研究所がAI for Scienceを推進していく中核になればよいと決意を語った。

松岡氏は科学の中でまんべんなく計算資源が使われることで科学が進化するため、今後AI for Scienceにおける計算資源への投資が必要になると重要性を説いた。今後はロボットを使用する話もあり、清田氏の事例を実験科学へと広げるのが、これから行うプロセスだという考えを示した。

梶原氏は企業としてサイエンスをなぜ行っているのかということと絡めて、AI for Scienceは自分たちの研究領域を加速すること、あるいは新しい研究領域のところに踏み出していくということを意味すると発言。AIが実装される事による社会的な恩恵についての理解が醸成されることが重要だという。また、研究人材だけでなくAIを使いこなす人材も重要で、AIを社会に取り入れていく際の制度面の整備も重要だと指摘した。

清田氏は、若い研究者向けにAIを気軽に使える場を作るのが重要だと発言。今後10年すれば「生成AIネイティブ」な研究者が登場し、若い科学者であればあるほどAI for Scienceに向いているというのを経験的に理解しているという。

一方、今日現在米国以外でGPUをこれだけ使える国はないと指摘。その米国でさえカリフォルニア中の大学で連合を組み計算資源の確保に奔走していることを紹介。日本の研究者は恵まれている環境にあると指摘した。

泰地氏は計算基盤の整備に関しては、産業界でも民間クラウドでGPUを整備しようとする動きがあり、日本でも計算資源を充実させていく動きになっているという。また、TRIP-AGISの中ではGPUの整備に加え、さらに将来のAIに向けたアーキテクチャの探求も併せて進行中であると紹介した。

この点は松岡氏が補足し、TRIP-AGISでは「富岳」に加えて「富岳」の約4倍の8EFLOPSの学習用演算能力のシステムを、2025年の早い時期に導入し「富岳」に密結合すると説明した。将来の「富岳Next」に関してはまだ計画を固めている段階であり、従来型のシミュレーションも「富岳」以上に高速化+AIも世界最高峰クラスにしていく目標を示した。

  • パネルディスカッションの様子

AI for Scienceの社会実装には文系も重要。国際連携でさらなる進化を

続いて、二番目のテーマである「AI for Scienceが生み出すもの」について議論された。

清田氏は「AI for Scienceと言っても、いわゆる理系のサイエンスだけに閉じこもっていてはいけない」と社会実装には文系×AIが重要になると説明。今後は法学×AI、倫理×AIのように両方をわかっている人材が育ち、議論が行われないと社会実装でのボトルネックになると懸念を示した。

松岡氏は、ChatGPTは日本では比較的受け入れられているが、ヨーロッパでは非常に制限的な法律ができていると説明しつつ、ChatGPTは膨大なプロンプトから理論的な検証ができていると補足した。逆に(初期の)AI for Scienceで作られるモデルは十分な検証ができていないため、「有益な道具であると同時に非常に危ない道具」でもあるという。このためにはサイエンスのコミュニティの中で正確性だけではなく、悪用できないようにするための活動も必要になるが、なかなか有用な手法がないと懸念点を示した。

例えば、AI for Scienceによって有用な新物質が発見されたという成果が出ると、社会的に大きなインパクトを与える。しかしそのAI for Scienceの技術が直接社会に出ていくためには、AI研究そのものの進化が必要だと考えを示した。改善は理論だけでは行えないため、世界中の科学コミュニティが参画する必要があると指摘し、「理化学研究所の科学者全員がAI for Scienceをやらなくてはいけない」と松岡氏は強調した。さらに、世界中の科学者が基盤モデルに向き合ってファインチューニングに参加することで、その科学のドメインの知識を生かすような質問がおこなえる。そのため科学のコミュニティがAI for Scienceの本質的な進化をもたらすと主張した。

“総合知”を結集し、科学コミュニティの発展と社会の変革を目指す

モデレーターの小林氏は、最後にまとめとして「AI for Scienceの今後の展望と期待」に対して発言を促した。

泰地氏は「基盤モデルを公開していくのが前提になる」と研究プロジェクトのプロポーザルをどこかで受け付ける仕組みが必要だと考えている。さらにモデルを検証するための国際協力をしていく点を重要視していた。

川原氏は「今の基盤モデルはドメインエキスパートから見ると、粗が見える状態」だと指摘した。そのような懸念を持っているドメインエキスパートがフィードバックすることを期待していた。

松岡氏は「理化学研究所が国際的にスパコンやAI for Scienceのトップの機関から対等なパートナーとして見られているというのは非常に有難い」と語った。そのうえで国際連携は重要であり、新しい科学的な発見や知見によって科学が進歩するということを具体的に示していかなければならないという。

清田氏は「今後〇年でAI for Scienceが実用になるか」という質問を毎回受けるが「人間が博士号を取るまでに28年くらいかかり、我々はこの研究を始めてまだ7年ほどのためもう少し猶予は欲しい」と会場の笑いを誘った。一方でこれを加速するためには、研究にAIやデジタルツインを活用するだけでなく、論文査読者やノーベル選考委員会のデジタルツインのように、評価系もデジタルに持っていく必要性を説いた。「科学は評価まで含めてルールが決まっているため、“きちんと回る”ということを示せれば、サイエンスの枠を超えてインパクトがある」と考えているという。

梶原氏は「イノベーション創出や社会課題の解決に向けて、産学官の知の融合による『総合知』の活用が注目されている。理化学研究所も総合知によってAI for Scienceを推進し、日本の科学コミュニティの発展を通じて社会を変えていくリードをして欲しい」と期待を語った。

スーパーコンピュータ「富岳」シンポジウム
「AI for Science ~変える、変わる 科学技術イノベーション~」レポート
<<(前編)基調講演の模様はこちらから>>

[PR]提供:理化学研究所 計算科学研究センター