富士通と東京医科歯科大学(TMDU)は3月7日、富士通が開発した現場のデータから新たな発見の手掛かりを提示する技術「発見するAI」をスーパーコンピュータ(スパコン)「富岳」上に実装し、1000兆通りの可能性があるがん患者の遺伝子の特徴の中から、未知の因果関係を発見することに成功したと発表した。
今回の研究は、2020年5月より開始された、文部科学省のスパコン「富岳」成果創出加速プログラム「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」の一環として実施されたものだという。
がんの分子標的薬は、患者への投与を続けると、その薬剤に対して耐性を獲得したがん細胞が増殖し、再発することがあることが知られているが、こうした複数のドライバー変異を獲得した細胞群が変幻自在に異常な振る舞いをするがん耐性獲得のメカニズム解明には、精緻なデータと解析技術が不可欠とされている。
薬剤開発や既存薬の再配置の臨床治験では、薬剤効果が期待される患者のおおまかな同定が重要だが、個人や臓器における遺伝子やその発現量などにより薬剤効果が異なるため、複数の遺伝子の発現量を組み合わせたパターン数は1000兆通りを超す規模になり、効率性の高い探索技術の開発が求められていた。
富士通の開発技術「発見するAI」は、判断根拠の説明や知識発見が可能なAI技術「WideLearning」を用いて、特徴的な因果関係を持つ条件を網羅的に抽出する技術として開発されたが、同技術であっても、ヒトのおよそ2万個ある遺伝子を対象とした網羅的な探索を通常の計算機で行った場合は、4000年以上かかるという試算が出されたため、処理の高速化が課題となっていた。
そこで富士通とTMDUは、「富岳」上にヒトの全遺伝子を実用的な時間で分析できるよう、条件探索と因果探索を行うアルゴリズムを並列化して実装することで、計算性能を最大限引き出すことにしたとするほか、「発見するAI」を活用し、統計情報に基づき薬剤耐性を生み出す条件となりうる有望な遺伝子の組み合わせを抽出することで、1日以内で網羅的な探索を実現する技術の開発を試みることにしたという。
具体的には、「富岳」上で米Broad Instituteが提供する約600種のさまざまながん細胞株に対する約4500の薬剤の感受性、耐性のデータである「DepMap」の公開データを実行。ヒトの全遺伝子に対して条件と因果関係を1日以内で網羅的に探索し、肺がんの治療薬に耐性を持つ原因となる遺伝子を特定することに成功したとする。
肺がんの治療薬などで用いられる「ゲフィチニブ」は、上皮成長因子(EGF)の刺激を受け取って細胞増殖を活性化するメカニズムであるEGFR経路の活性化を押さえてがんの進行を抑える分子標的薬であり、耐性が発生する現象が知られているが、DepMapのがん細胞株約300種の遺伝子発現量データとゲフィチニブの感受性、耐性データの解析が行われ、ゲフィチニブが効かないがん細胞株の条件とメカニズムの網羅的な探索が実施された結果、3つの転写因子の発現量が低いという条件が探り当てられ、その条件を満たす肺がん細胞株における耐性を生み出す因果のメカニズムが示唆されるに至ったという。
なお、両者は今後、遺伝子の発現量や変異のデータに加え、時間軸や位置データを組み合わせた多層的、総合的な分析を実施し、薬効メカニズムやがんの起源の解明などの重要課題における発見の手掛かりを提示する研究を加速させると同時に、創薬、医学分野における実験研究の現場と連携していくとする。また、TMDUとしては、今回の研究で開発された技術を用いて、がんをはじめとする難病の攻略法の研究を推進していくとしているほか、富士通としては、マーケティングやシステム運用、生産現場において複雑に交錯する因子を発見し、意思決定を支援する取り組みを進めるとしている。