東京医科歯科大学と富士通研究所は11月10日、2020年5月から2023年3月まで実施予定の文部科学省のスーパーコンピュータ「富岳」成果創出加速プログラムで「大規模データ解析と人工知能技術によるがんの起源と多様性の解明」をテーマに、富岳上で発がんに関連している可能性の高い遺伝子間の影響関係を表すネットワークの推定と富士通研究所の説明可能なAI技術「Deep Tensor(ディープ テンソル)」を用いたがんの浸潤や転移との関連を予測する計算を1日以内で実現したという。
同プログラムの目的は、がん細胞やがんに関係する遺伝子などの間の膨大なメカニズムをAIと富岳を用いて解析し、新たながんの治療法の確立に結びつく知見を引き出すこと。
がんのメカニズムの解明に向けて、これまで行ってきたがんの種類別の遺伝子やそれらの変異探しに加え、多種のがん遺伝子と環境、年齢などの要因との関係を探ることが重要な課題となっている。
そのために、個々の細胞解析、約1000カ所にわたるマイクロメートル単位で生体採取した細胞のゲノムシーケンスデータ解析と、遺伝子間の影響関係を表すネットワークなどの説明が可能なDeep Tensorを用いた解析で、新たながんの治療法の確立に結びつく知見を引き出す。
これにより、正常な細胞組織から、どのように遺伝子変異クローンが生じるのか、遺伝子変異とその組み合わせがどのように細胞の形状を決定するのかに加え、その多様性・複雑性のために研究が進んでいないゲノムの構造異常が発がんにどう関わるのかを解明するという。
各者の役割として、東京医科歯科大学は遺伝子データの収集・管理、医科と歯科の臨床に関わる課題設定、AIが提示した知見の解釈と実証を、富士通研究所は富岳へのDeep Tensorの実装とネットワーク構造からの特徴の抽出、大規模データ向けのDeep Tensorの高速化、知見の手がかりを引き出すための説明技術の向上をそれぞれ担った。
これまで、生命科学研究では従来2万個の遺伝子間の影響関係を表すネットワークの推定の計算は大学などで利用可能なスーパーコンピュータを独占的に用いても数か月を要し、かつ独占的に用いること自体が現実的ではないため、実質的に不可能だったという。
しかし今回、遺伝子データの加工プロセスを富岳の高速処理に対応させたほか、高いメモリ性能を引き出す富士通研究所のソフトウェア高速化技術でDeep Tensorの処理速度を向上させたことで、発がんに関連する可能性の高い遺伝子間の影響関係を表すネットワークの推定とがんの浸潤や転移との関連の予測の計算を富岳を用いて1日以内で完了させることに成功した。
今後、両者は実現した富岳による高速シーケンス解析とDeep Tensorを用いたネットワーク解析を、近年発見されたノンコーディングRNA(ゲノムに基づき生成されるRNA(リボ核酸)のうち、タンパク質の設計図とならないRNAの総称)と呼ばれる膨大な遺伝子情報を含めた観測データにも適用していく。また、その解析結果を説明可能なAIで人が理解可能な形に翻訳することで、世界最先端のがん研究の成果を創出していく考えだ。