富士通は5月9日、テキストや画像、数値などの複数の異なる形式のデータに対し、知識を抽象化して体系化するナレッジグラフとしてAIを用いて自動的に統合し学習することで、大規模データから高精度に原因や内容を判定、推定する説明可能なAI技術を開発したことを発表した。

  • 異なる形式のデータを統合する共通的なグラフ形式へ変換可能

    異なる形式のデータを統合する共通的なグラフ形式へ変換可能

異なる形式のデータを統合し共通のナレッジグラフへ変換して学習する説明可能なAI技術

同社はこの技術の有効性を確認するため、肺がんのタイプ分けや乳がん患者の生存期間予測など医療分野の課題を含む複数のベンチマークで検証したという。その結果、肺がんの主要な2タイプの判別において、病理画像情報にさかのぼってその要因を説明可能とし高精度に判定を支援できることを確認できたとのことだ。

肺がんの治療では腺がんや扁平上皮がんなど肺がんのタイプごとに治療法が確立されつつあり、正確なタイプ分けによる治療が重要となる。今回、肺がん患者の病理画像とゲノム情報(コピー数異常情報)をAIを用いて自動的に統合し、がんのタイプの分けを行った。

その結果、世界で標準的にベンチマークとして使われるThe Cancer Genome Atlasのデータを用いて評価したところ、肺がんのタイプ分けにおいては従来87.1%が最高精度であったのに対し、今回の開発技術では92.1%を達成した。

また、乳がん患者の生存予測の判定においては、患者が治療方法を選択する際に治療ごとの生存期間を正確に予測できれば適切な治療方法を選択できる可能性が高まる。今回、乳がん患者の画像データに加えてRNAデータと診療データをAIを用いて自動的に統合して判断することで、The Cancer Genome Atlasの乳がん患者の生存期間予測タスクにおいて、従来の最高精度が66.8%だったところ、開発技術では71.8%を達成した。

線描画や写真など対象物の描かれ方が全く異なる画像データを統合して学習するAI技術

同社は、絵画や線描画、イラスト、写真など、対象物の描かれ方が異なる画像のデータを統合して学習させることで、高精度に判定する技術も開発している。例えば写真のような新しい入力画像データに対して、対象物に関する適切な判断が可能となる。

この手法では、対象物の描かれ方に特有の特徴量と、対象物の描かれ方に関わらない対象物共通の特徴量を併せて学習する。これにより、学習側データにおいて絵や線描画やイラストなど対象物の描かれ方がさまざまな場合でも、知識を学習して対象物に関する適切な判断を可能としている。