富士通研究所と富士通は9月20日、グラフ構造のデータを学習する富士通研究所独自という人工知能(AI)技術である「Deep Tensor(ディープ テンソル)」と、学術文献など専門的な知識を蓄積したグラフ構造の知識ベース「ナレッジグラフ」を関連付けることにより、大量のデータを学習させたAIの推定結果から推定理由や学術的な根拠を提示する技術を開発したと発表した。2018年度に富士通のAI技術「FUJITSU Human Centric AI Zinrai(ジンライ)」での実用化を予定している。
ディープラーニングなどの機械学習技術では、推定結果を得た理由の人間による検証が困難なため、AIを用いた専門家の判断に関して説明責任が問われる、医療や金融などのミッションクリティカルな領域などへの適用に課題があったという。
新技術により、AIの推定結果に対する理由や根拠として得た学術文献などの専門的な知識を基に、専門家がAIの推定結果が信頼に値するかを確認できるとともに、得た結果を手掛かりに新しい知見を得られるようになるなど、専門家がAIと協調して問題を解決することが可能だという。
同技術では、推定結果に大きく影響した因子(部分グラフ)を特定してナレッジグラフの部分グラフと対応付け、これらをナレッジグラフ上でつなぐ形で、一連の情報を推定根拠として構成。同技術は、「推定因子特定技術」および「根拠構成技術」の2要素で構成されている。
推定因子特定技術に関連して、まずDeep Tensorでは同じデータでも多様な表現方法があるため、学習が困難だったグラフ構造のデータについて、グラフ構造のデータからテンソルという数学表現への変換方法の学習とディープラーニングの学習を同時に行うことで、グラフ構造のデータの高精度な学習を可能にしている。
推定因子特定技術は、個々の入力データについてのディープラーニングの出力結果から逆に探索して、推定結果に大きく影響した複数の因子を入力データの部分グラフとして特定するもの。具体的には、ディープラーニングの入力となるテンソル間の類似性に基づき個別の推定結果の決め手となる要素を抽出し、さらにテンソルからグラフ構造のデータへの逆変換によって、抽出した要素に対応する入力の部分グラフを特定する。
根拠構成技術の前提として、推定に大きく影響した複数の因子は、ナレッジグラフと関連付けることでそれぞれの因子に関連する情報を特定できる。特定した部分からグラフ構造を辿って関連する知識を得られるとのことだが、ナレッジグラフは多様な情報の多様な関連性をグラフ構造で保持しているため、単純にグラフ構造を辿るだけでは推定理由と無関係な情報を関連付けてしまうといった問題があったという。また、複数の推定因子を手掛かりとしてグラフ構造を探索することにより、特定した推定因子に関連性の高い情報だけを抽出し、根拠として構成する。
今回、新技術の効果を測るため、ゲノム医療における専門家の調査作業の効率化を想定した模擬実験として、生物情報学分野における公開データベースや医療文献データベースを用いた学習データとナレッジグラフを利用し、関係性が部分的にしか知られていないような事象に関して裏付けとなる根拠を探し出し、関連付けつことが可能であるという検証を行った。
公開データベースから構築した遺伝子変異と病因性の関係について学習し、推定に影響した因子や根拠について学術論文や関連情報を抽出した結果では、推定対象の遺伝子変異について、推定結果に大きく影響した複数の因子と、ナレッジグラフから取り出した医療文献などによる学術的な裏付けとなる根拠、および疾患の候補を同時に見ることができたという。
今後、医療関連の研究機関の協力を得て、同技術が示す根拠が専門家にとって意味があるか、また十分にわかりやすいかという点の検証をしていく。さらに、金融分野における融資先の自動推定を学習させた場合に規制や規則の知識を用いて推定の妥当性を確認するなど、他分野への応用を計画している。