富士通研究所は4月16日、少数のデータしか学習に使用できない場合でもディープラーニングによる物体検出を可能とするAI技術を開発したと発表した。
近年、様々な分野でAI による作業の自動化への期待が高まっており、富士通研究所は医療分野において京都大学大学院医学研究科と共同研究を行い、一環としてAIによる腎臓病の診断支援の研究を進めている。
医療現場では、腎生検など腎臓の断片を一部採取して顕微鏡で撮影した画像から血液のろ過機能を担う糸球体という組織の状態や数を確認する検査が、診断に使われている。
しかし、画像を拡大しながら目視で糸球体を探す作業にかかる手間や、専門家でも状態の判断にばらつきがあることが知られており、状態診断や糸球体数のカウントの正確な自動化が求められている。
画像から糸球体候補を自動的に抽出するには、与えられた画像から糸球体の位置を特定する必要があり、そのための手法として、ディープラーニングを使った物体検出がある。
この学習方法には、画像と画像に写っている物体の種類、位置の情報(正解データ)が大量に必要になるが、正解データは専門知識を持つ医師が作成する必要があるため大量に準備することが困難だったという。
今回、少量の正解データ付き画像と大量の正解データのない画像からディープニューラルネットワークの学習を行うことで画像の位置特定を可能とする、半教師あり学習による物体検出技術を開発した。
正解データ付き画像を増やすために、大量の画像に対してニューラルネットワークを用いて物体位置を推定させることで正解データを補う方法が考えられるが、従来技術では少量の正解データで学習したニューラルネットワークに実際の物体位置と、正確に一致する場所を推定させることが困難であるため、不正確な推定によるデータが学習に加わることで、精度が劣化していくという。
そこで、検出用ニューラルネットワークの推定結果を手掛かりに、元の画像を復元させる復元用ニューラルネットワークにより、出力された推定位置がどの程度正しいかを検証する技術を開発。
間違った推定位置から復元された画像は、元画像と一致しないため2つの画像を比較することで、推定位置の正しさを検証でき、推定と復元を大量の画像に対して繰り返し行い、正解データを増やしつつ徐々に正確な推定位置が出力される状態に近づけることで、精度を上げることを可能にした。
京都大学大学院医学研究科との共同研究において、腎生検画像からの糸球体の検出に新技術に適用し、正解データ付き画像50枚のみを用いて学習した従来の物体検出ニューラルネットワークと、正解データのない画像450枚を活用した新技術を比較。
結果として、人間と同等である見逃し率10%以下という条件下で従来の2倍以上である27%の精度を達成した。これは、1画像に平均22個含まれる糸球体に対し、前記の見逃し率で検出するために必要な検討箇所を77個の候補まで絞り込み、後処理のコストが削減されたことになるという。
今後、京都大学大学院医学研究科との共同研究を通じて、糸球体検出を応用した腎臓の定量的な評価手法の実現に向けた研究に取り組む。また、新技術は腎生検画像といった医療などの特定用途向けだけでなく、正解データ付き画像の少ない分野での物体検出に広く応用を可能としている。
例えば、製造ラインの画像を使った異物の検出、インフラ設備の各種センサによる診断画像からの異常カ所の発見、建築図面からの使用部材のリストアップなどへ適用先拡大を想定し、AI技術をAPIとして提供する富士通の「Zinraiプラットフォームサービス」を支える学習モデル構築技術として、2018年度中の導入を目指す方針だ。