産業技術総合研究所(産総研)の人工知能研究センターが数年前から研究開発を進め、実用化を目指してきた数式から画像パターンなどを自動生成する大規模画像データセットを基にした画像認識AI(人工知能)の有効性が確認され、「医療分野や交通解析分野、物流分野などでの利用が進み始めている」と、新エネルギー・産業技術総合開発機構(NEDO)のロボット・AI部は解説し、高く評価する。

そうした医療分野や交通解析分野、物流分野などでの画像認識AIが目指す利用開発事例を図1に示す。

  • 医療分野や交通解析分野、物流分野などでの画像認識AIの利用開発事例

    図1 医療分野や交通解析分野、物流分野などでの画像認識AIの利用開発事例 (産総研とNEDOの資料から引用)

従来の画像認識AIは、大量の実画像を画像認識タスクとしてAIに学習させる事前準備が不可欠であり、かつその実画像が何の画像かという“教師ラベル”を付けて学習させるために膨大な手間がかかり、かつそのためのコストがかかるという課題があった(さらに、実画像では個人のプライバシーの有無などの確認も必要となるために、この分もさらにコストがかかった)。

これに対して、人工知能研究センターの片岡裕雄 上級主任研究員(図2)の研究開発グループは、数式を基にした画像認識AIを研究開発し、フラクラル幾何などの数式を基にした幾何図形から画像パターンと教師ラベルを自動作成する手法を確立し、これを利用した画像認識AIの学習に成功し、その実用性を高めてきた。

  • 人工知能研究センターの片岡裕雄 上級主任研究員

    図2 人工知能研究センターの片岡裕雄 上級主任研究員

注1:フラクラル幾何
図形で部分と全体の構造が再帰的に類似するという自己相似性を用いて、比較的単純な数式から複雑な画像パターンをつくり出せる性質。人工知能研究センターは「数式によって複雑形状を見分けるタスクを設定し、画像理解AIを訓練する仕組みを構築した」と、解説する。

人工知能研究センターがまとめた当該画像認識AIの利点を図3に示す。

  • フラクラル幾何による画像データセットと輪郭形状による画像を利用するデータセット

    図3 フラクラル幾何による画像データセットと輪郭形状による画像を利用するデータセット、実画像を基にした画像認識タスクの性能 (産総研とNEDOの資料から引用)

この「フラクラル幾何などの数式を基にした幾何図形から画像パターンと教師ラベルを自動作成する手法を基にする画像認識AI」の技術開発成果は、例えば2022年6月19日から24日までの期間で米国にて開催されたIEEE/CVF(Computer Vision Foundation)が主催する「International Conference on Computer Vision and Pattern Recognition 2022(CVPR 2022)」などで発表され、「この発表は高い学術評価を得た」と、片岡 上級主任研究員は説明する(その後も、研究開発成果を学術論文などで公表し、高い評価を継続して得ている)

片岡 上級主任研究員の研究開発グループはフラクラル幾何による画像データセットと輪郭形状による画像を利用するデータセットを基にした学習済みモデルを用いた画像認識AIでその性能を評価したところ、従来の実画像データセット利用に比べて「フラクラル幾何による画像データセットと輪郭形状による画像を利用するデータセットは、実画像を基にするデータセットより優れた成果を示した」という(図4)。

  • フラクタル幾何や輪郭形状を用いたモデル生成の性能の方が高くなることが確認された

    図4 実画像を用いたモデル生成に比べてもフラクタル幾何や輪郭形状を用いたモデル生成の性能の方が高くなることが確認された

この点でも。フラクラル幾何による画像データセットと輪郭形状による画像を利用するデータセット方法は優位性を示し、実用的と評価されている、

注2:産総研の人工知能研究センターで研究開発を進めている医療分野での研究開発は、TECH+の過去の記事「産総研の人工知能研究センターで研究が進む膀胱内視鏡の画像診断支援技術」を参照