パナソニック ホールディングス(HD)は5月23日、AIモデル学習時のデータ構築コストを削減する技術を開発したと発表した。AIによる物体検出の精度低下を抑えながら学習データ構築コストを半減できるという。

画像から人や自動車などを高精度に検出するAIモデルの開発においては大量の学習データが必要だ。しかし、一度開発したAIモデルを撮影機材や時刻・天候などの条件が異なる現場や環境に適用する場合、その都度大量の学習データの撮影・取得とアノテーション(画像内の人、自動車などのラベル付け)を実施する必要がある。

パナソニックHDが今回開発したのは、環境が大きく異なる現場に対しても、従来法より少ない学習データでAIモデルの他現場展開を可能にする「少数のラベル付きデータに対するドメイン適応技術(Few-shot Domain Adaptation)」だ。

あらかじめ公開されている多数のラベル付きデータ(ソースドメインのデータ)で学習したAIモデルの事前知識を、少数の現場データ(ターゲットドメインのデータ)の学習に利用することで、現場データが少数でもAIモデルを学習できる仕組みだという。

加えて、この新技術はドメインギャップ(ソースドメインとターゲットドメインの知識差)の大きい条件下であっても対応可能だ。従来の方法では、例えば、ソースドメインがRGB画像で、ターゲットドメインが遠赤外線画像のようにデータの“見え"が大きく異なる場合、ドメインギャップを埋めることができなかった。

  • 提案手法の構成。(a):同じ種類の物体同士を置き換えることで画像中の物体位置や存在確率なども考慮 (b):敵対的学習により、AIモデルが両ドメイン共通の特徴で画像を認識

    提案手法の構成。(a):同じ種類の物体同士を置き換えることで画像中の物体位置や存在確率なども考慮 (b):敵対的学習により、AIモデルが両ドメイン共通の特徴で画像を認識

そこで同社は、複数の画像を合成するデータ拡張方法の考え方を応用した新たな手法を開発。単純に画像を置き換えるだけではなく、画像に写る物体(自動車や人など)の領域情報を利用して、同じ種類の物体同士を置き換えることで画像中の物体位置や存在確率なども考慮した。加えて、敵対的学習により、AIモデルが両ドメイン共通の特徴で画像を認識できるようにもしたという。

  • 学習データを1/16(上段)、1/64(下段)まで削減した場合の遠赤外線画像での従来法((a),(b))、提案法(c)、正解(d)の検出結果例

    学習データを1/16(上段)、1/64(下段)まで削減した場合の遠赤外線画像での従来法((a),(b))、提案法(c)、正解(d)の検出結果例

これらの技術により、学習データの取得条件をコントロールすることが難しいユースケースでも、短時間・低コストで高精度なAIモデルを提供できるとのこと。例えば導入先ごとにセンシング対象・状況(外観、カメラ位置、照明条件など)が異なる現場系ソリューションの導入期間の短縮や、赤外線カメラなどを用いた屋外/暗所向け認識技術の開発期間の短縮などにつながるとしている。同社は今後もAI技術の研究・開発を進めていく方針だ。