東芝は5月25日、新規物体の画像を1点登録するだけで、登録型としては最高クラスの精度となる46.0%で検出する画像認識AI「Few-shot物体検出AI」を開発したことを発表した。

詳細は、コンピュータビジョンの国際会議「ICIAP2021」にて発表された。

画像認識AIは、人の行動や周辺環境の認識に必要不可欠な技術として、製造現場における品質・生産性向上、社会インフラの現場における保守点検作業の効率化、物流・流通現場における業務効率化など、多種多様な分野において実用化が進んでいる。

ただし実際の現場では、AI導入時には存在しなかった新しい物体が登場する場面が多くあり、その対応が課題となっている。たとえば、長期間運用中に新規の部品や製品を扱う場合や、別の製品や部品を扱う新設工場に適応する場合、AIが未学習の物体を新たに追加し解析対象とすることが求められる。

新規物体の検出には、通常はAIの再学習(再学習型)が行われる。しかし現場において、大量の画像や映像と正解な情報を用意する必要があることに加え、学習の時間が長くかかってしまう。そのため、頻繁に新規物体が登場するような現場での活用は困難だったとする。一方で、再学習が不要な方式(登録型)を採用すると、実用化レベルの検出精度が実現できないという課題を抱えていた。

そこで今回は、未学習の物体の画像をたった1枚用意し登録するだけで、AIの再学習を行うことなく即座に新規物体の検出を可能にする物体検出AIを開発することにしたという。

通常AIは、対象となる「正解」が付与された物体以外は「背景」として扱い、画像から対象物体が映る領域を物体候補として抽出する深層モデルを学習する。それに対して今回は、付与された「正解」以外の背景として扱っていた物体を含めて、自動的に学習する新たな方式として開発された。

  • 従来の再学習型との学習の違い

    従来の再学習型との学習の違い (出所:東芝Webサイト)

さらに、開発された方式で事前に学習した深層モデルを用いることで、従来であれば背景と認識していた部分からでも自動的に抽出される物体候補と、登録された新規物体とを比較し、画像から新規物体を検出するFew-shot物体検出AIが確立された。同AIを用いることで、新たに検出したい対象の画像1枚を登録するだけで、即座に検出することが可能になるとした。

また、今回開発されたAIと同様に、深層モデルの再学習を必要としない登録型の従来方式の検出精度21.2%と比較して、Few-shot物体検出AIでは検出精度が46.0%へと向上し、再学習不要な登録型において高い精度を達成したとする。

  • Few-shot物体検出AIによる物体検出

    Few-shot物体検出AIによる物体検出 (出所:東芝Webサイト)

Few-shot物体検出AIの開発により、これまで導入が見送られていた現場においても、画像認識AIの導入や運用が容易になるという。デジタルトランスフォーメーション(DX)の推進に貢献し、多種多様な現場での生産性・品質・作業効率の向上が期待できるとする。

同社は今後、Few-shot物体検出AIを早期の社会実装に向けて2023年度中の製品化を目指し、東芝グループの製品およびサービスへ広く活用していくとした。

  • 従来の登録型との認識精度の違いの例

    従来の登録型との認識精度の違いの例 (出所:東芝Webサイト)