ディープラーニング技術が世の中で爆発的な関心を集めてから数年が経過した。当時と比べると、予想通りになったこと、予想通りにならなかったこと、分野によっても業種によっても様々な見方がある。そんな中で、我々マシンビジョンの世界においても、霧がだいぶ晴れて、現実の世界が見えてきた、そんな風に感じている。今回は、2021年2月時点での、マシンビジョン業界におけるディープラーニングの現状を共有し、今後どんな成長を遂げていくのか考えていきたい。

まずは、ディープラーニングの未来像とは何だったのか、ここから整理していきたい。ディープラーニングの理想系は、「2、3枚の画像でトレーニング完了」、ということであった。しかしマシンビジョンの市場においては、その理想系はかなり未来の話であることがわかった。それでも、ディープラーニングの技術を何とか工夫して現場に適応しようと苦労を重ねてきた数年だったのではないだろうか。最新の論文を調べて、それを実装して、改良して、なんとか目的を実現しようと、皆さん取り組まれたことと思う。

  • マシンビジョン向けディープラーニング技術

最近我々が気づき始めたことは、ネットワークアーキテクチャ単体で目的を達成できるケースが少ないということである。もちろんアプリケーションによってはアーキテクチャ単体で解決できることもあるが、大部分のアプリケーションは一筋縄に行かないことが多いことを理解した。その背景として、ディープラーニングには制約が多いことである。例えば、そもそもNG画像をたくさん準備することができない、欠陥箇所を教示するアノテーション作業が大変、欠陥と判断した根拠が説明できないので受け入れてもらえない、などなど。こういった制約を乗り越えるには、ネットワークアーキテクチャ自体の進化ももちろんであるが、それに付随する様々な付加機能を発展させる必要が認められるようになってきた。

  • マシンビジョン向けディープラーニング技術

例えば、NG画像を準備できないとなれば、OK画像だけでトレーニングを完成させるAnomaly Detectionという機能を準備しなければならず、それはネットワークアーキテクチャ自体の技術とは違うレイヤーである。

Anomaly Detectionは内部的に既存のルールベースの技術が活用されている。欠陥と判断した根拠が説明できないという点では、その解決の手段としてヒートマップによって欠陥位置を視覚表示するという機能があるが、それもネットワークアーキテクチャ自体の技術ではない。トレーニング精度を上げるために画像データを水増しするGANという技術も、ネットワークアーキテクチャとは違うレイヤーの技術になる。何が言いたいかというと、マシンビジョンの市場においてディープラーニングを適応するには、我々でいう第2階層の技術も充実させていく必要があり、その第2階層は、学術界で発表される新たな技術ももちろん重要であるが、そうではなくルールベースとの融合した技術であるということである。

  • マシンビジョン向けディープラーニング技術

それに早い段階から気づき始めた我々の顧客は、HALCONを用いてディープラーニングとルールベースを組み合わせて、様々な新しい付加価値を生み始めている。それを我々は第3階層と呼んでいる。

例えば、先ほど説明したNG画像のトレーニングが不要なAnomaly Detectionという機能は、言い方を変えると、OK画像に対して突発的な欠陥を検出するのに優れているということである。ただし、もしNG画像も十分に準備できるのであれば、通常の分類を用いてOKとNGを登録した方が精度は上がる。その2つを組み合わせる事例が以下に示すものである。OKとNGを精度よく分類するものの、いざという突発的な欠陥に対してもAnomaly Detectionでさらに排除するというものである。

  • マシンビジョン向けディープラーニング技術
  • マシンビジョン向けディープラーニング技術

このような事例は、第3階層を充実させることに意識を向けることで成し得た付加価値である。最近のユーザ様の動向として、ネットワークアーキテクチャ自体(第1階層)およびその付加機能(第2階層)の開発は汎用のライブラリを使うことにする、第3階層こそ装置メーカとしてSIとして力を注ぐところだろうという考えに至る方々が増えた。

  • マシンビジョン向けディープラーニング技術

第1階層・第2階層を自ら開発されてきた方々から聞かれるようになった言葉が、「この数年間、手段が目的化してしまっていた」ということである。

例えば、最終的に計測を行いたいという目的であったとしても、なんとかすべてをアーキテクチャで解決しようとするのがAI技術者の「本能」であり「満足」である、というのである。つまり、先ほどの図にあった目的に到達することが本来の装置メーカーの目的であるにもかかわらず、Tensorflowを準備して、MATLABを準備して、第1階層から第2階層まですべてのパーツがそろっていないので、その開発を一つひとつやっていた、つまり手段が目的になってしまうのである。

  • マシンビジョン向けディープラーニング技術

同様の意味なのだが少し見方を変えてみると、下図に示されるように、マシンビジョンにおけるディープラーニングとは、立派な1つのツールというより、ツールセットをいかにたくさん用意しているか、という点が重要になる。左のように立派なツールを1つ持っていればいいというものではなく、右のようにたくさんのツールを組み合わせてこそ目的に到達できると考える。

実はこの図は、MVTec社が20年近く前にHALCONのルールベースの機能に関して、HALCONを概念的に説明する際に利用していたものである。20年前にルールベースの画像処理が注目されたとき、多くの方々は画像処理=ブロブ解析、画像処理=正規化相関、といった単一機能だと思い込み、自社開発に取り組まれた方々が多くいた。しかし、20年経過した今としては、HALCONのようなツールセットを利用されるケースがメジャーとなった。実は我々も最近になって気付いたことであるが、ディープラーニングも同じ道をたどっていると感じる。素晴らしいネットワークアーキテクチャを作ればすべて解決と思っていたのが、そうではなくて第2階層でやるべきことがまだまだたくさんあり、その上に第3階層を構築してようやく目的が達成されるのである。

  • マシンビジョン向けディープラーニング技術

ディープラーニングとルールベースを、データタイプやデータ構造を完全に統一した環境(プラットフォーム)で開発できるのがHALCONという製品である。OpenCVとTensorflowを組み合わせて利用する際に、データタイプ変換など苦労されている方々も多いだろう。

  • マシンビジョン向けディープラーニング技術

ここでMVTecのミッションについて触れておきたい。MVTecは「学術界と産業界をつなぐ架け橋」であると、創業以来一貫して役割を担ってきた。MVTecのリサーチグループは学術界の論文を徹底して調査し、それがいかに産業界のマシンビジョンに活用できるかを検討し、最適なツールセットとして実装し、標準製品として産業界にお届けする。ディープラーニングにおいてもそれは変わらない。

  • マシンビジョン向けディープラーニング技術

そして忘れてならないのは、第0階層である。OS・CPU・GPUといった環境の変化に、常にソフトを更新し続けなければならない。MVTecは「学術界と産業界をつなぐ架け橋」として常に新しい橋を立てながら、10年以上にわたってそれらの橋をメンテナンスし続ける存在なのである。さらには、最近ではGPUに加えて、Intelから新たに「AI Tensor ブロック」といった回路もリリースされたが、そういった新たなハードウエアのアーキテクチャへの対応も多くの労力を要する。

  • マシンビジョン向けディープラーニング技術

フルスクラッチで特定の目的に向けてアルゴリズムを開発するのも1つの手段であり、それによって目的を実現されている方もいる。しかし、目的が少し変わると、また最初から作り直しになることは大いにあり得る。こういった作り直しが何度何度も発生しないように、ソフト構造を階層化させ、低階層は汎用のツールを利用する、というのが好ましいのではと我々は考える。

  • マシンビジョン向けディープラーニング技術

これまで多くの企業がマシンビジョン向けディープラーニング技術に投資をした。たくさんのAIベンチャー企業が誕生し、多くの大企業も新規事業を立ち上げた。そして、彼らがマシンビジョン市場を席巻するのではという危惧を我々が持ったのも確かである。しかし、あくまでも2021年2月の現時点において、そしてマシンビジョン市場に限った考え方として、ディープラーニングは「破壊的イノベーション」ではなく、「継続的イノベーション」であったと考えている。だからこそ、HALCONのようなルールベースのライブラリが、確実にディープラーニングの進化に合わせて機能アップを果たすことが求められる。

  • マシンビジョン向けディープラーニング技術

もちろん、冒頭に話をした「2、3枚の画像でトレーニング完了」という時代が到来したら、それは間違いなく「破壊的イノベーション」であり、我々のようなルールベースの企業は一瞬で吹き飛ぶであろう。そして、この市場はGoogleやAmazonが標準ツールとして選ばれるようになるだろう。ただ、それにはまだまだ多くの時間を要すると考える。

最後に、今回のタイトルである「ディープラーニングの限界を“今”超えるには」という問いに対しての答えは、「合わせ技で目的を解決する」である。アーキテクチャ単体でトライしたが目的を実現できなかったとしても、ルールベースとディープラーニングの合わせ技でトライを重ねてほしい。それが第3階層であり、それが装置メーカとして、システムインテグレータとしての付加価値になると信じている。次回で、その第3階層の合わせ技を、生産現場で実際に利用されている具体的な事例を用いて紹介したい。

著者紹介

村上慶(むらかみ けい)
株式会社リンクス 代表取締役

村上慶 リンクス代表取締役

1996年4月、筑波大学入学後、在学中の1999年4月、オーストラリアのウロンゴン(Wollongong)大学に国費留学、工学部にてコンピュータ・サイエンスを学ぶ。2001年3月、筑波大学第三学群工学システム学類を卒業後、同年4月、株式会社リンクスに入社。主に自動車、航空宇宙の分野における高速フィードバック制御の開発支援ツールであるdSPACE(ディースペース、ドイツ)社製品の国内普及に従事し、国内におけるトップシェア製品となる。2003年、同社取締役、2005年7月、同社代表取締役に就任。


同社代表取締役に就任後は、画像処理ソフトウェアHALCON(ハルコン、ドイツ)を国内シェアトップに成長させ、産業用カメラの世界的なリーディングカンパニーであるBasler(バスラー、ドイツ)社と日本国内における総代理店契約を締結するなど、高度な技術レベルと高品質なサービスをバックボーンとした技術商社として確固たる地位を築く。また、ソフトウェアPLCをはじめとする制御システムやエンベデッド・ビジョン、ロボットソリューション分野の製品を積極的に市場に投入し、IIoTの実現をリードする技術商社としてのポジションの確立を図っている。


1977年10月19日 大阪府生まれ

(2020年7月現在)