既報のとおり、NVIDIAは1日に組み込み向けモジュール「Jetson TX1」の国内販売を発表した。これに合わせて都内で記者説明会を開催。製品の特徴に加えて、昨今注目が集まるドローンへの採用例などを紹介した。
「Jetson」シリーズは、画像処理のような高いパフォーマンスが要求される組み込みシステム向けのモジュール。2014年に第1世代の「Jetson TK1」を投入。すでにパーソナルロボットやスマート家電、ドローンなどに採用されているという。
今回、国内販売が発表された「Jetson TX1」は第2世代の製品で、50mm×87mmの基板にARM Cortex-A57、Maxwellアーキテクチャをベースとした256基のCUDAコアを搭載し、パフォーマンスが向上。演算性能は「Jetson TK1」のおよそ3倍となる1TFLOPSを実現した。一方で、消費電力はモジュール単体で10Wと低く抑えられている。ギガビット対応有線LANやIEEE802.11ac対応無線LAN、Bluetoothといった通信機能に加え、基板背面に400ピンのSamtecコネクタを備える。
「Jetson TX1」は、モジュール単体のほか、開発ボードやACアダプタ、電源コード、USBケーブル、クイックスタートガイドなどを同梱した開発キットを用意する。開発キットは3月中旬から提供を開始し、法人向けは菱洋エレクトロ、個人向けはオリオスペックが取り扱う。オリオスペックのWebサイトによると、価格は税込93,798円となっている。
自律ロボットの時代の到来
米NVIDIA プロダクト・マネージャー ジェシー・クレイトン氏。ロボットやドローンなど自律機器向けプラットフォームを担当 |
「Jetson TX1」の製品説明を担当した米NVIDIA プロダクト・マネージャー ジェシー・クレイトン氏によると、Jetsonがターゲットとするロボットやドローン、次世代IoTデバイスといった機器では、例えば高所といった危険な場所における検査などでは、人による遠隔操作ではなく、機器自身が物体を識別したり、場所や状況を把握したりといった自律的な動作が求められているとしたうえで、「自律的な動作を求められる基準まで向上させるためには、ディープラーニングの活用が鍵となる」という。
しかし、ディープラーニングでは膨大な演算処理が必要で、組み込み領域、特に比較的小型の機器で実現するためには、いくつかの課題がある。例えばクラウドを使ったソリューションでは、データセンター側で多量のデータを高速に処理できるが、それを機器にフィードバックするには数百msの遅延が発生してしまう。ドローンをはじめとする高速で移動する機器では、わずかな遅延でも障害物にぶつかって、事故が起きる可能性がある。
一方で、機器側によりパフォーマンスが高いシステムを搭載するアプローチもあるが、プロセッサにIntel Core i7を採用する場合、TDPが高く、それに見合った大型の冷却機構やバッテリを搭載しなければならず、機器自体が大型化してしまい現実的ではない。
こうした課題に対応できるのが「Jetson TX1」だとする。1TFLOPSの演算性能を持ちながら、モジュール単体の消費電力は10Wで、機械学習におけるエネルギー効率(image/sec/Watt)はIntel Core i7-6700Kの10倍に達するという。
Jetson TX1でのディープラーニングのイメージ。対象を識別するための学習はワークステーションやスーパーコンピュータ側で行い、そこから構築できたモデルをJetson TX1を搭載した機器側にデプロイし、対象のものが何なのか判別するための「推論」に利用する。機器側で新たな情報を得た際には、改めて学習を行うことで高度な自律的機能を獲得できる |
ディープラーニングには、並列処理が可能なGPUが向いているとよくいわれるが、CPUと比べて大量のデータを高速に処理できる。Jetson TX1とCore i7-6700KではTDPも大きく異なるため、エネルギー効率という観点から見ると差が開く |
また、NVIDIAが提供するディープラーニング用ライブラリ「cuDNN」や、画像処理用のツールキット「VisionWorks」といった開発者用プラットフォームが利用できる点も優位だとアピールする。
CUDA関連をはじめとして、すでに提供されている開発プラットフォームがすぐに使える点がNVIDIAの強みだ。組み込みから車載、PC、サーバといった領域まで同一アーキテクチャで製品を展開するNVIDIAならではといえる |
「Jetson TX1」のパフォーマンスとCUDAのエコシステムが魅力
エンルート 開発部長 イェン・カイ氏 |
説明会には産業用ドローンの開発を行うエンルートの開発部長を務めるイェン・カイ氏も参加。
エンルートでは農業や環境調査、橋梁・高架下の検査といった分野でドローンを活用したソリューションを提供しているが、「Jetson TX1」を使った自律型ドローンのプロトタイプ開発を行っている。
カイ氏は「Jetson TX1は、10Wという消費電力の枠の中でトップクラスの処理性能を持っている点に加えて、開発者にとってはCUDAのエコシステムが利用できる点が魅力」と説明する。Jetson TX1ではデスクトップPC向けGPUとおなじ、MaxwellベースのGPUが搭載されている。デスクトップPCで学習したものをシームレスに組み込み側に導入すること可能で、実際、Jetson TX1の開発キットが届いてから2時間かからずにドローンを動作させることができたという。
さらに、ドローン関係にはおよそ6,000人規模のCUDAエンジニアがおり、そうしたコミュニティの知見を活用することもできるとした。
また、モジュールで提供されていることも点にも触れ、「モジュールでの提供により、基板開発のスピードを短縮できるほか、産業用途で使う場合、砂漠や海といった環境で動作させるため、ほこりや海水などでハードウェアにトラブルが発生することもある。そういった状況でもモジュールごと交換することで次の作業に移ることができる」とその利点を紹介した。
紹介されたデモ動画ではバックグラウンドや建物などをピクセル単位で判別する様子が披露された。カイ氏によると3TB分の動画を基に、学習に要した期間は、GeForce GTX TITANを5基搭載したシステムでおよそ2週間。そこから精度を高めるために学習を繰り返すことを考えるとかなり時間がかかる。モデルの構築にはそれだけ膨大な処理が必要になるということだ |