深層学習向けフレームワークへの最適化も進める

NVIDIAは機械学習や深層学習向けのフレームワークである「TensorFlow」や「Caffe」のデータフローグラフをGPUに最適化するランタイムコンパイラ「TensorRT」の最新版をリリース。これにより、Volta世代では深層学習の"推論"にかかるパフォーマンスを従来比で3.5倍に高速化するという。

深層学習の推論をGPUに最適化するランタイムのTensor RTも、Voltaに最適化

最新版のTensor RTでは、テンソル演算処理における複数の演算をまとめ、さらに同じデータ入力を必要とするものをまとめることで、GPU処理に最適化する

そのスループットは、5,000イメージ/秒を超え、レイテンシは7ms以下と、Intelが年内に市場投入を計画するサーバー向けSkylakeに比べて、15~25倍の性能向上が望めるとアピール。このほかにもVoltaでは「Caffe2」や「Microsoft Cognitive Toolkit」「MXNet」などの深層学習フレームワークをサポートする。

Tensor RTとVoltaアーキテクチャの組み合わせによって、推論にかかるパフォーマンスはPascal世代に比べて3.5倍高速にでき、Intelが年内に市場投入を計画しているサーバー向けSkylakeに比べて、15~25倍の性能向上が望めるとアピール

また、シングルGPU構成のPCでも、クラウド上のハードウェアリソースやソフトウェアスタックを利用することで、AIや深層学習アプリケーションの開発を加速するクラウドサービス「NVIDIA GPU Cloud」のベータテストを7月より開始することもアナウンスした。

深層学習の推論向けにPCI-Express版の薄型Tesla V100もアナウンス。現在、推論向けに使われている500ノードのCPUサーバーを、33ノードのGPUサーバーに置き換えることができると言う

Tesla V100(上段)と、同社がFHHL(Full Hight, Half Length)と呼ぶ、深層学習の推論向け薄型のパッシブ冷却方式のPCI Express版Tesla V100(下段)。その消費電力は、モジュール版が300W、PCI Express版は150W

AIの活用もさらに広がる

いまや、AIはさまざまな分野に活用されるようになってきた。例えば、SAPはスポーツ中継などの映像から、ブランドロゴの表示時間や大きさなどをオブジェクト認識・追跡の技術を利用して検知し、広告効果を測定するアプリケーションなどを提供している。

AIはその裾野を急速に拡大し、数多くのAIスタートアップが登場

SAPは、企業向けサービスにAIを活用し、スポーツ中継などの映像から、ブランドロゴの表示時間や大きさなどをオブジェクト認識・追跡の技術を利用して検知し、広告効果を測定するアプリケーションなどを提供

SAPは、企業向けサービスにAIを活用し、スポーツ中継などの映像から、ブランドロゴの表示時間や大きさなどをオブジェクト認識・追跡の技術を利用して検知し、広告効果を測定するアプリケーションなどを提供

まるでホンモノそっくりのリアリスティックな映像を生み出すレイトレーシング技術においても、深層学習の利用により、サンプル数が少ないとレンダリング時に生じやすくなるノイズを効率的かつ高速に除去する技術を披露した。

レイトレーシングでは、高速にレンダリングするためサンプル数を減らすとノイズが発生しやすくなる。そこで、高速レンダリングを実現しながらすぐれた写実性を可能にするべく、どのエリアがすでにレンダリング済みかをAIが認識することで、より高速なレンダリング&ノイズ除去を可能にする

さらに、フアン氏は、Tesla V100ベースの「DGX-1 with Tesla V100」のAI性能をアピールすべく、2つの銀河が何億年もの間に衝突を繰り返した場合のシミュレーションや、ある写真のスタイルを、ほかの写真にも適用して新しい写真を造り上げるスタイル・トランスファーのデモなどを披露した。

2つの銀河が、数億年の間に衝突を繰り返すことで、どのような形態になるかをシミュレーションにも深層学習が活かされている

東京で開催されたGTC 2016 TOKYOで披露された、AIで映像を有名画家のスタイルに変換するスタイル・トランスファーも進化。ある写真のスタイルを、別の写真に適合して、新しい写真を生み出すデモも披露された

トヨタがDRIVE PX Xavierで自動運転車両を開発へ

また、われわれの身近な生活にもAIは浸透しはじめている。SiriやCortanaといった音声アシスタントはもとより、自動運転や運転アシスタント、都市におけるインテリジェントなセキュリティ、そしてロボットと、その裾野は確実に広がっている。

こうした中、NVIDIAは、トヨタ自動車の自動運転車両の開発にAIドライブプラットフォーム「DRIVE PX Xavier」が採用されたことを発表した。トヨタ自動車が採用を決めたXavierは、ARM CPUと512コアのVolta GPUに加えて、10 TOPSの深層学習アクセラレータ(Deep Learning Accelerator:DLA)を統合することで、わずか30Wで30TOPSの深層学習性能を実現するという。

自動運転の分野でもAIは重要なポジションを占めており、NVIDIAは同市場向けにDRIVE PXを投入している

自動車へのAI利用では、自動運転以外にもさまざまな分野での利用が見込まれている

トヨタ自動車が、同社の自動運転車両にNVIDIAのDRIVE PXを採用することが決まったと発表。試作モデルでは、DRIVE PXの最新版となるXavierが採用される

さらにNVIDIAは、Xavierに搭載されたDLAをオープンソースとして公開することで、他社がDLAを採用したチップや製品を開発できるようにもするとした。このXavier DLAの詳細については、7月に一部パートナーに解禁され、9月には一般に公開される計画だ。

Drive PX Xavierには、ARM CPUとVolta GPUに加え、深層学習アクセラレータのDLA(Deep Learning Accelerator)を統合し、低消費電力でより優れた深層学習性能を実現

NVIDIAは、このDLAをオープンソースとして公開し、他社がDLAを利用したチップやソリューションを開発しやすくすると宣言

ロボット分野にもAIを

NVIDIAはロボット分野にも、これまでの深層学習やAIでの経験を活かし、「ISAAC」と呼ぶロボットシミュレータを発表した。このISAACは、ロボットが動作を学習する過程をシミュレーションすることで、ロボットの開発時間を短縮するというもの。

NVIDIAは、ロボット分野にも積極的に参入

このバックグラウンドには自動運転でAI学習をさせた経験が活かされており、開発者はNVIDIA GPUを搭載したコンピュータで、ロボットに搭載する頭脳となるJetsonの仮想環境を作り、ISAACに目的とする動作を繰り返させ、学習効果を効率よく高めることで、ロボット開発を加速する狙いだ。

自動運転向けのAI学習の経験を活かし、NVIDIA GPUを搭載したPCで、ロボットの学習をシミュレーションすることで、より短期間にロボット開発を実現できるようにする「ISACCロボットシミュレータ」を発表

従来、ロボットの学習では人間が付きっきりで動作を学習させる必要があった

ISSACでは、ロボットの動作をシミュレーションし、一定の成果があがったら、より多くのロボットでシミュレーションを繰り返し、もっとも優れたブレインを選んで、さらに性能を向上させるシミュレーションを繰り返すことで、より短期間にロボット開発ができるようにする

このほかNVIDIAは、自動車開発などをホンモノと見紛うばかりのフォトリアリスティックなレンダリングをVR空間に生成し、複数人で共同作業を行なえるようにするVR環境「Project Holodeck」を発表。

VR共同作業環境となるProject Holodeckは、9月より早期利用ができるようになる予定だ

スウェーデンのスーパーカーメーカーであるケーニグセグ・オートモーティブの最新モデルで、ツインターボV8エンジンと3つの電気モーターを組み合わせたハイブリッドスーパーカーRegeraを、複数のユーザーが体験するデモを披露した。

車体設計図をもとに写実的なレンダリングをされたRegeraは、エンジン内部を覗くことも、それぞれのパーツを見ることも可能

実際の設計データから作られたRegeraは、外観をチェックできるだけでなく、X線モードでエンジンなどの内部構造を確かめたり、実際に車に乗り込んでインテリアをチェックできるなどのインタラクティブ性を持つ。NVIDIAは、この共同VR環境は、2017年から早期利用ができるようになる予定だと言う。

NVIDIAお得意の物理演算も、この共同VR作業環境に採用されており、利用者が車に乗り込み、ハンドルを握ろうとすれば、指がハンドルの裏側に回り込むなどのグラフィックス処理がリアルタイムで適用される

ファン氏のキーノートで紹介された製品やサービスのまとめ。NVIDIAは、AIに革命を起こすべく、さまざまなソリューションを展開。深層学習やAI向けのバックエンドだけでなく、われわれの身近な存在となる製品への技術支援も加速する