深層学習向けフレームワークへの最適化も進める
NVIDIAは機械学習や深層学習向けのフレームワークである「TensorFlow」や「Caffe」のデータフローグラフをGPUに最適化するランタイムコンパイラ「TensorRT」の最新版をリリース。これにより、Volta世代では深層学習の"推論"にかかるパフォーマンスを従来比で3.5倍に高速化するという。
そのスループットは、5,000イメージ/秒を超え、レイテンシは7ms以下と、Intelが年内に市場投入を計画するサーバー向けSkylakeに比べて、15~25倍の性能向上が望めるとアピール。このほかにもVoltaでは「Caffe2」や「Microsoft Cognitive Toolkit」「MXNet」などの深層学習フレームワークをサポートする。
Tensor RTとVoltaアーキテクチャの組み合わせによって、推論にかかるパフォーマンスはPascal世代に比べて3.5倍高速にでき、Intelが年内に市場投入を計画しているサーバー向けSkylakeに比べて、15~25倍の性能向上が望めるとアピール |
また、シングルGPU構成のPCでも、クラウド上のハードウェアリソースやソフトウェアスタックを利用することで、AIや深層学習アプリケーションの開発を加速するクラウドサービス「NVIDIA GPU Cloud」のベータテストを7月より開始することもアナウンスした。
深層学習の推論向けにPCI-Express版の薄型Tesla V100もアナウンス。現在、推論向けに使われている500ノードのCPUサーバーを、33ノードのGPUサーバーに置き換えることができると言う |
Tesla V100(上段)と、同社がFHHL(Full Hight, Half Length)と呼ぶ、深層学習の推論向け薄型のパッシブ冷却方式のPCI Express版Tesla V100(下段)。その消費電力は、モジュール版が300W、PCI Express版は150W |
AIの活用もさらに広がる
いまや、AIはさまざまな分野に活用されるようになってきた。例えば、SAPはスポーツ中継などの映像から、ブランドロゴの表示時間や大きさなどをオブジェクト認識・追跡の技術を利用して検知し、広告効果を測定するアプリケーションなどを提供している。
まるでホンモノそっくりのリアリスティックな映像を生み出すレイトレーシング技術においても、深層学習の利用により、サンプル数が少ないとレンダリング時に生じやすくなるノイズを効率的かつ高速に除去する技術を披露した。
レイトレーシングでは、高速にレンダリングするためサンプル数を減らすとノイズが発生しやすくなる。そこで、高速レンダリングを実現しながらすぐれた写実性を可能にするべく、どのエリアがすでにレンダリング済みかをAIが認識することで、より高速なレンダリング&ノイズ除去を可能にする |
さらに、フアン氏は、Tesla V100ベースの「DGX-1 with Tesla V100」のAI性能をアピールすべく、2つの銀河が何億年もの間に衝突を繰り返した場合のシミュレーションや、ある写真のスタイルを、ほかの写真にも適用して新しい写真を造り上げるスタイル・トランスファーのデモなどを披露した。
東京で開催されたGTC 2016 TOKYOで披露された、AIで映像を有名画家のスタイルに変換するスタイル・トランスファーも進化。ある写真のスタイルを、別の写真に適合して、新しい写真を生み出すデモも披露された |
トヨタがDRIVE PX Xavierで自動運転車両を開発へ
また、われわれの身近な生活にもAIは浸透しはじめている。SiriやCortanaといった音声アシスタントはもとより、自動運転や運転アシスタント、都市におけるインテリジェントなセキュリティ、そしてロボットと、その裾野は確実に広がっている。
こうした中、NVIDIAは、トヨタ自動車の自動運転車両の開発にAIドライブプラットフォーム「DRIVE PX Xavier」が採用されたことを発表した。トヨタ自動車が採用を決めたXavierは、ARM CPUと512コアのVolta GPUに加えて、10 TOPSの深層学習アクセラレータ(Deep Learning Accelerator:DLA)を統合することで、わずか30Wで30TOPSの深層学習性能を実現するという。
さらにNVIDIAは、Xavierに搭載されたDLAをオープンソースとして公開することで、他社がDLAを採用したチップや製品を開発できるようにもするとした。このXavier DLAの詳細については、7月に一部パートナーに解禁され、9月には一般に公開される計画だ。
Drive PX Xavierには、ARM CPUとVolta GPUに加え、深層学習アクセラレータのDLA(Deep Learning Accelerator)を統合し、低消費電力でより優れた深層学習性能を実現 |
ロボット分野にもAIを
NVIDIAはロボット分野にも、これまでの深層学習やAIでの経験を活かし、「ISAAC」と呼ぶロボットシミュレータを発表した。このISAACは、ロボットが動作を学習する過程をシミュレーションすることで、ロボットの開発時間を短縮するというもの。
このバックグラウンドには自動運転でAI学習をさせた経験が活かされており、開発者はNVIDIA GPUを搭載したコンピュータで、ロボットに搭載する頭脳となるJetsonの仮想環境を作り、ISAACに目的とする動作を繰り返させ、学習効果を効率よく高めることで、ロボット開発を加速する狙いだ。
自動運転向けのAI学習の経験を活かし、NVIDIA GPUを搭載したPCで、ロボットの学習をシミュレーションすることで、より短期間にロボット開発を実現できるようにする「ISACCロボットシミュレータ」を発表 |
ISSACでは、ロボットの動作をシミュレーションし、一定の成果があがったら、より多くのロボットでシミュレーションを繰り返し、もっとも優れたブレインを選んで、さらに性能を向上させるシミュレーションを繰り返すことで、より短期間にロボット開発ができるようにする |
このほかNVIDIAは、自動車開発などをホンモノと見紛うばかりのフォトリアリスティックなレンダリングをVR空間に生成し、複数人で共同作業を行なえるようにするVR環境「Project Holodeck」を発表。
スウェーデンのスーパーカーメーカーであるケーニグセグ・オートモーティブの最新モデルで、ツインターボV8エンジンと3つの電気モーターを組み合わせたハイブリッドスーパーカーRegeraを、複数のユーザーが体験するデモを披露した。
実際の設計データから作られたRegeraは、外観をチェックできるだけでなく、X線モードでエンジンなどの内部構造を確かめたり、実際に車に乗り込んでインテリアをチェックできるなどのインタラクティブ性を持つ。NVIDIAは、この共同VR環境は、2017年から早期利用ができるようになる予定だと言う。