次世代GPU「Pascal」の性能を紹介 - ディープラーニングではMaxwell比で10倍
3つ目のアナウンスは、GPUのロードマップだ。2014年のGTCでは、Maxwellの次がPascal、その次がVoltaということが明らかになり、Pascalについては、3DメモリやNVLink(CPU、GPUを接続するリンク。2014年の時点ではIBMのPowerプロセッサが対応予定となっていた)などを搭載するとしていた。
今回も基本的なロードマップは同じで、Pascalは2016年の投入を予定する。性能はMaxwellの2倍で、NVLinkや3Dメモリ採用という点も変わっていない。ただし、Pascalでは、単精度と倍精度演算を混在した「Mixed Precision」という機能が搭載されるようだ。
具体的には、Pascalは、Maxwellに対して1ワット当たりの演算性能(単精度の行列の積を計算した場合)が2倍、メモリ容量が2.7倍になる。また、精度を混在させた演算では、Pascalが持つ「Mixed Precision」機能により、1ワット当たりMaxwell比で4倍の性能があるという。
さらにディープラーニングで比べればPascalは、Maxwell比で10倍の性能を持つことになるとしている。「10倍」という数字の根拠は、3DメモリとMixed Precisionで5倍程度、さらにNVLinkによるGPU間接続により2倍の性能向上が得られるからとのことである。
車の自動運転システム向けコンピュータ「Drive PX」の開発ボードを提供
最後の製品は、CESでもアナウンスのあったSelf-Driving Car ComputerであるDrive PXという製品についてだ。Drive PXは、Tegra X1を使ったコンピュータボードだが、自動運転自動車向けに開発されている。
こちらも2015年5月から出荷開始で価格は10,000ドル。ただし、これは、自動運転自動車を開発するために開発者が利用する「開発ボード」であり、普通の車につけると自動運転ができるようになるものではない(そういうようなイメージの名前ではあるが)。購入できるのは自動車メーカーや開発組織などに限られる。
このDRIVE PXは、12のカメラ入力(インタフェースはGigabit Multimedia Serial Link:GMSL)やCAN(車載機器用のネットワークの規格)、デバイス接続用のUARTなどのインタフェースを持ち、LVDSによるディスプレイ出力もある。
2つのTegra X1が搭載されているのは、冗長性のためで、処理を分散するのではなく、片方が壊れても動作し続けられるためだという。64bit CPU(Cortex-A53と57を各4コア搭載)で10ギガバイトのメインメモリを搭載していて、128ギガバイトのフラッシュメモリが乗っている。
このDRIVE PXでは、12個の2メガピクセルカメラからの毎秒60フレームの映像を同時処理することが可能だとしている。AlexNet(カナダのトロント大学で開発されたニューラルネットワークシステム)を動作させた場合、6億3000万の接続点で1秒間に1160億接続点分の処理が行えるという。
また、ディープラーニングを使うことで、例えば、歩行者の一部が車の陰に隠れていても認識が可能になり、路肩に止まっている車のドアが開いていれば、その分、自分が走行できる領域が狭くなるといったことも検出できるとの説明もあった。
さて、このように基調講演は、ディープラーニング一色という感じで、2014年までのゲームやグラフィックスが主体だったGTCとは大きく変化した。NVIDIAは、ディープラーニングをGPGPUに最適な応用分野、あるいは「キラーアプリ」ととらえ、これまで続けてきた「車載」や「モバイル」、「科学技術計算」といった製品分野での取り組みをさらに強化することを決めたようだ。