GPGPUの適用分野はどこまで広がるのか - NEC/NVIDIA GPGPUセミナーが開催

先述の2人のほか、幾つか講演があったが、その中でNVIDIAとNECも講演を行ったので、その内容もレポートしておく。

2015年に5000コア搭載GPUの製造を計画

NVIDIAのタイトルは「超並列マルチコアGPUによるコンピュテーション」というもの。講演者はエヌビディアのソリューションアーキテクトである馬路徹氏である。

グラフィックスのアーキテクチャはトランジスタ数の増加とプログラマビリティの向上に伴い進化してきた。例えば、1995年当時のトランジスタ数は100万だが、現行のGeForce GTX200シリーズの搭載トランジスタ数は14億と、桁が大きく異なる。また、統合型プログラマブル・シェーダエンジンを採用することで、GPUはマルチスレッドを処理する並列マルチコアプロセッサとなり、頂点シェーダやジオメトリ・シェーダ、ピクセル・シェーダは統合型プログラマブル・シェーダエンジン上で実行されることとなる。


NVIDIAのGPUの変遷とアーキテクチャの変化

GPUのプログラマブル・シェーダのコア数も増加の一途を辿っており、TeslaではS1070で960コアに到達している。プログラマブル・シェーダのコア数は今後も増加する方向が予定されており、同社Chief ScientistのBill Dally氏が「2015年には11nmプロセスでGPUを製造し、5000コアを搭載させることで、20TFLOPS超えを狙う」というロードマップを提示している。ただし、半導体製造のロードマップであるITRS(International Technology Roadmap for Semiconductors)では、確かに2007年版ではMPUのphysical gate lengthが2014年に11nmとなっているが、2008年のアップデート版では同項目は2014年に17nm、2015年でも15nmへと緩和されており、2015年で11nmプロセスを実現するというのはやや不透明感がある。

しかし、GPUコンピューティングをHPC分野で活用することで、演算性能が向上することは確かなことであり、それはWindows 7とSnow Leopardの登場により、一般ユーザの分野にも広がる可能性が出てきた。Windows 7ではDirect Computeが、Snow LeopardではOpen CLがそれぞれサポートされる。例えば、Windows 7とGPUコンピューティングを組み合わせると、トランスコード機能を使うことでHDビデオをH.264に短時間でエンコードすることができるようになるほか、GPUコンピューティング対応アプリを活用することで、手ぶれおよびコントラスト不足のビデオ画像をリアルタイム補正できたり、DVDをアップコンバートしてHD画像に高速ですることができるようになる。


Snow LeopardとWindows 7の登場によりGPUコンピューティングをより身近なアプリへと応用するのが容易になる

こうしたGPUコンピューティングのすそ野の拡大に対し、馬路氏は、「NVIDIAとしてもCUDA実装のGPUを1億個以上出荷した実績を背景に、CUDAを基礎に、その上にOpenCLやDirect Compute、FORTANそして将来的にはJavaやPythonを載せることで、幅広い分野に対してGPUコンピューティングの普及を目指したい」と意気込みを見せる。

NVIDIAのGPUとCUDAをベースにOpenCLやDirect Computeなどに対応させ、GPUコンピューティングのアプリの活用につなげる

GPGPUをソリューションとして提供

一方のNECは、GPGPU向けコンパイラの話のほか、自社が提供するGPGPUソリューションの説明を行った。同社が提供するスパコンは、大きくベクトル型の「SX-9」とスカラ型の「LXシリーズ」に分かれる。「各HPC分野のハイエンドの高いメモリバンド幅が求められる分野にはベクトル型、価格を追求する場合にはスカラ型の提供を提案している」(NEC HPC事業部矢崎琢也氏)という。ちなみにSX-9は2003年より出荷を開始、これまで全世界を対象に約300台の受注を受けたという。

NECの提供するスパコンの領域の区分け

GPGPUが搭載されるのはLXシリーズであり、GPUサーバとして、Tesla M1060を2枚搭載可能な1Uシングルサーバタイプと4Uのワークステーション(WS)にTesla C1060を最大4基搭載可能なタイプの2種類が用意されている。このWSタイプのGPUサーバは別売りのラックマウントキットを用いることで、19インチラックにマウントすることも可能である。


LXシリーズの内訳と、GPUサーバの概要

また、このほか、高密度実装サーバに外付けでTesla S1070をつなげるといったカスタムにも対応するほか、GPUスタートアップモデルとして、Express5800/50シリーズをプラットフォームとしてTesla C1060を最大2枚搭載可能(+Quadroの組み合わせ)なワークステーションを2009年秋ころ出荷する計画としている。

GPUサーバのスタートアップモデルの提供を計画するほか、既存サーバモデルとの組み合わせにも対応する

なお、GPUのハードウェアのみの提供のみならず、利用に関するコンサルティングサービスなども並行して行っているほか、実用アプリの移植、最適化なども行うことで「GPUへの最適化を進めることで、GPUコンピューティング市場の拡大を狙う」(同)としており、さまざまなソリューションメニューを用意することで、カスタマの希望するGPUコンピューティングをバックアップしていきたいとしている。

サーバのみの提供ではなく、コンサルティングやチューニングサービスなどを含めたトータルソリューションとしての提供を行う