NVIDIAは5月15日(米国時間)、「NVIDIA Kepler GPUコンピューティング・アーキテクチャ」を採用した「Tesla GPU」の新ファミリを発表した。同ファミリを適用することで、科学分野や技術分野のハイパフォーマンスコンピューティング(HPC)アプリケーションにおいて、GPUコンピューティングがさらに使いやすくなり、普及が加速すると同社では説明している。

今回発表されたのは「NVIDIA Tesla K10/K20」の2製品。Keplerには、 GPUには、パフォーマンスとエネルギー効率の向上を可能にするNVIDIAの技術がアーキテクチャー・レベルで投入されています。また、幅広い開発者やアプリケーションに使っていただける工夫もなされています。

Keplerでは、性能とエネルギー効率の改善を図るため、GPUの基本構成要素であるSMXストリーミング・マルチプロセッサの設計を根本的に見直しており、その結果、前世代となるFermiのストリーミング・マルチプロセッサと比較して、1Wあたりのパフォーマンスは最大で3倍となり、1PFlopsのコンピューティング・パフォーマンスを発揮するスーパーコンピュータを10ラック分のサーバで構築できるようになったという。また、SMXでは、CUDAアーキテクチャ採用のコア数を4倍に増やすと同時に各コアのクロック・スピードを落とす、アイドル時にはGPUの一部にパワー・ゲーティングを施す、制御ロジックではなく並列処理コアに使用するGPU領域を増やすといった方法も取り入れられており、エネルギー効率の最大化が図られている。

また、GPUスレッドにおいて新しいスレッドを動的に生みだせるようにする技術「Dynamic Parallelism(動的並列処理)」の搭載により、データに対してGPUが動的に対応可能となった。これにより、並列プログラミングが簡単に行えるようになり、適応メッシュ制御、高速マルチポール法、マルチポール法など、よく利用されるアルゴリズムにGPUアクセラレーションを容易に適用できるようになると同社では説明している。

さらに、GPUに搭載されたCUDAアーキテクチャ・コアを複数のCPUコアから同時に利用できるようにする技術「Hyper-Q」も搭載。これにより、GPUの利用率向上とCPUのアイドル時間短縮が可能となり、プログラミングの幅も広がるという。

Tesla K10は、石油・ガスの探査業界や防衛産業における利用に最適化されており、「GK104 Kepler GPU」を2基搭載したTesla K10アクセラレータボード1枚で、合計4.58FLopsの単精度浮動小数点ピーク演算能力と、320GB/秒というメモリ帯域幅を実現することが可能だ。

一方のTesla K20はTesla GPU製品ファミリの新たなフラッグシップ製品となる位置づけで、多くの計算処理を要求するHPC環境用として設計されている。「GK110 Kepler GPU」を採用しており、FermiアーキテクチャベースのTesla製品比で倍精度能力が3倍に強化されたほか、Hyper-QやDynamic Parallelismもサポートしており、発売は2012年第4四半期を予定している。

なお、Tesla K20は米国テネシー州のオークリッジ国立研究所が新たに構築する「Titanスーパーコンピュータ」に搭載される計画であるほか、イリノイ大学アーバナ・シャンペーン校にある米国立スーパーコンピュータ応用研究所の「Blue Watersシステム」にも搭載される予定である。

Kepler K20のダイ写真