米NVIDIAは3月26日(米国時間)、同社初となるDirectx 11世代のGeForce GPU「GeForce GTX 480」と「同470」を発表した。採用GPUコアは40nmプロセス製造の「GF100」で、これはGPUコンピューティング用途向けに発表済みの「Fermi」アーキテクチャをベースにしたものだ。GeForce GTX 480のリファレンスカードを入手できたので、性能検証をお届けしたい。
まずは現時点で判明しているGF100のスペックを整理しておこう。上位モデルのGTX 480では、SP数が480基、Texture Unit数が60基、ROP数が48基、コアクロックが700MHz、シェーダクロックが1401MHz、メモリタイプはGDDR5で動作クロックは924MHz(データレート3696MHz)、メモリ接続は384bitで容量は1536MBだ。カード単位の最大消費電力は250Wとされ、電源ユニットは容量600W以上の製品の利用が推奨されている。
一方のGTX 470の方は、SP数が448基、Texture Unit数が56基、ROP数が40基、コアクロックが607MHz、シェーダクロックが1215MHz、メモリタイプはGDDR5で動作クロックは837MHz(データレート3348MHz)、メモリ接続は320bitで容量は1280MB、カード単位の最大消費電力は215W。なお、両モデルとも、ビデオエンジンはGeForce GT 240と同世代のVP4が搭載されているとのこと。
GPU | GeForce GTX 480 | GeForce GTX 470 | GeForce GTX 285 |
---|---|---|---|
製造プロセス | 40nm | 55nm | |
CUDA Core(SP) | 480基 | 448基 | 240基 |
Texture Unit | 60基 | 56基 | 80基 |
ROPS | 48基 | 40基 | 32基 |
コアクロック | 700MHz | 607MHz | 648MHz |
シェーダクロック | 1401MHz | 1215MHz | 1476MHz |
メモリ | GDDR5 1536MB 386bit接続 | GDDR5 1280MB 320bit接続 | GDDR3 1024MB 512bit接続 |
メモリクロック(データレート) | 924MHz(3696MHz) | 837MHz(3348MHz) | 1242MHz(2484MHz) |
最大消費電力 | 250W | 215W | 185W |
ここでひとつ気になるのがSP数である。NVIDIAはFermi発表時に、これ(NVIDIAはCUDA Coreと呼ぶ)の数を512基と説明していた。GTX 480で480基なので、32基ほど足らない。下図はGF100コア(Fermi)のブロックダイアグラムで、図中の緑色の「■」1個=SP1基であり、数えてみると計512基分が記載されている。■×32個で1まとめのユニットになっており、そのユニットを4つまとめたひとかたまり(同社はGraphics Processing Clusterと呼んでいるようだ)が、さらに4つという構成になっている。
NVIDIAの説明によれば、Fermiアーキテクチャ自体のキャパシティはSP数が最大512基で変更無いのだが、GTX 480については、この■×32個で1まとめ分=SP32基分のユニット1つが非動作にされており、GTX 470ではさらに■×32個分ユニットが非動作にされている。判断のしようが無いことだが、製造時の歩留まりを上げるためなのかもしれない。前向きに考えれば、さらなる上位製品のためのマーケティング的な性能温存という可能性も考えられるだろう。
さて最後に、グラフィックスカード製品の価格と発売時期について。価格は米国市場における参考価格として、GTX 480が499ドル、GTX 470が349ドルとされている。発売時期はカードベンダ次第の部分もあるので明確ではないが、NVIDIAからの出荷は来週からはじまるそうなので、4月中旬までには店頭入手が可能になるものと見られる。
今回のテスト環境
それでは本題の性能検証に入って行きたい。いつものように各種ベンチマークテストで性能を見ていくが、その前に今回のテスト環境を紹介しておこう。
まずは比較に利用するグラフィックスカードだが、NVIDIA製品では従来のシングルGPU最上位の「GeForce GTX 285」と、デュアルGPU構成でシングル"カード"最上位の「GeForce GTX 295」を用意した。ライバルのAMD(ATI)製品からは、同じくシングルGPU最上位の「Radeon HD 5870」と、デュアルGPU構成でシングル"カード"最上位の「Radeon HD 5970」を用意した。
なお、上記のうちGeForce GTX 285についてのみ、通常のリファレンス仕様のカードが手配できず、BFG Tech製のオーバークロック版カードを用いている。リファレンス仕様でコア/SP/メモリクロックが648/1476/1242MHzのところ、712/1620/1332Mhzで動作するものなので、この後の性能検証でも結果がその分上ブレしていることを留意いただきたい。
ほかGPUドライバなのだが、GTX 480ではテスター用にカードとセットだったGeForce Driver 197.17を使っているが、このドライバではGTX 285/295がうまく動作しないようなので、申し訳ないがGeForce間ではドライバのバージョンを統一することができなかった。
主な環境を以下の表にまとめておく。
GPU | GTX 480 | GTX 285 | GTX 295 | HD 5870 | HD 5970 |
---|---|---|---|---|---|
Driver | GeForce Driver 197.17 | GeForce Driver 196.12 | Catalyst 10.2 | ||
CPU | Intel Core i7-980X Extreme Edition (3.33GHz) | ||||
M/B | Intel DX58SO (Intel X58 Express) | ||||
Memory | GeIL GV36GB1333C9TC (2GB×3 DDR3-1333 CL9-9-9-24) | ||||
HDD | Seagate 7200.11 ST31000333AS (1TB 7,200rpm HDD) | ||||
OS | Windows 7 Ultimate 64bit | ||||
LCD | 日本HP「HP LP3065」(30インチ 2,560×1,600ドット) |