9000番台に達したNVIDIA GeForceシリーズが命名規則もリフレッシュ。新シリーズ「GTX 200」が発表された。GeForce GTX 200シリーズは、同社第2世代となるユニファイドシェーダを搭載するほか、内部アーキテクチャも細かに変更されている。アーキテクチャの詳細解説は別記事に任せるとして、ここではまずそのパフォーマンスをテストしてみたい。
GeForce GTX 280の仕様を従来シリーズと比較
GPU | GTX 280 | GTX 260 | 9800 GTX | 9800 GX2 | 8800 Ultra |
---|---|---|---|---|---|
製造プロセス | 65nm | 65nm | 65nm | 65nm | 90nm |
トランジスタ数(billion) | 1.4 | 1.4 | 0.75 | 1.5 | 0.68 |
GPUコアクロック | 602MHz | 576MHz | 675MHz | 600MHz | 612MHz |
シェーダクロック | 1296MHz | 1242MHz | 1688MHz | 1500MHz | 1500MHz |
シェーダ数 | 240 | 192 | 128 | 128x2 | 128 |
メモリクロック(MHz) | 1107(DDR:2214) | 999(DDR:1998) | 1100(DDR:2200) | 1000(DDR:2000) | 1080(DDR:2160) |
メモリインタフェース(Bit) | 512 | 448 | 256 | 256/GPU = 512 Bit | 384 |
メモリ帯域幅(GB/sec) | 141.7 | 111.9 | 70.4 | 64/GPU = 128 GB/s | 103.7 |
メモリ容量 | 1GB | 896MB | 512MB | 512MB/GPU = 1GB | 768 MB |
ROPユニット数 | 32 | 28 | 16 | 16/GPU = 32 | 24 |
テクスチャ・フィルタリング・ユニット数 | 80 | 64 | 64 | 64/GPU = 128 | 64 |
テクスチャ・フィルレート(billion/sec) | 48.2 | 36.9 | 43.2 | 38.4/GPU = 76.8 B/s | 39.2 |
上記の表はGeForce GTX 280を最近のGeForceシリーズ製品と比較したものだ。GeForce GTX 280の製造プロセスはGeForce 9シリーズと同様の65nmでここは共通だ。トランジスタ数は単体のGPUとしてはかなり大規模で、GeForce 9800 GTXの2倍にも近い14億個となっている。そしてシェーダプロセッサ数は240。8基のストリームプロセッサがひとかたまりとなって「Streaming Multiprocessors」を構成し、これが3基まとめてひとつの「Thread Processing Clusters」を構成する。このThread Processing Clusters(TPC)を10基持つのがGeForce GTX 280でSPは240基となり、TPCが8基のものがGeForce GTX 260でSPは192基となる。ちなみに、シェーダを増加させただけでなく、シェーダ自体の性能もGeForce 8/9世代よりも増しているとNVIDIAでは説明している。
基本的にトランジスタ数が増えれば発熱も増加するのだが、その影響なのかコアクロックとシェーダクロックは比較的おとなしい。しかしメモリに関してはシリーズ最速のものを採用している。しかもメモリ接続バス幅が拡大され、512bit接続となっているところがポイントだ。これにより、メモリ帯域幅はGeForce 9800 GTXの2倍となる141.7GB/sec。384bit接続だったGeForce 8800 Ultraなどと比較してみても4割り増しという内容だ。容量も1GBとなる。容量増に関しては、それだけテクスチャを大量に格納できるという側面もあるし、あるいは接続ビット幅を拡大したために仕方ないという見方もできるだろう。