GeForce GTX 280を試す - 新世代Unified Shader搭載のウルトラハイエンド

9000番台に達したNVIDIA GeForceシリーズが命名規則もリフレッシュ。新シリーズ「GTX 200」が発表された。GeForce GTX 200シリーズは、同社第2世代となるユニファイドシェーダを搭載するほか、内部アーキテクチャも細かに変更されている。アーキテクチャの詳細解説は別記事に任せるとして、ここではまずそのパフォーマンスをテストしてみたい。

GeForce GTX 280の仕様を従来シリーズと比較

GPU	GTX 280	GTX 260	9800 GTX	9800 GX2	8800 Ultra
製造プロセス	65nm	65nm	65nm	65nm	90nm
トランジスタ数(billion)	1.4	1.4	0.75	1.5	0.68
GPUコアクロック	602MHz	576MHz	675MHz	600MHz	612MHz
シェーダクロック	1296MHz	1242MHz	1688MHz	1500MHz	1500MHz
シェーダ数	240	192	128	128x2	128
メモリクロック(MHz)	1107(DDR:2214)	999(DDR:1998)	1100(DDR:2200)	1000(DDR:2000)	1080(DDR:2160)
メモリインタフェース(Bit)	512	448	256	256/GPU = 512 Bit	384
メモリ帯域幅(GB/sec)	141.7	111.9	70.4	64/GPU = 128 GB/s	103.7
メモリ容量	1GB	896MB	512MB	512MB/GPU = 1GB	768 MB
ROPユニット数	32	28	16	16/GPU = 32	24
テクスチャ・フィルタリング・ユニット数	80	64	64	64/GPU = 128	64
テクスチャ・フィルレート(billion/sec)	48.2	36.9	43.2	38.4/GPU = 76.8 B/s	39.2

上記の表はGeForce GTX 280を最近のGeForceシリーズ製品と比較したものだ。GeForce GTX 280の製造プロセスはGeForce 9シリーズと同様の65nmでここは共通だ。トランジスタ数は単体のGPUとしてはかなり大規模で、GeForce 9800 GTXの2倍にも近い14億個となっている。そしてシェーダプロセッサ数は240。8基のストリームプロセッサがひとかたまりとなって「Streaming Multiprocessors」を構成し、これが3基まとめてひとつの「Thread Processing Clusters」を構成する。このThread Processing Clusters(TPC)を10基持つのがGeForce GTX 280でSPは240基となり、TPCが8基のものがGeForce GTX 260でSPは192基となる。ちなみに、シェーダを増加させただけでなく、シェーダ自体の性能もGeForce 8/9世代よりも増しているとNVIDIAでは説明している。

基本的にトランジスタ数が増えれば発熱も増加するのだが、その影響なのかコアクロックとシェーダクロックは比較的おとなしい。しかしメモリに関してはシリーズ最速のものを採用している。しかもメモリ接続バス幅が拡大され、512bit接続となっているところがポイントだ。これにより、メモリ帯域幅はGeForce 9800 GTXの2倍となる141.7GB/sec。384bit接続だったGeForce 8800 Ultraなどと比較してみても4割り増しという内容だ。容量も1GBとなる。容量増に関しては、それだけテクスチャを大量に格納できるという側面もあるし、あるいは接続ビット幅を拡大したために仕方ないという見方もできるだろう。