1月22日(現地時間)、米NVIDIAはデスクトップ向けGPUの新モデル「NVIDIA GeForce GTX 960」を発表した。GPUコアに第2世代"Maxwell"アーキテクチャをベースとしたGM206コアを採用するメインストリームモデルだ。早速、「NVIDIA GeForce GTX 960」の試用機を入手することができたので、前世代のメインストリームモデル「NVIDIA GeForce GTX 760」や、競合製品となる「AMD Radeon R9 285」および「AMD Radeon R9 280X」と比較しつつ、パフォーマンスを確認したいと思う。
GeForce GTX 960は、GeForce GTX 980/970と同じ第2世代Maxwellを採用している。GPUコアは新開発のGM206で、CUDAコア数は1,024基、SM(Streaming Multiprocessor)は8基とGeForce GTX 980の半分となっている。
GM206コアのブロックダイアグラム。緑色の四角形がそれぞれがCUDAコア1個を表しており、128基のCUDAコアでSM(Streaming Multiprocessor)を構成。さらにSMの内部は32基のCUDAコアをひとかたまりとして4つのPB(Processing block)に分割されている。GM206はこのSMを8基備えており、計1024個のCUDAコアを搭載している |
GeForce GTX 980/970でも採用されたメモリ圧縮技術により、7Gbpsのメモリインターフェースで、9.3Gbps相当のパフォーマンスが得られるとしている。このほか、「DSR」(Dynamic Super Resolution)や「MFAA」(Multi-Frame sample Anti-Aliasing)などの機能もGeForce GTX 980/970と同様に利用可能だ。
プロセスは前世代から引き続き28nmのまま。アーキテクチャの特徴や、機能については別稿(http://news.mynavi.jp/articles/2014/09/19/maxwell2/)にてお伝えしているので、気になる方は記事内容をご参照いただきたい。
GeForce GTX 980/970のほか、前世代の「GeForce GTX 760」やさらに前の「GeForce GTX 660」とのスペック比較は以下の通り。
■既存モデルとのスペック比較 | |||||
モデル | GeForce GTX 980 | GeForce GTX 970 | GeForce GTX 960 | GeForce GTX 760 | GeForce GTX 660 |
---|---|---|---|---|---|
アーキテクチャ | Maxwell | Kepler | |||
ベースコア | GM204 | GM206 | GK104 | GK106 | |
製造プロセス | 28nm | ||||
トランジスタ数 | 52億個 | 2.94億個 | 35.4億個 | 25.4億個 | |
GPC数 | 4基 | 2基 | 3 or 4基 | 3基 | |
SM数 | 16基 | 13基 | 8基 | 6基 | 5基 |
CUDAコア数 | 2048基 | 1664基 | 1024基 | 1152基 | 960基 |
ROP数 | 64基 | 32基 | 24基 | ||
テクスチャユニット数 | 128基 | 104基 | 64基 | 96基 | 80基 |
GPUベースクロック | 1126MHz | 1050MHz | 1126MHz | 980MHz | 980MHz |
GPUブーストクロック | 1216MHz | 1178MHz | 1178MHz | 1033MHz | 1033MHz |
メモリクロック | 7000MHz | 7000MHz | 7000MHz | 6008MHz | 6008MHz |
メモリタイプ | 4GB GDDR5(256bit接続) | 4GB GDDR5(256bit接続) | 2GB GDDR5(128bit接続) | 3GB GDDR5(384bit接続) | 2GB GDDR5(198bit接続) |
メモリ帯域幅 | 224GB/s | 224GB/s | 112.16GB/s | 192.2GB/s | 144.19GB/s |
TDP | 165W | 145W | 120W | 170W | 140W |
補助電源ピン | 6ピン×2 | 6ピン×1 | 6ピン×2 | 6ピン×1 | |
出力端子 | DL DVI×1、DisplayPort×3、HDMI×1 | DL DVI×2、DisplayPort×1、HDMI×1 |
スペックを見ると、トランジスタ数やGPC数、CUDAコア数にも違いはあるのだが、メモリが気になるポイントだといえそうだ。メモリスピードは7Gbpsだが、バス幅は128bit接続だ。メモリの利用効率が上がったとはいえ、ミドルレンジの製品としては心もとない。この辺りがパフォーマンスに与える影響が気になるところだ。