既報の通り、NVIDIAは5月6日(米国時間)に新アーキテクチャ"Pascal"をベースとした、初のコンシューマ向けGPU「NVIDIA GeForce GTX 1080」を発表した。ワールドワイドで27日(日本では深夜)の発売が予定されているが、これに先駆けて仕様する機会を得たので、早速その実力を試してみたい。

NVIDIA GeForce GTX 1080

GeForce GTX 1080のアーキテクチャや新たに追加された機能などは、笠原一輝氏によるレポート記事「新しいメモリ圧縮、Asynchronous ComputeなどGeForce GTX 1080爆速の秘密が明らかに」を参照してほしいのだが、GeForce GTX 1080は"Pascal"ベースのGP104コアを採用したハイエンドGPUだ。

製造プロセスルールは、従来の28nmから16nmへ微細化し、前世代のGeForce GTX 980と比較して、CUDAコアが増加する一方でダイサイズの削減に成功している。内部の構成は複数のCUDAコアをまとめた「Streaming Multiprocessor」(SM)や、さらにSMをまとめた「Graphics Processing Cluster」など、前世代のMaxwellアーキテクチャから大きく変化していない。

左がGeForce GTX 1080で採用するGP104コアで、右がGeForce GTX 980のGM204コア。GPCを構成するSMの数(GP104は5基でGM204は4基)以外はほとんど変わらない

SMの構成。同じく左がGP104で右がGM204。32基のCUDAコアごとにプロセシングブロック(PB)を構成する点や、それぞれにWarpスケジューラと2つのディスパッチユニット(命令発行ユニット)を搭載するところも同じだ

ただし、GeForce GTX 1080(GP104コア)では、動作クロックを大幅に引き上げた。GeForce GTX 980のリファレンスクロックは、ベースが1,126MHz、ブースト時が1,216MHzだが、数多くのOCモデルが登場し、GeForce GTX 980でもベース1,200MHz前後、ブースト時1,300MHz前後までオーバークロックしたグラフィックスカードが投入されていた。

GeForce GTX 1080のリファレンススペックは、これを大きく超え、ベースが1,607MHz、ブーストが1,733MHzに達した。さらに、GeForce GTX 1080も高いOC耐性を備えるとされており、5月6日(米国時間)に行われた発表会では、空冷で2,114MHzまでオーバークロックしたデモが披露された。

また、GeForce GTX 1080ではメモリの強化も大きなポイントだ。従来のGDDR5メモリの改良版で、2倍の転送レートを実現したGDDR5Xメモリを新たにサポートする。グラフィックスの処理においてはかねてより、メモリ帯域がボトルネックになっていた。

GDDR5よりもメモリスピードが速いGDDR5Xを新たにサポートする

これまでNVIDIAは、メモリ圧縮技術を用いることで、メモリの効率を上げ、例えばGeForce GTX 960では、「7Gbpsのメモリインターフェースで、9.3Gbps相当のパフォーマンスが得られる」といった"工夫"を行ってきた。GeForce GTX 1080でサポートするGDDR5Xメモリは、データレートが10Gbps(10GHz相当)になる。これにより、GeForce GTX 1080のメモリバス幅は256bitだが、320GB/秒というメモリ帯域幅を実現する。既存モデルとのスペック比較をまとめたものは以下の通り。

■ 表1 GeForce GTX 1080と既存モデルのスペック比較
製品名 GTX 1080 GTX TITAN X GTX 980 Ti GTX 980
CPUコア GP104 GM200 GM200 GM204
プロセスルール 16nm 28nm 28nm 28nm
CUDAコア数 2,560基 3,072基 2,048基 2,816基
ベースクロック 1,607MHz 1,000MHz 1,000MHz 1,126MHz
ブーストクロック 1,733MHz 1,075MHz 1,075MHz 1,216MHz
メモリ GDDR5X GDDR5 GDDR5 GDDR5
メモリ容量 8GB 12GB 6GB 4GB
メモリバス幅 256bit 384bit 384bit 256bit
メモリスピード 10Gbps 7Gbps 7Gbps 7Gbps
メモリ帯域幅 320GB/秒 336GB/秒 336GB/秒 224GB/秒
TDP 180W 250W 250W 165W
補助電源 8ピン 6ピン+8ピン 6ピン+8ピン 6ピン×2

さらに、GeForce GTX 1080(GP104)はAsynchronous Compute((非同期演算)をに対応するという。Asynchronous Computeは、GPUリソースの割り当てを効率化し、グラフィックス処理とGPGPU処理といった複数の処理を並列に実行する仕組みで、Maxwell世代では対応していなかった。

これまではグラフィックス処理が終わっても、コンピュートの処理に時間がかかっていた場合、グラフィックス処理側に割り当てられたリソースは待機状態になっていたが、Asynchronous Computeへの対応により、待機中のリソースを終わっていない処理の方に動的に割り当てることができる

競合であるAMDのGCNアーキテクチャでは対応しており、これを基にAMDはDirectX 12におけるRadeonの優位性をアピールしていたが、GeForce GTX 1080の登場により、GeForceとRadeonの両方でAsynchronous Computeがサポートされることになる。具体的には実行中の処理に対して割り込みをかけ、別の処理を実行するPreemptionによって実現するという。