既報の通り、NVIDIAは5月6日(米国時間)に新アーキテクチャ"Pascal"をベースとした、初のコンシューマ向けGPU「NVIDIA GeForce GTX 1080」を発表した。ワールドワイドで27日(日本では深夜)の発売が予定されているが、これに先駆けて仕様する機会を得たので、早速その実力を試してみたい。
GeForce GTX 1080のアーキテクチャや新たに追加された機能などは、笠原一輝氏によるレポート記事「新しいメモリ圧縮、Asynchronous ComputeなどGeForce GTX 1080爆速の秘密が明らかに」を参照してほしいのだが、GeForce GTX 1080は"Pascal"ベースのGP104コアを採用したハイエンドGPUだ。
製造プロセスルールは、従来の28nmから16nmへ微細化し、前世代のGeForce GTX 980と比較して、CUDAコアが増加する一方でダイサイズの削減に成功している。内部の構成は複数のCUDAコアをまとめた「Streaming Multiprocessor」(SM)や、さらにSMをまとめた「Graphics Processing Cluster」など、前世代のMaxwellアーキテクチャから大きく変化していない。
左がGeForce GTX 1080で採用するGP104コアで、右がGeForce GTX 980のGM204コア。GPCを構成するSMの数(GP104は5基でGM204は4基)以外はほとんど変わらない |
SMの構成。同じく左がGP104で右がGM204。32基のCUDAコアごとにプロセシングブロック(PB)を構成する点や、それぞれにWarpスケジューラと2つのディスパッチユニット(命令発行ユニット)を搭載するところも同じだ |
ただし、GeForce GTX 1080(GP104コア)では、動作クロックを大幅に引き上げた。GeForce GTX 980のリファレンスクロックは、ベースが1,126MHz、ブースト時が1,216MHzだが、数多くのOCモデルが登場し、GeForce GTX 980でもベース1,200MHz前後、ブースト時1,300MHz前後までオーバークロックしたグラフィックスカードが投入されていた。
GeForce GTX 1080のリファレンススペックは、これを大きく超え、ベースが1,607MHz、ブーストが1,733MHzに達した。さらに、GeForce GTX 1080も高いOC耐性を備えるとされており、5月6日(米国時間)に行われた発表会では、空冷で2,114MHzまでオーバークロックしたデモが披露された。
また、GeForce GTX 1080ではメモリの強化も大きなポイントだ。従来のGDDR5メモリの改良版で、2倍の転送レートを実現したGDDR5Xメモリを新たにサポートする。グラフィックスの処理においてはかねてより、メモリ帯域がボトルネックになっていた。
これまでNVIDIAは、メモリ圧縮技術を用いることで、メモリの効率を上げ、例えばGeForce GTX 960では、「7Gbpsのメモリインターフェースで、9.3Gbps相当のパフォーマンスが得られる」といった"工夫"を行ってきた。GeForce GTX 1080でサポートするGDDR5Xメモリは、データレートが10Gbps(10GHz相当)になる。これにより、GeForce GTX 1080のメモリバス幅は256bitだが、320GB/秒というメモリ帯域幅を実現する。既存モデルとのスペック比較をまとめたものは以下の通り。
■ 表1 GeForce GTX 1080と既存モデルのスペック比較 | ||||
---|---|---|---|---|
製品名 | GTX 1080 | GTX TITAN X | GTX 980 Ti | GTX 980 |
CPUコア | GP104 | GM200 | GM200 | GM204 |
プロセスルール | 16nm | 28nm | 28nm | 28nm |
CUDAコア数 | 2,560基 | 3,072基 | 2,048基 | 2,816基 |
ベースクロック | 1,607MHz | 1,000MHz | 1,000MHz | 1,126MHz |
ブーストクロック | 1,733MHz | 1,075MHz | 1,075MHz | 1,216MHz |
メモリ | GDDR5X | GDDR5 | GDDR5 | GDDR5 |
メモリ容量 | 8GB | 12GB | 6GB | 4GB |
メモリバス幅 | 256bit | 384bit | 384bit | 256bit |
メモリスピード | 10Gbps | 7Gbps | 7Gbps | 7Gbps |
メモリ帯域幅 | 320GB/秒 | 336GB/秒 | 336GB/秒 | 224GB/秒 |
TDP | 180W | 250W | 250W | 165W |
補助電源 | 8ピン | 6ピン+8ピン | 6ピン+8ピン | 6ピン×2 |
さらに、GeForce GTX 1080(GP104)はAsynchronous Compute((非同期演算)をに対応するという。Asynchronous Computeは、GPUリソースの割り当てを効率化し、グラフィックス処理とGPGPU処理といった複数の処理を並列に実行する仕組みで、Maxwell世代では対応していなかった。
これまではグラフィックス処理が終わっても、コンピュートの処理に時間がかかっていた場合、グラフィックス処理側に割り当てられたリソースは待機状態になっていたが、Asynchronous Computeへの対応により、待機中のリソースを終わっていない処理の方に動的に割り当てることができる |
競合であるAMDのGCNアーキテクチャでは対応しており、これを基にAMDはDirectX 12におけるRadeonの優位性をアピールしていたが、GeForce GTX 1080の登場により、GeForceとRadeonの両方でAsynchronous Computeがサポートされることになる。具体的には実行中の処理に対して割り込みをかけ、別の処理を実行するPreemptionによって実現するという。