半導体制御の改良で、さらなる省電力化を実現

AMDでは、すでに今後のCPU製造やGPU製造において、カスタムプロセス技術を採用しない方針を打ち出している。つまり、TSMCやGLOBAL FOUNDRIES/SAMSUNG連合の汎用プロセスを使って、より高性能な製品を投入していくということだ。そこで、Polaris世代では、GLOBAL FOUNDRIESの14nm FinFETプロセスで、最大限の性能と省電力性を実現するために、さまざまな技術的アプローチが採られている。

14nm FinFETへの最適化について説明するSam Naffziger氏(Senior Fellow)

14nm FinFETプロセスではリーク電流が低減

省電力性または高パフォーマンスも可能にする

クロック制御では動的なクロック制御を採用し、低電圧動作でもより多くの電流を供給することで、少しでも高いクロックで動作できるようにし、電力効率の改善と最大25%の省電力化を実現する。

積極的に動的なクロック制御を採用することで、低電圧でより高い動作クロック動作を可能にした

具体的には、半導体を積極的に低電圧で動作させようとすると、半導体動作のしきい値を下回ってしまうことがあるが、Polarisでは、ごく短時間(1ns以下)だけ低周波数で動作させることで、低電圧動作を継続し、省電力性を高めるアプローチを採っている。

ごく短時間クロックを下げて低電圧での動作を行う

しかし、こうした、よりアグレッシブな動的なクロック制御を行なうためには、GPUの動作周波数を正確にモニタリングしなければならない。そこで、これまでGPU内に複数箇所搭載していた電力と温度を監視するセンサーに、周波数もモニタリングするよう機能を強化した。これにより、半導体の性能を最大限引き出せるようにしている。

動的なクロック制御を実現すべく、GPU内部のセンサーに動作クロックのモニタリングも追加

これにより低電圧で動作可能にしている

グラフィックスカードレベルでは、PCの起動時に電源供給電圧をモニタリングすることで、カードおよびシステムレベルでも、電力消費のムダを排すような工夫も採られている。また半導体を長時間使い続けることで、劣化する性能に対しても、電圧とクロックの動的制御によって、できるだけパフォーマンスを保てるような仕組みも組み込んでいる。

起動時に電圧のモニタリングし、電力のムダを最小限に抑える

このほか、フリップフロップ回路のマルチビット化により、最大40%のクロック供給電力の低減を可能にし、チップレベルで4~5%のTDP削減を実現。28nmプロセスから14nm FinFETプロセスへの移行で1.7倍の消費電力あたりのパフォーマンスを実現するのに対し、メモリインターフェースの改良なども加えた前述の半導体制御の改良などにより、最大2.8倍の消費電力あたりのパフォーマンスを実現(Radeon RX 470とRadeon R9 270X比)しているのだと言う。

フリップフロップ回路のマルチビット化により、最大40%のクロック供給電力の低減を可能にし、チップレベルで4~5%のTDP削減を実現

L2キャッシュメモリの強化とメモリインターフェースの改良により、電力効率を向上

14nm FinFETプロセスの採用に加え、半導体設計の最適化やアーキテクチャの拡張によって、最大2.8倍の省電力性を実現

その一方で、Radeon RXシリーズはこれまでよりも省電力で動作することから、オーバークロックに対する余裕も比較的大きく取られているようだ。AMDは新たに「Radeon WattMan」と呼ぶチューニングユーティリティを提供し、電力リミットやGPU動作クロックや供給電圧、最大動作温度、メモリクロックなどを、よりきめ細やかに設定できるようにする。さらに、AMDはHiAlgo BoostやHiAlgo ChillなどのGPUツールで知られるHiAlgo社を買収し、同社の技術を今後のツールに盛り込んでいくことも合わせて発表した。

AMD純正のオーバークロックツールも「AMD WattMan」としてリニューアルされた

AMDは、GPUチューニングツールベンダーのHiAlgoの買収も発表

VR向けの機能を強化

なお、AMDはRadeon RX 480をNVIDIA GeForce GTX 970の対抗製品と位置付けており、安価に最先端のVR体験を楽しめることを最大の目標としている。このため、AMDは同社独自のVR技術である「Liquid VR」も拡張し、マルチビューポートに対応するとともに、次世代VRに実装されるとみられる視線追尾を利用して、視線の先の対象を高解像度でレンダリングするAPIなどを追加した。

Radeon RX 480とGeForce GTX 970のVRにおけるパフォーマンス比較

非同期コンピューティング機能とQuick ResponseQueueにより、より快適なVR体験が実現可能だとアピール

VR環境は加速度的に進化し、グラフィックスに対する負荷も大幅に向上すると見られている

さらに、一定数のCUを特定処理専用に確保できるようにするCompute Unit Reservationや、ゲーム内のオブジェクトによる反響や音の吸収などを物理演算処理することで、よりリアリスティックなサウンド再現を可能にするTrueAudio Next、優先度の高い処理が発生した場合、ほかの処理より最優先して動的に非同期シェーダー処理を割り当てるQuick ResponseQueueなどの強化も図っている。

AMDは、同社のVR技術「LiquidVR」の機能強化も発表

Mantor氏によれば、Hawaii世代(Radeon R9 290Xなど)で統合されたTrueAudio用の専用オーディオ用DSPは、Polarisでは採用せず、GPUコアを利用した処理に変更していることも明らかにした。

TrueAudio Nextでは、GPUを利用して音の反響や吸収などの物理演算処理を施し、よりリアリスティックな音響を実現する

CUを一定量、特定の処理に割り当てられるようにするComputeUnit Reservationも追加。常に一定の負荷がかかるTrueAudio Next処理や、Asynchronous Time Warpなどの処理への応用が想定される

優先度の高い処理が発生した場合、ほかの処理より最優先して動的に非同期シェーダー処理を割り当てるQuick ResponseQueue

さて、COMPUTEX 2016のプレスカンファレンスでは、2枚のRadeon RX 480で、1枚のGeForce GTX 1080を上回るという説明をしていたが、AMDはPolaris世代で競合を上回るシングルGPUの投入にやや消極的だ。

Radeon RX 400シリーズの製品ポジショニングなどを説明するDevon Neckechuk氏

Ashes of Singularityによる、GeForce GTX 1080シングルカード構成(左)と、Radeon RX 480×2構成(右)のベンチマーク比較

Radeon RX 480でも、CrossFireブリッジ用のコネクタは用意されていない(カード裏面に見えるピンヘッダはデバッグ用)。Devon Neckechuk氏は、「今後はすべてPCI Expressバス経由でマルチGPU対応をすることになる」としている

Polarisは、同社として初の立体構造(FinFET)の半導体設計を採用する。そのリスクを最小限に抑えるため、ダイサイズをかなり小さめに抑えている。つまりメインストリーム以下のグラフィックスカード市場で、シェア拡大を狙おうとしているのは明かだ。

初値はAMDが発表した米国における市場想定価格よりも割高だが、このまま円高が進めば、より廉価にハイパフォーマンスなグラフィックスカードが入手できるようになる可能性は高い。ここ数年、価格が高騰気味だったグラフィックスカード市場の価格レンジを押し下げる製品としても期待したいところだ。

AMDはすでにより高性能なGPUとして、開発コードネーム"Vega"(ヴェガ)を2017年前半にも市場投入する計画を公開している

【ベンチマークテストの結果はこちら】
Radeon RX 480ファーストインプレッション - 期待の"Polaris"、そのパフォーマンスを探る