XeLPは動作範囲が拡大し、高効率

次のグラフは横軸が電源電圧で、縦軸がクロック周波数で、動作領域をプロットしたものである。これを見ると、XeLP GPUは現在のGen 11に比べて、動作する電源電圧範囲が広く、動作するクロック周波数範囲も広くなっている。そして、同じ電源電圧でみると、最大クロック周波数が高くなっている。

これはXeLP GPUの設計に当たって、パイプラインの切り直しを行って動作範囲を広げたことと、ボトルネックの解析で改良すべき点を洗い出して対応したことが効いている。

  • Xe

    XeLP GPUではパイプラインの切り直しやボトルネックの洗い出しを行って、動作範囲を広げ、Gen 11では最大1.1GHz程度までしか動作できなかったが、XeLPでは1.7GHz以上まで動作するようになっている

Tiger Lakeに搭載されるEUはソフトウェアスコアボーディングを使う高効率のスレッド制御を行っており、2つのEUはロックステップで完全に同期して動く。

演算部は8スレッド幅のINTとFPの演算器を持ち、INT32なら1サイクル1演算×8、INT16ならその2倍の演算を実行できる。また、拡張演算器は1サイクル2演算を実行できる。

  • Xe

    Tiger LakeはXeのEUを2個搭載。FPとEMはGen 11 EUの2倍、INTは4倍

Tiger Lakeのメモリシステムは、L1データキャッシュは新設計となり、L3キャッシュの容量は最大16MBに拡張された。GTIのバンド幅が倍増されL3キャッシュへの出し入れが速くなっている。そして、データ圧縮した状態でL3キャッシュに格納するので、実質的なバンド幅は圧縮分だけ向上している。

  • Xe

    L3キャッシュが最大16MBに拡張された。また、GTIのバンド幅が倍増され、さらに、圧縮形式で読み書きするので実効的なバンド幅は、圧縮分だけ向上している

Tiger Lakeのメディアエンジンは、Gen11と比べると最大2倍のエンコード/デコードスループットを持っている。AV1のデコードの加速、HEVCのスクリーンコンテントコーディングのサポートなどを行い、4K/8K60の表示に対応している。また、HDR Dolby Visionの再生にも対応している。

  • Xe

    Tiger Lakeのメディアエンジンは、Gen 11と比較すると、エンコードやデコードのスループットが最大2倍になっている

IntelはHot Chips 32での発表時に10ストリームのHEVC 4Kビデオを並列にトランスコードするデモを見せた。見た感じでは、まったくスムーズに処理出来ていた。

  • Tiger LakeのXeLP GPUによるHEVC 4Kビデオ 10ストリーム並列のトランスコードのデモの様子A@Xe