2022年のHot Chips、最後のセッションが「Xeon D-1700 & 2700」であった。2022年2月に発表されたばかりの製品である。

もっともこのXeon D-1700&2700は、ベースはIce Lakeであり、それもあってプロセッサそのものには余り新しい話は無い。そんな訳で説明は集積されたアクセラレータとか周辺機器に焦点をあてたものとなった。

さて、そのD-1700&2700のSKU一覧は以前こちらに示したが、D-1700シリーズは最大10コア、D-2700シリーズは最大20コアとなっている。ただ実際には他にも細かな違いがある。この辺をまとめたのがこちら(Photo01)である。

  • D-1700&2700のSKUなど

    Photo01:パッケージサイズとPCIeレーン、DDR4のメモリチャネル、内蔵するQATの世代など。さらにSKUによる細かな搭載機能の違いもある

マイクロアーキテクチャの説明がこちら(Photo02)だが、これは要するにIce LakeのSunny Coveの特徴そのままであって、特に変更はない。

  • SkylakeベースのXeon D-2100との対比

    Photo02:ここではSkylakeベースのXeon D-2100との対比がなされているが、数字そのものはIce Lakeのものである。ちなみにXeon向けのIce Lake-SPではなく、Consumer向けのIce Lakeの構成である

ちょっと面白いのは性能比較。暗号化処理だが、普通にCPUで実施した場合にXeon D-2187NT比でXeon D-2798NTは15%前後の性能ブーストがある。

  • アーキテクチャの違い

    Photo03:Xeon D-2100の方はD-2187NTがハイエンドだが、D-2700の方は上位にD-2798NXの上位にD-2799がラインナップされている。恐らくD-2187に近い動作周波数を選んだものと思われる。あとIntel Arkで見る限り、Xeon D-2798NXという製品は存在しない(というかNXというSKUが存在しない)。多分Xeon D-2798NTの間違いである

動作周波数はBase/Turboが2.0GHz/3.0GHz→2.1GHz/3.1GHzなので、5%変わるかどうかというあたりで、これは素直にIPCの向上に起因すると考えられるが、AVX512を利用する事で、さらに性能を向上できる(ECDSA Verifyみたいに効果が無いケースもあるが)としている。他にVNNIとかSGXの説明もあったが、これらは別にXeon D-1700&2700のみの機能ではないので割愛する。

新情報として今回発表されたのは、Gen3 QuickAssist Technology(QAT3)である(Photo04)。

  • アクセラレータの概要

    Photo04:普通この手のアクセラレータはinlineモードのみなのが、Lookasideモードを持つのがちょっと目新しい

これはD-2700にのみ搭載される機能で、対応する暗号方式の強化や圧縮方式の改良など色々細かな違いがある。ちなみにLookasideとInlineの違いがこちら(Photo05)。

  • 圧縮伸長などは通常パケットプロセッサとは別にコプロセッサの形で用意

    Photo05:ただ圧縮伸長などは通常パケットプロセッサとは別にコプロセッサの形で用意されており、QAT3ではこれをまとめてしまったので両方の方式がある、という見方も出来る

対称/非対称暗号とか圧縮伸長などのAPIが用意されており、これを使う場合はLookasideモードになる訳だ。

このQAT3の効果がこちら(Photo06)。

  • ソフトウェアの違い

    Photo06:プラットフォームはどれもXeon D-2798NXで、なので純粋にソフトウェアの違いでここまで性能差が出る事になる

きちんと最適化してやることで、Secure TLSを利用してのWebサーバーへのアクセス性能が最大4倍にまで向上するとする。

またEthernet周りでもD-1700とD-2700ではちょっと違いがある。Photo07の様に8ポートのPacket Processor内蔵SwitchがD-2700には搭載されており、さらにここから直接QAT3を呼び出す事が可能である。Ethernet Controllerそのものは共通なので、Intelligence Switchの機能が要らなければD-1700でもそう見劣りする訳ではないのだが。

  • D-1700ではIntel Ethernet ControllerからQATを呼び出す事は可能

    Photo07:D-1700ではIntel Ethernet ControllerからQATを呼び出す事は可能であるが、D-2700の方がより効果的に処理ができる事になる

Packet Processorの内部構造はこんな感じ(Photo08)。

  • QAT以外の部分はEthernet Controller内で処理される

    Photo08:QAT以外の部分はEthernet Controller内で処理される事になる

この構造そのものは別に目新しい訳では無いが、昔はNetwork Processorとかが搭載していたレベルの機能であり、これがD-2700に入った事になる。余談だがこのPacket Processorはユーザーがプログラミングできるようにはなっていないとの事。この辺りがP4をサポートしてユーザーが自由にプログラミングできるIPUとの差別化の部分なのかもしれない。これをフルに生かしてのIPSecでの性能比較がこちら(Photo09)。

  • D-2100の場合はやはりソフトウェアでの実装

    Photo09:D-2100の場合はやはりソフトウェアでの実装なので、スコアとしては0.9とかそのあたりと考えておけばいいのではないかと思う

IPSecのSecurity Gatewayを構築した場合のスループットの比較であり、D-2700シリーズだとかなり高性能のGatewayが構築できる事になる。

ところで先ほどIPUについてちょっと言及したが、Intel的にはD-1700&2700はあくまでも汎用プロセッサという位置付けで、ただしNetwork Acceleratorがやや豊富、という扱いの様だ(Photo10)。

  • 同社はCompute EdgeはTDP 100Wを超えても問題ないと考えていることが良く判るスライド

    Photo10:同社はCompute EdgeはTDP 100Wを超えても問題ないと考えていることが良く判るスライドなのかもしれない

改めて見てみると、D-1702の25WからD-2799の129Wまで、実に100WものTDPレンジがあるのがD-1700&2700シリーズの特徴であり、より大電力が許容出来るのであればXeon Goldとかがラインナップされている、というのが同社の主張なのだが、いやもう少し省電力のラインナップを充実させても良いのではないか、と思った。