2023年4月のIntel Tech Talkはサーバー製品群の現状を紹介

アクセラレーター外付けから内蔵へ、vRAN利用のモバイルキャリアを後押し

インテルは記者向けの技術解説セミナー「Intel Tech Talk」を不定期に開催しています。2023年4月20日に現在のサーバー製品の状況と将来のロードマップについて説明がありました。

今回は前半、インテル株式会社クラウド・通信事業統括部統括部長堀田賢人氏がNetwork & Edgeの動きと具体的な事例として携帯事業者で採用が進む応用例に関して説明がありました。

インテルはソフトウェアデファインド（SDx）の変革を行っています。従来、専用機（アプライアンス）で実現していた機能を汎用サーバー上のソフトウェアでおこないます。

SDxには汎用サーバーを使用するのでコストが安く、柔軟な構成が可能です。専用機と同等以上の性能と信頼性が実現できるかがポイントになり、SDxを進めるためにはさらなるコンピューティングとインテリジェンスが必要となります。

SDxはすでに何年も前から言われており、Interop TOKYOの先端ネットワーク展示ShownetでSDxを扱ったのは2012年だったと記憶しています

事例として堀田氏は最近急速に採用が進みつつある携帯電話の無線局を例に挙げました。従来の携帯電話無線局はカスタムRANと言って専用製品が通信機器メーカーから提供されていました。専用機でモバイルネットワークを構築していたわけです。

これをソフトウェアで実現したものがvRAN、vRANの規格を標準化して原則複数のベンダーを組み合わせても利用できるのがオープンRANとなります。

楽天モバイルは「完全仮想化」を武器に低価格戦略を行っていますが、楽天モバイルの場合、最新の環境を取り入れたのであって、ドコモ、KDDI、ソフトバンクがvRANを取り入れていないわけではありません。

インテルに追い風となっているのがモバイルネットワークのSDx化。vRANやオープンRANが主流になればインテル製品の採用も増えます。古くからコミットしているためか、この市場はインテルがガッチリ握っています

RANは一般的には端末と基地局を繋ぐRU（Radio Unit）、無線信号を処理するDU（Distributed Unit）、処理したデータをコアネットワークとやりとりするCU（Central Unit）から構成されています。が、従来のRANはRU/DU/CU全てを基本同じ機器ベンダーのものでしか接続できないクローズドな仕様となっています。もちろん、同一の会社が提供している以上、ネットワークの安定性は高くなりますが、状況に合わせた柔軟な構成にすることができません。

これをオープンRANにすることで、異なるベンダーのRU/DU/CUを組み合わせて利用することができるようになり、場所や場面に応じた最適な機器を組み合わせて利用できるのです。

NFVが定義されて10年。vRANやオープンRANも技術検証やトライアルをへて、商用展開が開始する領域です

実際、vRANの展開が大手通信事業者によって進んでいます。日本にも二つ商用展開のマークがついています

インテルはこの10年間仮想化にフォーカスしておりNFV（Network Function Virtualization）やDPDK（Data Plane Development Kit：従来カーネルが行っていたネットワークカードの制御をユーザー空間で行う事で処理を高速化する技術）などを提供していました。

その成果として「2020年には50%のコアネットワークが仮想化され、2023年に新規導入されるコアネットワークの98%が仮想化。そのほとんどがインテルの技術をベースとして大規模な商用提供として行われている」と堀田氏は発言。

現在実用化が進む携帯電話の5Gの多くは無線部分だけが5G化しており、データのやり取りを行うコアネットワーク部分は4Gのものを利用するNSAが中心ですが、今後5G用のコアネットワークを使用するSAが主流となります。

従来は既存の設備を利用していましたが、5Gでコアネットワークが大きく変わるタイミングでSDN化が中心的になると言われています。堀田氏は今年2月に開幕したMWC 2023ではvRANの採用がトライアルから商用展開へとステージが変わっていたと発言。vRANはDU（Distributed Unit）をどのように構築するかが問題となっており、従来はFECと言われるL1技術の仮想化するのが難しいポイントでした。

従来はL1を処理する専用のアクセラレターカードによってFEC（Forward Error Correction：伝送時にエラーが起きることを前提にあらかじめ誤り訂正符号を付与することでエラー訂正を行う）を実現していましたが、アクセラレーターカードを組み込むというのは汎用から外れてしまいます。

そこでインテルは「vRAN 搭載第4世代インテル Xeon スケーラブル・プロセッサー（以下SPR-EE）」を発表。従来、外部にあったFECアクセラレーターを第4世代インテル Xeon スケーラブル・プロセッサーの内部に組み込んだSKUを用意しました。

第4世代インテル Xeon スケーラブル・プロセッサーはそれ以外にもいくつかのアクセラレーターを組み込んでおり、vRAN Boost以外にも以前はチップセットに含まれていたQAT（Quick Assist Technology）がCPU内部に移動。他にもDLB（Dynamic Load Balancer）、DSA（Data Streaming Accelerator）、IAA（In-memory advanced Analytics Accelerator）が搭載され、AMX（Advanced Matrix eXtensions）命令も追加されました。

5Gネットワークの無線部からコアネットワークまでインテル製品がフルカバー。従来製品ではvRAN L1がFECアクセラレーターを使用していたので汎用サーバーで行うのにハードルがありました

外付けFECアクセラレーター「ACC100」相当の機能をCPUの中に入れてしまおうというのが第4世代インテル Xeon スケーラブル・プロセッサー。専用CPUじゃないのかと思いきや普通のSapphire Rapidsと同じシリコンだそうです

堀田氏は「汎用CPUにアクセラレーターを入れたことで、DUとして使用していたサーバーを後日演算資源として再利用することができる」と汎用CPUのアクセラレーターを入れた効能を紹介。vRAN関係ではNICに関してもアップデートがあり、現在のモバイル通信で使われている時分割多重転送に重要な時刻同期に関しても冗長化が欲しいという要請があり、冗長化に対応したネットワークカードも発表しているとの事。

今のモバイルネットワークは一つの電波を時分割で複数のユーザーとやり取りするので、時間管理が厳密。NICの中に複数の時刻管理を組み込みました

SPR-EEはコンピューティングとvRANのどちらでも運用可能なうえ、アクセラレーターによって最大で従来比二倍のキャパシティを同電力で利用できるというメリットがあります。SPR-EEはQ2までに20コアの製品が、Q3までに32コアのシリーズを出荷予定との事でした。

FECアクセラレーターの内蔵によって同じ電力なら前世代比2倍の容量を実現。汎用サーバーでコンピューティングにも利用可能です。最大20コアと最大32コアのシリーズが出荷予定となっています

参考までにMWC 2023のリファレンスはWebで公開中で、通信事業者のコメントも含まれており、日本の会社ではNTTドコモ、KDDI、楽天モバイルのコメントがありました。

携帯事業者のコメント。KDDI。すでに今年から商用展開向けの開発をスタート

NTTドコモ。第4世代 Xeonスケーラブルプロセッサが効率性とTCO削減に寄与すると期待しています

楽天モバイル。過去検証用DCの取材をしたことがあり、Intelサーバーがズラリとラックに収まっていました

第4世代インテル Xeon スケーラブル・プロセッサーでは無線基地局の電力制御も実現できました。

デュアルソケットモデルで1Tbpsのスループットが得られるようになり、汎用サーバーで専用機と同等のスループットが得られるようになっただけでなく、IPM（Infrastructure Power Manager）という電力管理ソリューションを使用することでトラフィック量を見ながら電力効率を高めることが可能になりました。

第4世代インテルXeonスケーラーブルプロセッサーデュアルソケットサーバーで、5G UPFワークロードに1Tbpsのスループットが実現したとのこと。さらにIPMを適用することで消費電力を30%減。第三世代製品比でワット性能がほぼ倍に

前世代のXeonからステート変更のペナルティが減ったため、ワークロード実行中にステート変更を行ってもサービスへの影響が出なくなったので変更が可能になっています

モバイルネットワークは時間帯による利用率の変動があるため、1Tbpsのスループットが得られる機材を使用しても常時1Tbpsの帯域の必要はありません。第3/4世代のCPUではステート変更の遷移時間が短い事から、ソフトのレイヤーをワークロード稼働中に変更してもサービスに影響を及ぼさないことが確認できました。テレメトリーデータを使って処理することで最大40.83%の電力削減が行え、24時間稼働想定のデータでは29.7%の電力削減が行えたとの結果が出ています。

IPMを適用する前はCPUの消費電力はほぼ変動なしに対し、IPMを適用することで最大スループットに影響を与えず、スループットが低い時間帯では40.83%の消費電力削減。一日の平均的なワークロードでは29.7%の電力削減となります

堀田氏がもう一つ紹介したのがインテル Infrastructure Processing Unit（IPU）。標準的なNICに対してCPUを搭載するスマートNICがありますが、さらに発展させたものがIPUです。従来CPUが制御していたNIC制御をFPGAやXeon-D、ASICを追加することでCPU処理をオフロードさせて効率を上げるものです。すでに多くの会社がIPUを活用していただいていると紹介するとともに、次世代製品も発表を予定していると紹介しました。

スマートNICをさらにスマートにしたのがIPU。CPU処理をオフロードすることでシステム全体の性能を引き上げます

IPU E2000のブロック図とエコシステムを構成する企業一覧

インテルはハードウェアメーカーと思われがちですが、開発支援までのソフトウェアにも強く、技術者の6割がソフトウェア関連だそう

サーバーもE-Coreを採用、CPU/GPU/FPGAと幅広い製品群とoneAPIで市場リード

引き続き、インテル株式会社技術本部技術部長渡邉恭助氏がデータセンター市場の製品と将来のロードマップについての説明を行いました。

データセンター部門は現在大きく成長しており、インテルはこの分野にCPUだけでなく、ネットワーク製品、アクセラレーター、GPUを提供しています。

インテルの製品ポートフォリオ。汎用CPUだけでなく、GPU、アクセラレーター、ネットワークと幅広い内容です

インテルの強みはoneAPIによって、ハードウェアが異なっても同じAPI経由で呼び出すことでソフトウェアの変更が少ないところにあります。例えば、負荷が軽くコストを抑えたいならばソフトウェアベースで、CPUの負荷を減らし性能を上げたい場合は専用アクセラレーターやFPGA、GPUで動作させることが、APIのパラメーターを変更するだけで容易に実現できます。

幅広いポートフォリオを支える脇役がoneAPI。アクセラレーターを入れてもAPIの呼び出しパラメーターを変えればCPU処理をアクセラレーターにオフロードできるので、プログラムの開発効率が上がります

第4世代インテルXeonスケーラブルプロセッサーには過去最大のアクセラレーターを内蔵。一部は標準で利用でき、いくつかのアクセラレーターはオプションで提供されますが中のシリコンそのものは同じものを使っているとの事。

第4世代インテルXeonスケーラブルプロセッサー製品出荷を受け、450以上のデザインが採用、200以上がすでに出荷され、これはXeonファミリー史上最多です。2023年までに世界のTOP10のクラウドサービスプロバイダーで導入されると言います。

実環境での速度を考慮し、多くのアクセラレーターをCPUに内蔵。インテルXeon CPUマックスシリーズでは広帯域のHBM2eメモリも内蔵し、最大47個のダイが一つのパッケージに収まっています

このように多機能・高性能ですが、出荷が二年遅れたのが結構厳しいところ。ひいき目に見ても「インテルサーバーCPUの遅れでリプレースを伸ばしていたが、サポート切れになるのでEPYCにした」ケースが多いと思います

前世代比1.5倍以上の性能で、アクセラレーターが効く領域はさらに高速化したのが魅力です

サーバーメーカーも待ちに待ったという感じで、解禁日/出荷予定日に史上最多のデザイン数。なぜ遅れた？に関してトップの発言はまだなかったと思います。量産技術の問題なら現在順調に出荷しているのは変ですし、昨年限定顧客に出荷していたのが正解のヒントなのかもしれません

現在のコンシューマー向けのインテル Core iプロセッサは性能を重視したP-Coreに加えて電力効率性のよいE-Coreをミックスしたハイブリッドアーキテクチャになっていますが、現在までのサーバー用のXeonプロセッサはP-Coreのみです。

サーバー用という事で性能を重視していたためですが、クラウドプロバイダから（多くの仮想マシンを収めることができる）消費電力あたりの性能と高いコア密度を要望されていました。そこで、今後E-Coreを使用したプロセッサが登場する予定となっています（P-Core/E-Coreミックスのサーバー用プロセッサーは今のところ予定なしとの事）。

データセンターの利用はハイパフォーマンスだけでなく、あまり性能はなくてよいので高密度にという要求があります

従来は性能に特化したP-Coreをサーバー用CPUに使用していましたが、今後は高密度実装ができるE-Coreの製品も登場

現在、最新のサーバー用プロセッサは今年一月にリリースされたIntel 7プロセスで製造されたSapphire Rapidsですが、今年Q4には改良版となるEmerald Rapidsをリリース予定。BIOS更新は必要になるもののソケット互換です。

来年2024年前半には二つのCPUが予定されています。一つは初のE-Core構成のサーバー向けプロセッサー「Sierra Forest」で最大144コア。先に書いたようにクラウドサービスプロバイダー向けに出荷されます。その直後にP-Core構成の「Granite Rapids」が出荷されます。

立て続けのリリースはCPUコア以外の構成があまり変わらないからとのことで共にIntel 3プロセスで製造されるとの事（この説明だとIntel 4プロセスはサーバー用プロセッサには使われず、おそらく第14世代となるCoreプロセッサ「Meteor Lake」に使われるようです）。共に開発は順調で渡邉氏は「一部顧客にはすでにサンプル提供が行われている」と発言。

その先の2025年にはIntel 18Aプロセスで製造される E-Core構成の「Clearwater Forest」が登場。渡邉氏は「まだ先の製品で詳細は言えないが大幅な拡張を予定している」との事。

現在のSapphire Rapidsの改良版Emerald Rapidsが今年Q4を予定。来年上半期にはE-CoreのSierra ForestとP-CoreのGranite Rapidsが立て続けに予定されています。E-Coreの次の製品Clearwater Forestは新プロセスのIntel 18Aで2025年の予定

AIアクセラレーター市場は2027年までに400億ドルをこえるみこみで、大規模AIにはGPUが必要となります。これも小規模から中規模のAIモデルならば主にCPUによって実行され、大規模なAIは現在GPUをベースに動かされていますが、インテルはGPUや専用AIプロセッサ、FPGAとCPU以外にも多くの製品を持っており、これらを組み合わせた製品が登場する思われます。