米Intelは5月22日(現地時間)、アルゴンヌ国立研究所で開発中のスーパーコンピューター「Aurora」に対して、10,000枚以上のブレードサーバーの納品を完了したと発表した。構築がすべて完了すると、Auroraは63,744基のGPU、21,248基のCPU、1,024基のDAOSストレージノードを搭載することになる。

  • Intelがスパコン「Aurora」用サーバーを納品完了 - 科学研究向け生成AIのトレーニングに

「Broad, Open HPC+AI Portfolio Powers Performance, Generative AI for Science(広範で開かれたHPCとAIのポートフォリオが、科学や生成AIのためのパフォーマンスを強化する)」と題したニュース記事で公開された内容。今回物理的な納品が完了して構築が進められており、初期の性能指標についても公開した。これによるとAMD MI250 GPU比で200%、QMCPACK量子力学計算においてはNVIDIA H100比で120%の性能向上を実現し、数百ノードまで増やしてもリニアな性能向上を実現。最終的に、倍精度計算におけるピーク性能は2エクサフロップスを見込むという。

  • 莫大なパラメータで機械学習を行える

  • 主要な性能指標

  • スケーラビリティも要注目。大規模な構成にすればするほど性能が伸びる

発表の中で、HPCアプリケーション向けにoneAPIが役立っている点も強調されている。これによると、移行ツールではCUDAなどのプラットフォーム用に書かれたコードから90~95%前後のコードをツールだけで移行可能。天体物理学アプリケーション用のSYCLコードを移行した場合を例に挙げ、NVIDIA H100上の同じCUDAコードよりもMax Series GPU上で48%の性能を引き上げられるという。

そのほか、CPUのコア数増加に伴ってDDR5ベースの新しいDIMM規格「MCR(Multiplexer Combined Ranks)」についても言及。2ソケットのシステム全体で8,800MT/s、1.5TB/sの帯域幅を実現するとしている。

image credit:Intel corporation