「COMPUTEX TAIPEI 2024(COMPUTEX 2024)」の開催2日目にあたる6月5日に行われたSuperMicroの基調講演は、ある意味ちょっと独特なものだった。
メインテーマはもちろんNVIDIAとの協業であって、実際同日に出された同社のプレスリリースではHGX H100/H200 SuperClusterやB100/B200 SuperCluster、GB200 NVL36/NVL72 SuperClusterなどNVIDIAの最新データセンター向け製品をベースにしたラインナップを提供するというもの(Photo01)であったが、その前日となる6月4日にはIntelのXeon 6をベースとするX14 Serverを発表しているし、リリースこそは無かったものの基調講演の中ではAMDの次世代製品であるTurinやMI300Xシリーズをベースとした製品にも言及していた。
同社は言わばWhitebox Serverの最大手であって、当然すべてのベンダーに対応した製品をリリースしてきた訳であるが、その中で今回NVIDIAに特に言及したのは、恐らくは群を抜いて消費電力が多いNVIDIAの製品が、SuperMicroの新しい戦略に上手くマッチするから、というあたりかと思われる。
DLCの採用推進を図るSuperMicro
そんなSuperMicroの新しい戦略は、サーバー内部にヒートパイプを通して冷却水を循環させてCPUとメモリを冷やすDLC(Direct Liquid Cooling)推しである。直近は生成AIの猛烈な人気もあって、データセンター向けの売り上げが急速に伸びているとする(Photo02)。
ここで登場するのが「Green Computing Can Be FREE with a BIG BONUS」というメッセージ(Photo03)。
要するにOperation Costを下げる選択をすることは、ユーザーにとってフリーランチが手に入るようなものだ、という話である。そのOperation Costを下げるための手法がDLCである。8000枚のGPU、あるいは1000台のNVIDIA HGX Systemを立ち上げる場合の、「部品以外」のコストを見てみると(Photo04)、DLCを使うことでデータセンターの建設費用はむしろ下がることが示されている。
IT System Cost、つまり管理費はDLCでは若干上がるが、トータルすると3%程度の初期費用低減につながるというものだ(Photo04)。
また、DLCというか液冷にまつわるこれまでの問題に対し、もはやSuperMicroからするといずれも問題は無い、とする。リードタイムは従来より遥かに短く、コストも空冷とそれほど変わらず、長時間運転も可能であるとしている訳だ。
では逆にDLCのメリットは何か? というと、サーバーの実装密度を引き上げながら、かつ高効率に冷却ができる事だ。実際NVIDIAの場合で言えば、HGX 200の空冷システム(Photo06)と比較して、DLCではラック当たりの実装密度を2倍に出来る(Photo07)。
例えば256GPUのAI Super Clusterを構成する場合、空冷を前提にしたユニットだと9ラック構成(Photo08)になるのが、DLCだと5ラックで解決することになる(Photo09)。
基調講演の中では、この5ラックを4つ並べた(つまり1024GPU)システムを20個並べた(20480GPU)システムを、1つのクーリングタワーで賄える的な説明も行われたが、これは流石に模式図であって実際の構成という訳ではないだろう。そもそも1つのSuperRackには256GPU+128CPUが載り、2GPU+1CPUで概ね1KW。つまりSuperRack全体で(Networkその他を無視しても)128KWほどになる。このSuperRackを4つ束ねたものが512KW、それを20個だと10MWを超える消費電力になる訳で、流石にこれを1つのクーリングタワーで賄うのは無理が過ぎる。ただ一般に空冷の場合、冷却効率の問題もあってラックあたり15KW程度が限界(実際Photo06のものは16KWほどになるから、冷却限界ギリギリである)と言われているし、これを並べて空気で冷却というのはそもそも空気の熱交換の効率があまり高くない事を考えれば、DLCを推したくなるSuperMicroの動機は非常に理解しやすい。
SuperMicroがどこまでデータセンター全体の構築に関わるか、というのはまだ明確ではないのだが、クーリングタワーの提供に加えてData Center Management Softwareの提供なども行うとしており(Photo11)、またDLC対応のサーバーの供給をさらに増やすための方策の1つとしてマレーシアに組み立て工場を現在建設中で、2024年第4四半期には操業を開始するとしている。
これでDLC対応サーバーの比率を現在からずっと増やしてゆき、今年中に15%、将来的には出荷量の40%近くをDLC対応製品にシフトする予定、というのがSuperMicroの展望であった(Photo13)。