日本ヒューレット・パッカード(HPE)はこのほど、都内で「HPE HPC & AI フォーラム2018」を開催した。本稿では分科会「HPC & AI特化型サーバ最前線!世界初!HPC向けArmサーバ商用ホスティングサービスとは?」の取材機会を得たので、その模様をお届けする。
同社では、HPC & AIに最適化されたサーバのポートフォリオとして「HPE SGI 8600」「HPE Apollo 600 Gen10」「HPE Apollo 2000 Gen10」に加え、今年4月末に「HPE Apollo 6500 Gen10」、7月に「HPE Apollo 70」も揃えている。
Apollo 6500 Gen10は、こららの記事で詳細について説明しているため、今回は5月にさくらインターネットの子会社として設立したプラナスソリューションズが採用を決定した最新製品のApollo 70をみていこう。
Armベースの高密度サーバ「HPE Apollo 70」
日本ヒューレット・パッカード ハイブリッドIT事業統括 ハイブリッドIT製品統括本部 カテゴリーマネージャーの高橋健氏は、Apollo 70を開発した背景について次のように説明する。 「次世代のスパコン技術としてHewlett Packardラボでメモリ中心型のコンピューティングの開発に取り組んでおり、そのほか多様なチームが結集し、エクサスケールクラスの次世代スパコンをどのように設計していくのか、ということを議論している。これらのチームがHPE Apollo 70の開発を主導した」
拡張性と性能を追い求めたApollo 6500 Gen10に対し、Apollo 70は高密度が特徴だ。CPUはARM v8-Aアーキテクチャに準拠したカスタムコア搭載のCavium Thunder X2を2基搭載した2ソケットサーバとなり、最大32コア/2.2GHzまでサポートしている。
また、2Uのシャーシの中にHPE AR44z(1Uハーフワイド)、HPE AR64z(2Uハーフワイド)の2種類のサーバトレイの選択が可能。2Uハーフワイドに関してはPCIeスロットが2つあるため、今後GPUのサポートを予定しているほか、1CPUあたり8本のメモリチャネルを備えているため高いメモリバンド幅となっている。
さらに、OSはArm向けRed Hat Enterprise Linux、SUSE Enterprise Linuxに対応し、大規模コンピューティングに適したスケーラビリティを持つ。
プラナスソリューションズがHPC向けArmサーバ商用ホスティングサービス
さくらインターネットの子会社であるプラナスソリューションズではApollo 70を利用し、11月にApollo 70を採用した商用のArmホスティングサーバのサービス開始を予定しており、メモリサイズが64GB、256GBの2つのモデルを用意。
同社は石狩データセンター(DC)の運営を手がけており、現在まで3000ラック、今後4000ラック追加され、計7000ラックの収容能力を持つ。これまで、HPEとの事例として産総研・先端素材高速開発技術研究組合の新素材研究に用いるスパコンを受注しており、1024台のサーバ、計3万2768コアで構成し、総理論演算性能は1.153PFLOPS(ペタフロップス)のシステムを2017年4月から稼働している。
この運営で同社は1024ノードを集積した場合、アイルキャッピングされたDC内においても立ち上げ時には部分的に70度を超える熱黙りが発生したが、エアフローや配線取り回しなどを見直し空冷で安定した運用につなげている。
また、機械の大型化、高集積化、GPUなど高電力を必要とする機材をはじめ旧来型DC、電算室では電力、耐荷重などに制約があり、機材の運用・保守を含め高集積・高電力案件に関しては実績のあるDCやソリューションを選定しないとトラブルの多発が懸念されることを、知見として得ている。
プラナスソリューションズ 代表取締役社長 さくらインターネット 営業部担当部長の臼井宏典氏は、従来の大型調達に関して「初期運用にかかるコストが大きく、運用フェーズでの予算確保が難しかった。また、中間評価での変動に対応できないほか、資産を保持しなければならず、スパコンの調達は時間を要していた」と、指摘。
そのため、これからの調達は月額利用費だけ支払えばよく、中間評価での変動に対応できることに加え、資産を保持する必要もない。さらに「クラウド型調達」であるため、サービス利用、スケールアップ時も迅速に対応することを可能としている。そこで、同社はHPC向けArmサーバ商用ホスティングサービスを開始するというわけだ。
同社のArmに対する期待値としてはCPU価格の優位性があるほか、特定の計算・メモリを使うAppでは同価格帯のx86系CPUよりコストパフォーマンスが優れるという。加えて、サーバとクライアントの関係性において特にスマホとの取り回しがよく、Post-Kでの採用やArmチップの生産数、市場規模の拡大が予測されることから、Apollo 70を採用した。
臼井氏は「いち早くCavium Thunder X2を搭載したサーバをサービス利用で使うことができる。Armでのソフトウェアやアプリケーションの動作確認、ベンチマーク計測、なによりも触ってみたいという方は大歓迎だ」と、述べていた。