世界のエクサスケールスパコンの開発状況
世界のエクサスケールスパコン開発の概況をまとめると、米国ではピークで1Exaのマシンは2021年、実アプリで1Exaのマシンは2022-2023年になる。コストは1システム6億ドルで、それ以外に多額のR&D費用が掛かっている。
EUはPreExaのシステムが2021-2022年で、ピークExaが2023-2024年という状況である。プロセサは多分、ArmかRISC-Vでヨーロッパのメーカーが作ることになろう。コストは、システムあたり3億5000万ドルで、それプラス、多額のR&D費用が掛かる。
中国はピークExaは2020年、実アプリでのExaは2021-2022年。コストはシステムあたり3億5000-5億ドルで、加えて多額のR&D費用が掛かる。
日本のピークExaマシンは多分、AIやマシンラーニング、ディープラーニング用のシステムになると予想される。実アプリで1Exaは2022年ころと想定される。プロセサは日本製で、コストは8億-10億ドルであるが、これにはR&D費用も含んでいる。
中国のスパコンの状況
次の図は、Top500のシステムの製造メーカーの国別のシェアの推移をあらわすもので、歴史的には、青色の米国が大きなシェアを持ってきた。また、2000年ころまでは、大型のベクトルスパコンを作る日本は2位のシェアを持っていた。しかし、2015年ころから中国が急速にシェアを伸ばし、現在ではTop500の500システムの内の350システム程度が中国製となっている。
Sterling先生は、中国の天河3号のプロトタイプとして、次のスライドを見せたが、キャビネットには神威と書いてある。どうもSterling先生の記憶違いで神威・太湖之光の写真を載せてしまったようである。
国防科技大(NUDT)が開発する天河3号のプロトタイプであるが、計算ノードのアクセラレータとして3個のMatrix-2000+を使っている。Matrix-2000+は128コアでクロックは2GHzで、ピーク演算性能は2TFlopsであるので、この部分のピーク演算性能は6TFlopsである。消費電力は~130Wで、電力効率は~15GFlops/Wである。そして、512ノードのプロトタイプは400Gbpsの中国で開発したインタコネクトで接続される。
日本のエクサスケール開発
日本の富岳スパコンは富士通のA64fxプロセサを使う。A64fxはArmアーキテクチャのメニ―コアチップで、48個の計算コアと2個あるいは4個のアシスタントコアを持つ。コアの整数演算性能はXeonに近い性能を持つとのことである。
そして、Armのベクタ命令であるSVE命令をサポートし、512bit幅のベクタエンジンを搭載してGPUのような演算性能を持つという。
大きな特徴はメモリとしてHBM2を使用し、0.4程度という高いB/F比を実現している点である。
ノード間の接続は、京コンピュータで開発したToFuの改良型の6Dメッシュ/トーラスネットワークのTofu-Dを使う。
このマシンは2021年の1-2Qの稼働開始を目指している。
米国のエクサスケール開発
米国のExaハードウェア技術の開発はECP(Exascale Computing Project)で推進されてきた。予算総額は~4億3000万ドルで、DoEは60%の費用を負担した。この予算は、革新的なメモリアーキテクチャの開発、高速インタコネクトの開発、システムの信頼性の改善、処理の並列性を向上する革新的な方法の開発などにつぎ込まれた。
当初はアルゴンヌ国立研究所は、2018年にPre ExaのAuroraというシステムを設置する予定であったが色々な理由で計画が遅れ、2021年に設置ということになった。そのため、性能を180PFlopsから1000PFlopsに上げ、米国の最初のエクサスケールスパコンという位置づけとなった。そして、伝統的なワークロードであるシミュレーションに加えて、ビッグデータとマシンラーニングが3本柱という位置づけの変更が行なわれた。
このAurora21と呼ばれるマシンは、工程表によると2022年の初めに受入検査が行われることになっている。なお、ベンダーはIntelとCrayである。
Aurora21の詳細は明らかにされていないが、推測も交えて述べると、ノード数は5万ノードで、5PBを超える各種のメモリを搭載する。その中にはHBMスタイルのメモリも含まれる。計算エンジンはXeon CPUとAtomコアにAVXのベクタエンジンを付けたアクセラレータチップのハイブリッドシステムとなる。
スパコンシステムとしてはCrayのShastaハードウェアが使われる。推定設置面積は4万平方フィート(約3700m2)であるという。
EUのエクサ開発
EUは2021年にはRhea Familyと呼ぶ第1世代のGPP(General Purpose Processor)を開発する。ArmとRISC-Vに外部からのIPを組み合わせる。RheaファミリはPreExa向けの開発である。そして、2022-2023年に第2世代のCronosファミリGPPを開発する。CronosファミリはExaスケールシステム向けである。将来は、これをさらに発展させていく。
この図には含まれていないがEPI(European Processor Initiative)ではRISC-Vベースのアクセラレータも開発する予定が書かれている。
(次回は8月7日に掲載します)