世界のエクサスケールスパコンの開発状況

世界のエクサスケールスパコン開発の概況をまとめると、米国ではピークで1Exaのマシンは2021年、実アプリで1Exaのマシンは2022-2023年になる。コストは1システム6億ドルで、それ以外に多額のR&D費用が掛かっている。

EUはPreExaのシステムが2021-2022年で、ピークExaが2023-2024年という状況である。プロセサは多分、ArmかRISC-Vでヨーロッパのメーカーが作ることになろう。コストは、システムあたり3億5000万ドルで、それプラス、多額のR&D費用が掛かる。

中国はピークExaは2020年、実アプリでのExaは2021-2022年。コストはシステムあたり3億5000-5億ドルで、加えて多額のR&D費用が掛かる。

日本のピークExaマシンは多分、AIやマシンラーニング、ディープラーニング用のシステムになると予想される。実アプリで1Exaは2022年ころと想定される。プロセサは日本製で、コストは8億-10億ドルであるが、これにはR&D費用も含んでいる。

  • ISC 2019

    米国、EU、中国、日本のエクサシステムの開発の概況

中国のスパコンの状況

次の図は、Top500のシステムの製造メーカーの国別のシェアの推移をあらわすもので、歴史的には、青色の米国が大きなシェアを持ってきた。また、2000年ころまでは、大型のベクトルスパコンを作る日本は2位のシェアを持っていた。しかし、2015年ころから中国が急速にシェアを伸ばし、現在ではTop500の500システムの内の350システム程度が中国製となっている。

  • ISC 2019

    Top500に載ったスパコンの製造メーカーの国別のシェアの年次推移。2014年ころまでは米国が最大のシェアを持っていたが、2015年ころから中国が急増し、2019年では500システムの内の350システムが中国製となっている

Sterling先生は、中国の天河3号のプロトタイプとして、次のスライドを見せたが、キャビネットには神威と書いてある。どうもSterling先生の記憶違いで神威・太湖之光の写真を載せてしまったようである。

  • ISC 2019

    これは天河3号のプロトタイプ機ではなく、神威・太湖之光ではないかと思われる

国防科技大(NUDT)が開発する天河3号のプロトタイプであるが、計算ノードのアクセラレータとして3個のMatrix-2000+を使っている。Matrix-2000+は128コアでクロックは2GHzで、ピーク演算性能は2TFlopsであるので、この部分のピーク演算性能は6TFlopsである。消費電力は~130Wで、電力効率は~15GFlops/Wである。そして、512ノードのプロトタイプは400Gbpsの中国で開発したインタコネクトで接続される。

  • ISC 2019

    天河3号のプロトタイプは、天河2号のMatrix-2000の改良版を使う。3個搭載のユニットは6TFlopsである。消費電力は~130W、~15GFlops/Wの電力効率。インタコネクトは内部開発の400Gbpsのリンクを使う

日本のエクサスケール開発

日本の富岳スパコンは富士通のA64fxプロセサを使う。A64fxはArmアーキテクチャのメニ―コアチップで、48個の計算コアと2個あるいは4個のアシスタントコアを持つ。コアの整数演算性能はXeonに近い性能を持つとのことである。

そして、Armのベクタ命令であるSVE命令をサポートし、512bit幅のベクタエンジンを搭載してGPUのような演算性能を持つという。

大きな特徴はメモリとしてHBM2を使用し、0.4程度という高いB/F比を実現している点である。

ノード間の接続は、京コンピュータで開発したToFuの改良型の6Dメッシュ/トーラスネットワークのTofu-Dを使う。

このマシンは2021年の1-2Qの稼働開始を目指している。

  • ISC 2019

    日本は富士通のA64fxという48計算コアのArmアーキテクチャのメニーコアチップを使う。メモリとしてはHBM2を使い、約0.4Byte/FlopのB/F比を持つ。このマシンは2021年1-2Qに稼働開始の予定

米国のエクサスケール開発

米国のExaハードウェア技術の開発はECP(Exascale Computing Project)で推進されてきた。予算総額は~4億3000万ドルで、DoEは60%の費用を負担した。この予算は、革新的なメモリアーキテクチャの開発、高速インタコネクトの開発、システムの信頼性の改善、処理の並列性を向上する革新的な方法の開発などにつぎ込まれた。

  • ISC 2019

    ECPのPath ForwardプロジェクトでベンダーのハードウェアR&Dを促進した。DoEは全体の60%にあたる2億5000万ドル以上を支出した。Path Forwardでは革新的メモリ、高速インタコネクトなどを開発した

当初はアルゴンヌ国立研究所は、2018年にPre ExaのAuroraというシステムを設置する予定であったが色々な理由で計画が遅れ、2021年に設置ということになった。そのため、性能を180PFlopsから1000PFlopsに上げ、米国の最初のエクサスケールスパコンという位置づけとなった。そして、伝統的なワークロードであるシミュレーションに加えて、ビッグデータとマシンラーニングが3本柱という位置づけの変更が行なわれた。

このAurora21と呼ばれるマシンは、工程表によると2022年の初めに受入検査が行われることになっている。なお、ベンダーはIntelとCrayである。

  • ISC 2019

    当初の計画から遅れ、2021年に1000PFlopsのマシンを納入することになったアルゴンヌ国立研究所のAurora21。2021年納入で、2022年初めに受入検査を行う予定である

Aurora21の詳細は明らかにされていないが、推測も交えて述べると、ノード数は5万ノードで、5PBを超える各種のメモリを搭載する。その中にはHBMスタイルのメモリも含まれる。計算エンジンはXeon CPUとAtomコアにAVXのベクタエンジンを付けたアクセラレータチップのハイブリッドシステムとなる。

スパコンシステムとしてはCrayのShastaハードウェアが使われる。推定設置面積は4万平方フィート(約3700m2)であるという。

  • ISC 2019

    Aurora21の構成。発表情報と推測が混じっている。ノード数は5万。5PB以上のメモリを持つ。CPUはXeonで、Atom+ベクタエンジンの計算アクセラレータを持つハイブリッドシステム

EUのエクサ開発

EUは2021年にはRhea Familyと呼ぶ第1世代のGPP(General Purpose Processor)を開発する。ArmとRISC-Vに外部からのIPを組み合わせる。RheaファミリはPreExa向けの開発である。そして、2022-2023年に第2世代のCronosファミリGPPを開発する。CronosファミリはExaスケールシステム向けである。将来は、これをさらに発展させていく。

この図には含まれていないがEPI(European Processor Initiative)ではRISC-Vベースのアクセラレータも開発する予定が書かれている。

  • ISC 2019

    EUは2021年にはPreExaの第1世代GPPを開発し、2022-2023年にExa用の第2世代GPPを開発する

(次回は8月7日に掲載します)