2019年のHPCの成果とそのインパクト - ISC 2019(2) 2019年時点の世界のエクサスパコンの開発状況

世界のエクサスケールスパコンの開発状況

世界のエクサスケールスパコン開発の概況をまとめると、米国ではピークで1Exaのマシンは2021年、実アプリで1Exaのマシンは2022-2023年になる。コストは1システム6億ドルで、それ以外に多額のR&D費用が掛かっている。

EUはPreExaのシステムが2021-2022年で、ピークExaが2023-2024年という状況である。プロセサは多分、ArmかRISC-Vでヨーロッパのメーカーが作ることになろう。コストは、システムあたり3億5000万ドルで、それプラス、多額のR&D費用が掛かる。

中国はピークExaは2020年、実アプリでのExaは2021-2022年。コストはシステムあたり3億5000-5億ドルで、加えて多額のR&D費用が掛かる。

日本のピークExaマシンは多分、AIやマシンラーニング、ディープラーニング用のシステムになると予想される。実アプリで1Exaは2022年ころと想定される。プロセサは日本製で、コストは8億-10億ドルであるが、これにはR&D費用も含んでいる。

米国、EU、中国、日本のエクサシステムの開発の概況

中国のスパコンの状況

次の図は、Top500のシステムの製造メーカーの国別のシェアの推移をあらわすもので、歴史的には、青色の米国が大きなシェアを持ってきた。また、2000年ころまでは、大型のベクトルスパコンを作る日本は2位のシェアを持っていた。しかし、2015年ころから中国が急速にシェアを伸ばし、現在ではTop500の500システムの内の350システム程度が中国製となっている。

Top500に載ったスパコンの製造メーカーの国別のシェアの年次推移。2014年ころまでは米国が最大のシェアを持っていたが、2015年ころから中国が急増し、2019年では500システムの内の350システムが中国製となっている

Sterling先生は、中国の天河3号のプロトタイプとして、次のスライドを見せたが、キャビネットには神威と書いてある。どうもSterling先生の記憶違いで神威・太湖之光の写真を載せてしまったようである。

これは天河3号のプロトタイプ機ではなく、神威・太湖之光ではないかと思われる

国防科技大(NUDT)が開発する天河3号のプロトタイプであるが、計算ノードのアクセラレータとして3個のMatrix-2000+を使っている。Matrix-2000+は128コアでクロックは2GHzで、ピーク演算性能は2TFlopsであるので、この部分のピーク演算性能は6TFlopsである。消費電力は～130Wで、電力効率は～15GFlops/Wである。そして、512ノードのプロトタイプは400Gbpsの中国で開発したインタコネクトで接続される。

天河3号のプロトタイプは、天河2号のMatrix-2000の改良版を使う。3個搭載のユニットは6TFlopsである。消費電力は～130W、～15GFlops/Wの電力効率。インタコネクトは内部開発の400Gbpsのリンクを使う

日本のエクサスケール開発

日本の富岳スパコンは富士通のA64fxプロセサを使う。A64fxはArmアーキテクチャのメニ―コアチップで、48個の計算コアと2個あるいは4個のアシスタントコアを持つ。コアの整数演算性能はXeonに近い性能を持つとのことである。

そして、Armのベクタ命令であるSVE命令をサポートし、512bit幅のベクタエンジンを搭載してGPUのような演算性能を持つという。

大きな特徴はメモリとしてHBM2を使用し、0.4程度という高いB/F比を実現している点である。

ノード間の接続は、京コンピュータで開発したToFuの改良型の6Dメッシュ/トーラスネットワークのTofu-Dを使う。

このマシンは2021年の1-2Qの稼働開始を目指している。

日本は富士通のA64fxという48計算コアのArmアーキテクチャのメニーコアチップを使う。メモリとしてはHBM2を使い、約0.4Byte/FlopのB/F比を持つ。このマシンは2021年1-2Qに稼働開始の予定

米国のエクサスケール開発

米国のExaハードウェア技術の開発はECP(Exascale Computing Project)で推進されてきた。予算総額は～4億3000万ドルで、DoEは60%の費用を負担した。この予算は、革新的なメモリアーキテクチャの開発、高速インタコネクトの開発、システムの信頼性の改善、処理の並列性を向上する革新的な方法の開発などにつぎ込まれた。

ECPのPath ForwardプロジェクトでベンダーのハードウェアR&Dを促進した。DoEは全体の60%にあたる2億5000万ドル以上を支出した。Path Forwardでは革新的メモリ、高速インタコネクトなどを開発した

当初はアルゴンヌ国立研究所は、2018年にPre ExaのAuroraというシステムを設置する予定であったが色々な理由で計画が遅れ、2021年に設置ということになった。そのため、性能を180PFlopsから1000PFlopsに上げ、米国の最初のエクサスケールスパコンという位置づけとなった。そして、伝統的なワークロードであるシミュレーションに加えて、ビッグデータとマシンラーニングが3本柱という位置づけの変更が行なわれた。

このAurora21と呼ばれるマシンは、工程表によると2022年の初めに受入検査が行われることになっている。なお、ベンダーはIntelとCrayである。

当初の計画から遅れ、2021年に1000PFlopsのマシンを納入することになったアルゴンヌ国立研究所のAurora21。2021年納入で、2022年初めに受入検査を行う予定である

Aurora21の詳細は明らかにされていないが、推測も交えて述べると、ノード数は5万ノードで、5PBを超える各種のメモリを搭載する。その中にはHBMスタイルのメモリも含まれる。計算エンジンはXeon CPUとAtomコアにAVXのベクタエンジンを付けたアクセラレータチップのハイブリッドシステムとなる。

スパコンシステムとしてはCrayのShastaハードウェアが使われる。推定設置面積は4万平方フィート(約3700m²)であるという。

Aurora21の構成。発表情報と推測が混じっている。ノード数は5万。5PB以上のメモリを持つ。CPUはXeonで、Atom＋ベクタエンジンの計算アクセラレータを持つハイブリッドシステム

EUのエクサ開発

EUは2021年にはRhea Familyと呼ぶ第1世代のGPP(General Purpose Processor)を開発する。ArmとRISC-Vに外部からのIPを組み合わせる。RheaファミリはPreExa向けの開発である。そして、2022-2023年に第2世代のCronosファミリGPPを開発する。CronosファミリはExaスケールシステム向けである。将来は、これをさらに発展させていく。

この図には含まれていないがEPI(European Processor Initiative)ではRISC-Vベースのアクセラレータも開発する予定が書かれている。

EUは2021年にはPreExaの第1世代GPPを開発し、2022-2023年にExa用の第2世代GPPを開発する

(次回は8月7日に掲載します)

2019年時点の世界のエクサスパコンの開発状況

世界のエクサスケールスパコンの開発状況

中国のスパコンの状況

日本のエクサスケール開発

米国のエクサスケール開発

EUのエクサ開発

この連載の前後回

AIが勧める、あなたのための会員限定記事

広島県が取り組むAI活用に迫る第3回高校生がAI人材になれるよう支援する「ひろしまAI部」とは

Dirac Audioを搭載したPCで不具合、Windows 11バージョン24H2の提供一時停止

軍事とIT 第589回システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

サイフューズとSCREEN、細胞製品の品質評価を効率化する新技術を開発

筑波大と三井不動産、次世代サイエンスパーク実現に向け産学連携協定を締結

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道

編集部が選ぶ関連記事

ISC 2018 - 恒例のSterling教授によるHPC年次総括基調講演第1回 ISC恒例のSterling教授による年次総括

HPE、Crayを約13億ドルで買収 - スパコン分野への取り組みを強化

100PFlops時代到来スターリング教授が語った2016年のHPC - ISC 2016

ISC 2016 - 中国が大躍進第47回TOP500ハイライト

関連リンク

JAIST、「並行量子通信プロトコル」の完全な自動形式検証を実現

ニデックのAIサーバ向けオープン水冷式CDU、累計出荷台数5000台を突破

AI活用の鍵を握る電力性能比の向上に注力するAMD - AMD Advancing AI ＆ HPC 2024 Japan

産総研など、シリコン型量子ビットの特性が長周期で変化する原因を特定

気象庁が新たにスパコンを調達、新システムを運用開始――激甚化する自然災害から国民の生命・財産を守るために、インテル® Xeon® CPU マックスシリーズを採用

富士フイルムなど、材料開発の期間短縮が見込める量子コンピュータ向けワークフロー

このカテゴリーについて

2019年時点の世界のエクサスパコンの開発状況

世界のエクサスケールスパコンの開発状況

中国のスパコンの状況

日本のエクサスケール開発

米国のエクサスケール開発

EUのエクサ開発

この連載の前後回

AIが勧める、あなたのための会員限定記事

広島県が取り組むAI活用に迫る 第3回 高校生がAI人材になれるよう支援する「ひろしまAI部」とは

Dirac Audioを搭載したPCで不具合、Windows 11バージョン24H2の提供一時停止

軍事とIT 第589回 システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

サイフューズとSCREEN、細胞製品の品質評価を効率化する新技術を開発

筑波大と三井不動産、次世代サイエンスパーク実現に向け産学連携協定を締結

Samsungが半導体事業の本拠地を平澤に移転か？ 韓国メディア報道

編集部が選ぶ関連記事

ISC 2018 - 恒例のSterling教授によるHPC年次総括基調講演 第1回 ISC恒例のSterling教授による年次総括

HPE、Crayを約13億ドルで買収 - スパコン分野への取り組みを強化

100PFlops時代到来 スターリング教授が語った2016年のHPC - ISC 2016

ISC 2016 - 中国が大躍進 第47回TOP500ハイライト

関連リンク

JAIST、「並行量子通信プロトコル」の完全な自動形式検証を実現

ニデックのAIサーバ向けオープン水冷式CDU、累計出荷台数5000台を突破

AI活用の鍵を握る電力性能比の向上に注力するAMD - AMD Advancing AI ＆ HPC 2024 Japan

産総研など、シリコン型量子ビットの特性が長周期で変化する原因を特定

気象庁が新たにスパコンを調達、新システムを運用開始――激甚化する自然災害から国民の生命・財産を守るために、インテル® Xeon® CPU マックス シリーズを採用

富士フイルムなど、材料開発の期間短縮が見込める量子コンピュータ向けワークフロー

このカテゴリーについて

広島県が取り組むAI活用に迫る第3回高校生がAI人材になれるよう支援する「ひろしまAI部」とは

軍事とIT 第589回システムの統合化(23)米海軍に見る複合戦指揮官コンセプトと指揮統制システム

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道

ISC 2018 - 恒例のSterling教授によるHPC年次総括基調講演第1回 ISC恒例のSterling教授による年次総括

100PFlops時代到来スターリング教授が語った2016年のHPC - ISC 2016

ISC 2016 - 中国が大躍進第47回TOP500ハイライト

気象庁が新たにスパコンを調達、新システムを運用開始――激甚化する自然災害から国民の生命・財産を守るために、インテル® Xeon® CPU マックスシリーズを採用