理化学研究所(理研)のスーパーコンピュータ「富岳」が、2021年3月9日から共用を開始した。

  • スーパーコンピュータ「富岳」

    スーパーコンピュータ「富岳」

それにあわせて同日午前10時30分から行われた富岳共用開始記念オンラインイベント「HPCIフォーラム~スーパーコンピュータ『富岳』への期待~」において、一般社団法人HPCIコンソーシアムの朴泰祐理事長(筑波大学計算科学研究センター)が、「富岳の共用開始および富岳を中核とするHPCI」と題した祝辞講演を行い、富岳が稼働するまでの経緯について紹介した。

  • 富岳の共用開始にあわせて講演を行ったHPCIコンソーシアムの朴泰祐理事長

ついに完成した「富岳」、日本のHPCIが完全な姿へ

ナショナルフラッグシップスーパーコンピュータとして完成した富岳は、文部科学省の「Flagship2020プロジェクト」により、「ポスト京」として開発がスタート。主要部品のすべてを国産で構築していることが最大の特徴であり、すでに2期連続で世界最高性能の達成している。

富岳は現在、密行列計算のTOP500、疎行列反復法計算のHPCG、グラフ処理のGraph500、複合演算精度のHPL-AIのいずれのベンチマークにおいても世界1位となっている。また、2020年にハードウェアが完成し、ポスト京・成果創出加速課題および各種早期利用プログラムにより先行した利用も開始しており、新型コロナウイルスに関する飛沫シミュレーションもその先行利用のひとつである。そして、いよいよ2021年3月9日からは、共用を開始することになった。

  • 富岳の開発年表

これらここまでの経緯の一方で、今回はHPCI(ハイパフォーマンス・コンピューティング・インフラ)への取り組みの観点からも朴理事長から説明があった。「日本においては、2008年まではそれぞれのセンターが、それぞれにスーパーコンピュータを調達し、独立したプログラムで動かしていたが、京の誕生をきっかけに、フラッグシップと、9つの大学と、2つの国立研究所が所有する第2階層のスーパーコンピュータ群によりHPCIを形成し、ネットワークで結んだ共用が開始された。各センターのマシンの拡充とともに、文部科学省が次のステップとしてエクサスケールを目指す『ポスト京』として、富岳の開発が進められてきた。また、科学技術振興機構(JST)では、ポストペタ時代のソフトウェア開発のCRESTプロクラムがスタート。2012年4月には、HPCIコンソーシアムが設立され、スーパーコンピュータ群の運用と今後のスーパーコンピュータの開発に貢献。今後、富岳の技術は、第2階層のスーパーコンピュータにも使われ、フラッグシップはさらに上のスケールを目指すことになるだろう」としている。

ちなみに、2019年8月に京が停止したあとに、富岳が稼働するまでの期間については、第2階層のスーパーコンピュータが、日本のHPCIを支えていたことになる。

  • 第2階層のスーパーコンピュータ群。それぞれの今後の開発ロードマップも

朴理事長は、「富岳が独立峰ならば、第二階層のスーパーコンピュータ群は八ヶ岳。私たちはそう呼んでいる。八ヶ岳という山はないが、数々の特徴的な連山が、八ヶ岳を構成している。そして、富岳が共用開始となったことで、HPCIの主役が戻ってきたことになる。日本のHPCIが完全形になった」と語る。

  • 第2階層のスーパーコンピュータ群は八ヶ岳。富岳の完成で日本のHPCIという「山」は完全形に

"手弁当"コミュニティからはじまった富岳の開発

富岳は当初、文部科学省に設置されたHPCI計画推進委員会において、システムおよびアプリケーションの検討がはじまった。SDHPCホワイトペーパーと、フィジリビリティスタディの成果をもとに、当時の理研計算科学研究機構(AICS)を通じて、文科省にエクサスケールシステムの開発を申請。これが科学技術政策委員会(CSTP)で承認されて、開発がスタートした。

  • 「ポスト京」の開発がスタートするまで

朴理事長は、「SDHPC(戦略的高性能計算システム開発に関するワークショップ=現NGACI)は、ポスト京の技術課題やアプリケーション開発に対して、若手研究者を中心に議論を行う、手弁当のコミュニティ。国家プロジェクトに向かうための礎を、手弁当で作ったのがユニークである。その後ワーキンググループの活動を通じて議論を行い、2012年3月にホワイトペーパーをまとめた。ただ、アプリケーションはCPU性能重視やメモリ性能重視、メモリ容量重視など、特性をそれぞれに持つ。マップを作り、どういった性能のものを作れば役に立つのかという検討を行った」としたほか、「フィジリビリティスタディでは、文科省のもと、どんなものが現実的であり、最も性能が高く、電力が低く、アプリケーションを広く吸収できるかといったことを、2012年、2013年の2年間の研究をとして行った。ここでは、汎用CPUベース、演算加速システムベース、ベクトル計算機ベース、ミニアプリケーションの4つのプロジェクトが採択され、その活動をもとに、富岳の骨格が決まった」と述べる。

  • 汎用CPUベース、演算加速システムベース、ベクトル計算機ベース、ミニアプリケーションの4つのプロジェクトが採択された

富岳はその後、理研と富士通が、2014年から共同で開発に着手し、まずは、基本設計を開始。その後、試作および詳細設計が行われ、2019年から、石川県かほく市の富士通ITプロダクツで生産が開始された。2019年12月から出荷を開始し、兵庫県神戸市の理化学研究所計算科学研究センターに搬入。2020年5月にすべての筐体の搬入を終了。その後、共用開始に向けた開発と利用環境整備などを進めてきた。

2020年4月からは、整備作業と並行して、富岳の一部リソースを活用し、新型コロナウイルスの治療薬候補の探索や、飛沫・換気シミュレーションなど、緊急的な研究を進めてきた経緯もある。

そもそも富岳の開発を目指したFlagship2020プロジェクトでは、ポスト京を、ナショナルフラッグシップスーパーコンピュータと位置づけて、2020年の共用開始に向けて進められたものであり、同時に、主要な科学および社会問題に対する多様なアプリケーションコードの開発を進められた。「半導体技術の問題があり、共用開始は約1年遅れたが、結果として、ベストなハードウェアができた。また、2021年4月から共用が開始される予定だったものが、3週間前倒しとなり、2021年3月9日から共有が開始されたのは喜ばしいことである」(朴理事長)。

事業仕分けもあり、実効性能を重視したスパコンを定義

富岳の開発のキーワードは、「コデザイン(協調設計)」だと朴理事長は語る。

「京は10ペタフロップスの性能と、世界一の獲得が基本的な目標となった。だが、事業仕分けなどもあり、富岳で目指したのは、性能の数値目標ではなく、アプリケーションがどれぐらいの実効性能を出せるかということであり、アプリケーションオリエンテッドのスーパーコンピュータである。結果として、京の100倍の実効性能を出せばエクサケールのシステムになると定義した。協調設計は、システムの基本仕様を決めた上で、CPUの性能やメモリ性能、メモリ容量、ネットワーク性能などの各種パラメータを、代表的アプリケーションを想定して設計し、決定した。同時に、アプリケーション開発者を巻き込んで、システムの制約を意識しながら、アルゴリズムを変えたり、アプリケーションを改変するという作業を平行して行った。システムとアプリケーションが、クルマの両輪となり、ベストなシステムを作ることを目指した」とする。

富岳で取り組む重点課題は、「創薬」、「生命科学」、「複合災害予測」、「気象・地球環境」、「エネルギー利用」、「クリーンエネルギー」、「デバイス・高性能材料」、「ものづくり」、「基礎科学」の9分野であり、さらに、これに加えた萌芽的課題として、「基礎科学のフロンティア」、「社会経済現象」、「太陽系内外惑星形成」、「神経回路・人工知能」の4つにも取り組むことになる。

  • 富岳が取り組む「9つの重点課題」と「4つの萌芽的課題」

朴理事長は、そのほかにも、富岳が誇るべき、いくつかの特徴があるという。

ひとつは、汎用メニーコアだけで、537ペタフロップスの高性能を実現しているという点だ。性能上位10機種のうち、6機種でGPUを使用しており、特殊メニューコアが1台、特殊加速エンジンが1台。富岳以外にも汎用CPUを利用している機種は1台あるが、そちらは38ペタフロップスの性能に留まっている。

「汎用CPUで、これだけの高い性能を実現しているのは富岳だけである。その結果、OpenMPとMPIといった最も普及したプログラミング手法を維持するとともに、メモリ性能が高く、アプリケーションの開発にも適している環境を実現した。ユーザーの利便性、性能の可搬性を高め、利用の裾野を広げることにつながっている」とした。

共用開始を前に、新型コロナウイルスに関する各種シミュレーションをすぐに行えたのも、汎用CPUを採用したことが背景にあるという。

2つめは、富岳は、世界に大きく先行して、エクサスケールのシステムを完成させたという点だ。

「米中におけるエクサスケールシステムの開発プロジェクトは軒並み遅れており、米国DoE(エネルギー省)の『Aurora』は、2018年に完成といわれていたのが、2022年にまでずれ込むと見られている。中国の3大エクサスケール計画も、情報が表には出てきていない。それに対して、富岳はすでに稼働し、成果を出し始めている」とする。

3つめは、ArmベースのCPUによるHPC時代を切り開いたという点だ。

「Armを使った本格的なHPCシステムは富岳がきっかけである。浮動小数点演算性能をあげることは科学計算には必要であり、SVE(Scalable Vector Extension)を富岳のために開発し、それをARMに採用した。低消費電力と高性能を両立するといった大きな課題を解決し、開発した独自OSにより、超並列処理を非常に高い効率で実現している」と述べた。

  • 富岳のシステム概要

富岳では、計算に必要がない一部の電力をカットするエコモードと、計算を加速するために周波数をあげるブーストモードを搭載しており、省電力と高性能を両立し、アプリケーションによって切り替えるといったことが、ユーザーレベルでもできるようになっている。また、独自開発のOSは、マルチカーネルとなっており、Linuxを動かすだけでなく、Linuxの上で、理研が独自開発したMcKernelを動作させることができるのが特徴だ。これにより、約16万ノードのリソースを効率よく連携し、動作させることができる。

朴理事長は、「富岳をはじめとしたHPCIが、計算科学、計算工学や、社会課題に解決に役立つことを期待している。そして、富岳には、その名称が示すように、トップを目指しながら、裾野の広さを実現し、世界を変える成果が次々と現れることを期待している」と述べた。