自然現象を監視・予測し、国民の生命・財産を災害から守れるように、適切な情報提供を行うことをミッションとする気象庁は、以前よりスーパーコンピュータシステムをはじめとした各種システムを、解析・予測といった気象業務に活用してきた。
同庁では、現行システムの老朽化に伴い、気象予測精度のさらなる向上を図るべく新しいスーパーコンピュータシステムの導入に着手。高帯域幅メモリ「HBM(High Bandwidth Memory)」を搭載するインテル® Xeon® CPU マックス 9480 プロセッサーを採用した新システムの運用を2024年3月5日から開始している。
本稿では、異常気象により激甚化している災害への対策として新システムが担う役割と、国民の安全に寄与するスーパーコンピュータシステムにおけるインテル® Xeon® CPU マックス9480の導入メリットについて、気象庁 情報基盤部の千田 雅史 氏、雁津 克彦 氏、中森 審 氏に話を伺った。
ベンチマークテストで高得点を獲得
国民の生命財産を災害から守るため、適切な情報提供を任務とする行政機関である気象庁では、気象や気候、地震、津波、火山といった自然現象を監視・予測し、それらに基づき情報を発信することで防災・交通安全・産業興隆などに寄与してきた。気象庁 情報基盤部 情報政策課 情報通信システム企画官の千田 雅史 氏は、気象業務における情報システムの役割について、次のように説明する。
「気象庁では、気候変動から台風・集中豪雨、地震・津波・火山活動まで、多様な自然現象を監視し、予測情報を発信するために数多くの情報システムを活用しています。そのなかで根幹を成すシステムの1つがスーパーコンピュータシステムとなり、国民の皆様を災害から守るための情報を提供するうえで重要な役割を担っています」(千田氏)
スーパーコンピュータシステムの企画・整備・運用を担当する気象庁 情報基盤部 情報通信基盤課の中森 審 氏は、「防災気象情報の発表や気候変動等の監視・予測を行うための数値予報をスーパーコンピュータ上で実施しています」と説明。台風情報、気象警報、注意報などの防災気象情報は、24時間365日休みなく発表しなければならず、その基盤となるスーパーコンピュータシステムには、性能だけでなく信頼性、可用性が求められると運用上、重視しているポイントを語る。
同庁では、以前のスーパーコンピュータシステムが運用開始から6年経ち、経年劣化が進んでいたこともあり、新システムへの切り替えに着手していた。システム更新にあたっては、既存システムで運用している数値予報モデルが、同等以上の速度で実行できることが必須要件であり、価格のみで評価する一般的な入札方式とは異なり、価格だけでなく技術面も勘案して調達を行う総合評価方式が採用されたそうだ。
「防災気象情報の発表は遅れが許されないため、実際に運用している数値予報モデルを使ったベンチマークテストを主要な評価項目としています。また前システムを運用しているなかで、性能のボトルネックがメモリバンド幅にあることが見えていたため、この部分を改善できるシステムを提案いただいた際に、総合評価方式のなかで効率的に加点されるようなベンチマークテストで調達を進めました」(中森氏)
スーパーコンピュータシステム上で実行しているプログラムを開発・管理している気象庁 情報基盤部 数値予報課 プログラマーの雁津 克彦 氏も、性能面に加えて可用性を重視したと評価項目について言及する。
「気象庁のシステムは絶対に止めてはならないもので、高い信頼性が求められます。スーパーコンピュータシステムは多数のノードで構成されていますが、たとえばノードに障害が発生したときにプログラムをスムーズに再実行できるのか、またシステムを構成する部品や ネットワーク経路に関しても二重化して可用性を担保できているのかなど、いわゆる“落ちないスパコン”であることを重視して調達を行っています」(雁津氏)
前システムから12倍強の高帯域幅メモリ「HBM」を採用し、少ないノード数で所定時間内の計算を実現
このように総合評価方式で調達が進められた気象庁の新しいスーパーコンピュータシステムでは、インテル® Xeon® CPU マックス 9480 プロセッサーが導入された。雁津氏は、結果として落札に至った加点要因としてHBM(High Bandwidth Memory)を採用したプロセッサーであったことを挙げる。
「気象予測の計算に用いるプログラムでは、メモリバンド幅が重要となります。今回導入したインテル® Xeon® CPU マックス 9480搭載の新システムでは、ノード当たりで合計メモリバンド幅3,280.0GB/sのHBM2eメモリを搭載し、従来のシステム(メモリバンド幅255.9GB/sのDDR4メモリ)と比較し12倍強のメモリバンド幅向上を実現しています。HBMを搭載していたことが、非常に大きなアークテクチャ上の加点要因になったと考えています」(雁津氏)
システムの更新にあたっては、従来のシステムでもインテル製CPUが採用されていたこともあってスムーズにプログラムを移植できたそうだ。雁津氏はこれに対し、「前システムでもインテルのSIMD型演算用拡張命令セット「AVX-512」を利用して高速化を図っており、インテル® Xeon® CPU マックス 9480プロセッサーでもAVX-512が使えたこと、さらに従来使っていたインテルのコンパイラと高い互換性があるoneAPIが導入されていたことで、比較的容易に移行することができました」と解説する。
防災気象情報のための数値予報モデルでは、定められた実行時間内で処理を完了することが重要であると同時に、新たな開発成果を導入するためのノード確保として、新システムへの移植にあたっては“所定時間内の計算を維持しつつ少ないノード数で実行する”ための最適化が図られている。ここでもHBMを採用することで高いメモリバンド幅を実現したインテル® Xeon® CPU マックス 9480プロセッサーの導入効果が現れているという。
「モデルによっては1/4程度のノード数で所定時間内での計算を終えることができています。新旧のシステムを比較するとノードあたりの演算性能が2倍強、ノードあたりのメモリバンド幅が12倍強となっており、演算性能もそうですが、メモリバンド幅の向上が効率化に寄与していることは間違いありません。もちろんベンチマークテストの時点である程度の結果は見えてはいたのですが、実際にさまざまなプログラムを移植してみて、期待以上の性能が出ていることが確認できました」(雁津氏)
新しいスーパーコンピュータシステムの導入によって利用可能となった計算資源(ノード)は、新たな開発、新たな業務に利用できるとして、雁津氏は気象庁の使命である“気象業務の健全な発達”を実現するうえで極めて有効な新システム導入であったと、その手応えを話してくれた。また、続けて中森氏も「システムの整備・運用に携わる立場としては、安定稼働が非常に大切ですが、安定性・可用性の面でも新しいスーパーコンピュータシステムに満足しています」と新システムを高く評価している。
線状降水帯予測の精度向上にも貢献、今後は局地モデルの高解像度も目指し、国民を災害から守るために情報を届ける
2024年3月5日に運用を開始した新しいスーパーコンピュータシステムは、すでに予測精度の向上をはじめ、気象業務の健全な発達に資する効果を生み出している。気象庁では今回のスーパーコンピュータシステムに先がけ、線状降水帯予測スーパーコンピュータの運用を以前より開始しており、2系統のスーパーコンピュータを連携させることで、従来のシステムと比較し約4倍の計算能力を実現。水平解像度2kmの数値予測モデルとなる「局地モデル」の予報時間を10時間から18時間に延長し、府県単位で半日前から線状降水帯による大雨の可能性を伝えられるようになったという。
「新しいスーパーコンピュータシステムは、1年前に運用を開始した線状降水帯予測スーパーコンピュータの計算に必要な元データの作成を担っており、線状降水帯予測の精度向上に寄与しています。半日程度先の降雨状況を精度よく予測できるようになったことで、住民の皆様の安全確保により貢献できるのではないかと期待しています」(千田氏)
雁津氏は、新しいスーパーコンピュータシステムの性能を活かしつつ、連携する線状降水帯予測スーパーコンピュータを活用し、今後は局地モデルの高解像度化を図っていきたいと話す。
「現在は水平解像度2kmで運用していますが、これを1kmに高解像度化していくことを計画しています。さらにメソモデルや全球モデル等で導入しているアンサンブル予報(異なる初期値を多数用意するなどして多数の予報を行い、平均やばらつきの程度といった統計的な情報を用いて気象現象の発生を確率的に捉える数値予測の手法)を、局地モデルにも導入していきたいと考えています」(雁津氏)
高い演算性能を持ち、高速なメモリ転送を可能とするHBMを備えたインテル® Xeon® CPU マックス 9480プロセッサーを採用したことで、前システムと比較してはるかに少ないノード数で所定制限時間内の計算が実行可能になり、より高精度な数値予報の実現に向けた開発に取り組む基盤を得た気象庁。今後のシステム更新では、より広帯域幅で、最大メモリ容量が多いプロセッサーを採用し、さらなるパフォーマンス向上を目指していきたいと雁津氏は今後の展望を語り、インテルに対する期待を口にする。
「地球の大気状態を計算する気象システムでは、大容量のメモリを搭載しなければ十分なパフォーマンスを発揮できません。膨大なデータを同時に扱うには、より広帯域幅で大容量のメモリを使えるプロセッサーが不可欠です。またCPUとは直接関係しないところかもしれませんが、大容量のデータを扱い、ノード間通信も多いスーパーコンピュータシステムでは、I/O性能も重要になります。インテルさんには、演算性能だけでなくメモリやI/O性能も含めて総合的に高い性能を備えたシステムを構築できるプロセッサーの提供を期待しています」(雁津氏)
今回のスーパーコンピュータシステム更新プロジェクトは、“限られた資源で制限時間内に計算する”という要請もあり、インテル® Xeon® CPU マックス 9480プロセッサーのポテンシャルを最大限に引き出した事例となっている。国際連携の強化や民間事業者へのデータ提供も視野に入れ、新しいスーパーコンピュータシステムの活用範囲拡大を目指す気象庁の取り組みには、今後も注視していく必要がありそうだ。
関連リンク
[PR]提供:インテル