進むオープンソースアプリケーションの移植

次の表はArm HPC Users Groupに公表されているアプリケーションの移植状況を示すものである。ビルド環境を多少変更する必要があるものも半分程度あるが、GCCを使った移植はすべて完了している。また、富士通コンパイラでの移植も、環境の変更やソースコードの変更を必要としたものが多いが、すべて移植ができている。

LLVMとArmコンパイラでも移植ができていないのはSiestaとCP2Kだけで、OpenMXが作業中という状況である。ということで、オープンソースのアプリケーションの移植性も良好なようである。

  • A64FX

    Arm HPC Users Groupに公表されているHPCアプリケーションの移植状況。GCCコンパイラ、LLVM、Armコンパイラ、Fujitsuコンパイラでの移植状況が書かれている。コンパイル環境の変更や一部のソースコードの変更を必要としているが、GCCとFujitsuコンパイラでは、表に書かれたすべてのアプリケーションの移植ができている

次の棒グラフは7種の代表的なオープンソースのアプリケーションの性能を、A64FX 1ソケットと24コア、2.9GHzクロックのXeon 2ソケットで比較したものである。Xeonの方を1.0に正規化しており、オレンジのA64FXの棒グラフがA64FXの性能比を示す。

この7つの棒グラフに見られるように、MPASではわずかにXeonが勝っているがそれ以外のアプリケーションではA64FXの方が1.1~1.4倍の性能となっているものが大部分であり、ABINITでは1.8倍の性能が得られている。

A64FXの性能が高い理由として、メモリバンド幅が高いことと、長いベクトルを扱えるので効率的に処理が行なえることを挙げている。

  • A64FX

    7種のオープンソースアプリケーションで、A64FX(2.2GHz) 1チップとXeon(2.9GHz) 2チップの性能比較。MPASだけはXeonの方が僅かに性能が高いが、それ以外のアプリケーションではA64FXの方が性能が高く、最大にABINITでは1.8倍の性能になっている。高メモリバンド幅と長いベクトル処理の効率が高いのが高性能の理由という

高性能でも低消費電力を実現

また、A64FXのプロトタイプ機がGreen500で1位になったように、A64FXは電力効率が高いことも大きなアピール点である。次の図はA64FXと前述のXeon 2ソケット機で、7種のオープンソースアプリケーション実行の電力効率を比較した棒グラフである。このグラフに見られるように、SPECFEM3Dの2.3倍からABINITの3.7倍まで、いずれもA64FXはXeonに比べて圧倒的に高い電力効率を示している。

  • A64FX

    前の図と同じ7種のアプリケーションを実行した場合の電力効率の比較。A64FXは、Xeonと比べて最小のSPECFEM3Dでも2.3倍、最大のABINITでは3.7倍と電力効率が高い

理研と富士通は64bitのArmアーキテクチャでビルドできるオープンソースソフトウェアを増やす努力をしており、現在、GCCコンパイラでは3,451のソフトウェアの内の2,387(69%)のソフトウェアがビルドできるようになっている。富士通コンパイラでは2,072(60%)のソフトウェアがビルドできる。X86 GCCでは2,479(72%)であり、AArch64 GCCも69%まで来ており、かなり近づいていると言える。

  • A64FX

    理研と富士通は、AArch64でビルドできるSpackのパッケージを増やす努力をしており、GCCでは69%がビルドできるようになっている。x86でも72%であり、かなり近づいていると言える。Fujitsuコンパイラでは60%でさらに努力が必要である

富岳はその名前に背かず、最高レベルの性能でアプリケーションを実行できる。そして、Armのエコシステムを利用して多くのアプリケーションを利用できるようになっている。

富士通は富岳の製造を開始しており、PRIMEHPC FX1000/FX700という商用スパコンも発表した。また、CrayがA64FXを使うCS500クラスタスパコンを発表し、A64FXの活躍が期待される。

  • A64FX

    富岳はその名前に背かず高い性能を上げている。Armのエコシステムを利用して使用できるアプリケーションを増やしてきている。また、富士通は富岳の開発に加えて、FX1000/FX700の発売を開始し、CrayもCS500にA64FXを採用した