これらのArmアーキテクチャのプロセサを使うサーバの発表が相次いでいる。次の図は、ArmのHensbergen氏の発表スライドであるが、フランスのAtos(2014年にBullを買収した)はSequana X1310というHPCサーバでThunderX2を採用したモデルを出し、HPEはArm Research SummitでThunderX2を搭載するアーリーアクセスのサーバを見せた。このHPCサーバは、今回、Apollo 70という名称で発表された。
CrayはXC40に続く製品として2016年にXC50を発表した。そして、SC17でThunderX2プロセサを使うXC50のモデルの追加が発表された。Crayの製品であるので、Xeonを使うモデルと同様のソフトウェアがArmアーキテクチャのモデルで提供されることになる。
英国の4大学が連携したGW4 Allianceが、英国気象庁とCrayと協力して、XC50ベースのIsambardと呼ぶスパコンを開発している。次の図の右下の筐体に写っている人物が、Isambard Kingdom Brunel氏である。同氏は産業革命時代の偉大なエンジニアで、鉄道や蒸気船などを開発した人物である。
次の写真は、SC17で展示されていたThunderX2プロセサを搭載するCrayのXC50用のブレードである。
次の写真は、Gigabyte社のThunderX2搭載のサーバボードである。
次の図はSandia国立研究所のArmプラットフォームのロードマップで、現在はThunderX1を使うSullivanスパコンが退役し、量産前のThunderX2ベースのMayerスパコンに移行する状態である。そして2018年度には量産版のプラットフォームのVanguardに移行する計画である。
そして、Armは、HPC向けに富士通と共同で開発したScalable Vector Extension(SVE)を推進している。SVEでは、ハードウェアとしては128bitから最大2048bitの長さのベクトルを選択することができる。しかし、ソフトウェア的にはハードウェアのベクトル長と無関係に任意の長さのベクトルを処理することができるというように工夫されている。したがって、ハードウェアのベクトル長が異なるマシンにプログラムを持って行っても、プログラムをリコンパイルする必要はなく、そのままで動作する。
そしてArmは、アクセラレータやメモリを高速で接続するCCIX(Cache Coherent Interconnect for Accelerators:シーシックス)のメンバーであり、CCIXを推進している。CCIXを使えば、アクセラレータのキャッシュとメインCPUのキャッシュのコヒーレンスが保たれ、使い勝手が向上する。
また、Armはパートナーやコード開発者に働きかけ、コードの移植や共通ライブラリ、ツールやアプリケーションのArmプロセサ向けの最適化をサポートしている。
次の図は、最近のArmからのHPC向けツールの提供をまとめたものである。2015年のSC15ではBLAS、LAPACK、FFTの最適化されたライブラリの提供を行った。翌年のSC16ではC/C++コンパイラを提供した。そして2016年12月には大手のHPCツールメーカーであるAllineaを買収した。2017年のISCではFortranコンパイラの提供を行い、SC17ではArm版のAllinea Studioの提供を開始した。
OpenHPCは、オープンソースのHPC向けのパッケージを作るコミュニティー活動である。ArmはOpenHPCのシルバーメンバであり、OpenHPC1.3.3がリリースされている。
Armの直接の活動以外にも、SCでのArm HPC User Group、ISCでのGoingArm、Arm HPC Google Group、Arm HPC GitLab pagesなどが活動を行っている。
Armはローエンドの携帯機器からスタートしたが、より高いマージンの取れるHPCマーケットにも進出しようとしている。当初はXeonの厚い壁に跳ね返されていたが、ThunderX2のような強力なプロセサが登場し、性能は互角でTCOが安いということで、HPCユーザやクラウドデータセンターに入り込むことができる状況になりつつある。また、Hensbergen氏の発表にみられるように、EnablementとCo-Design、パートナーを作り、パートナーと協力するという3本柱を強力に推し進めている。
いよいよ、IntelとArm勢との闘いの幕が上がることになりそうである。