コアとメモリシステム、インタコネクトのバランスが重要

そして、Hensbergen氏はバランスが重要であるという。米国の「FastForward IIプロジェクト」では5社が米国エネルギー省との契約を獲得したが、その1社がCrayで、ARM、Broadcomと共同でノードアーキテクチャの研究開発を行う。その中でARMはエネルギー省のアプリケーションの実行という観点から次世代アーキテクチャの評価を行う。そして、コアとメモリシステム、インタコネクトの良いバランスを検討するとのことである。

図4.36 FastForwardIIでは、ARMとBroadcomがCRAYに協力してバランスを追求する

現在、ARMはシングルスレッド性能の高い性能最適化を行ったBigコアと、電力効率を最適化した低電力のLittleコア、そしてゲームなどのグラフィック市場に最適化したGPU/アクセラレータコアを有しており、目的に合わせて最適のコアを選択することができる。

図4.37 現在、ARMはBigコアとLittleコア、そしてGPUアクセラレータコアを持っている

また、ARMからアーキテクチャライセンスを受け、独自の高性能ARMプロセサを開発している会社が何社もある。Applied Micro Circuits Corporationはその1つで、X-Gene2プロセサは同社の第2世代のARM v8アーキテクチャのプロセサであり、2.8GHzクロックで動作する8個のコアと8MBのL3キャッシュを集積している。

図4.38 Applied Micro Circuits CorporationのX-Gene2(Shadowcat)プロセサ

また、BroadcomのVulcan-1は単一スレッドではHaswellの90%の性能を持ち、ソケットレベルでは、Haswellの1.4倍程度の性能を持つという。

図4.39 BroadcomのVulcan-1プロセサ

CaviumのThunderXは2.5GHzクロックで動作するARMv8-Aコアを最大48コア集積するという高密度が目を惹く。今回のIC 2015では、Caviumのブースはもちろん、他社のブースでも何カ所か展示があり、X-Gene2やVulcanを上回るプレゼンスを発揮していた。

図4.40 最大48コアを集積するCaviumのThunderXプロセサ

ARMのパートナシップ

そして、Hensbergen氏のいうパートナシップは図4.41に集約されている。この図には膨大な数の会社が書かれており、こられの会社の力を結集して強みとするということのようである。しかし、これらの会社がExascaleという観点でどの程度役に立つのかはよく分からない。

図4.41 ARMのパートナー

メモリバンド幅がチャレンジ

そして、Exascaleという観点ではメモリバンド幅がチャレンジであるという。それも単にメモリバンド幅があるというだけでなく、メモリレーテンシや低コストも重要である。そして、データ移動のコストも気にする必要がある。これらの要素を考慮して、価格がExascale実現の主要な阻害要因にならない解決法を見つける必要があるという。

図4.42 Exascale実現のための挑戦。メモリバンド幅、それもローコストでの実現

Hensbergen氏は、最初は電力が最大の問題と指摘していたのであるが、最後になるとメモリバンド幅とその低コストでの実現が挑戦であると述べ、多少違和感のあるまとめであった。

このノードアーキテクチャのセッションでの発表では、長年、Extreme-Scaleのノードアーキテクチャに取り組んできたIntelのSekhar Borkar氏の発表が一番論理的で説得力があった。