ISC 2015に見る今後のスーパーコンピューティングの方向性(4) ExaScaleシステムのエネルギーモデル(後編)

プロセサのコア面積トレンドはムーアの法則と合っていない

プロセサのコア面積であるが、微細化に伴い単純な縮小が行われる場合は面積はF²となり、図2.8の黒破線のようになるが、現実にはコア面積はF^0.66、キャッシュ面積は赤破線でF^1.2となっており、ムーアの法則には従っていないという。これは微細化に伴い、コアやキャッシュに使うトランジスタ数を増やして性能を向上させてきたためである。

図2.8 コア面積はF^0.66でムーアの法則ほど小さくはなっていない

このコア縮小のトレンドを取り入れると、図2.6は、次の図2.9のようになる。図2.6では2004年以降の電源電圧がF^0.2の場合、エネルギー/サイクルはF^1.4であったが、図2.9ではF^0.74と改善が少なくなってしまっている。

図2.9 コア面積の縮小がF²ではなく、F^0.66の場合のモデル

そして、このモデルを図示したのが図2.10であり、Fの縮小の効きがさらに小さくなっている。

図2.10 コア縮小がF^0.66の場合のエネルギーや発熱密度とフィーチャサイズの関係

今回のエネルギーモデル

これらの傾向を総合して、Fに対するコアの1サイクルあたりの消費エネルギーをプロットしたものが図2.11である。3本のグラフは下から順に、デナードスケーリングのケース、2004年以前のケース、クロック一定でコア面積をF^0.66とした2004年以降のケースに対応している。

図2.11 Fを90nmから5nmにシュリンクしたとき、現実に合わせたモデルでは理想的なデナードスケーリングの100倍のエネルギーを必要とする

図2.12のCompute Cycles/Dieはチップ全体のクロック×コア数であり、最大性能に対応している。90nmから5nmへの縮小で、デナードスケーリングが成り立っていれば、最大性能は1万倍になるが、クロック一定では60倍程度にしかならない。さらに、コア面積を現実のトレンドに合わせると、10倍弱の性能向上しか得られないという結果になる。

図2.12 現実に合わせたモデルでは、デナードスケーリングに比べて1000分の1の性能しか得られない

ExaScaleシステムの消費電力

エネルギーモデルの作成にあたって、これまでに述べたようなコアのパラメタのトレンドを用い、Fの縮小に伴う消費エネルギーをモデル化した。また、ここでは省略しているが、メモリについても同様なモデル作成を行った。

ノード間を接続するネットワークは、アクセスあたりの消費エネルギーがFに比例して低減するという楽観的仮定のケースと、消費エネルギーはFによらず一定という悲観的仮定の両方のケースを考える。

そして、システムの規模としては、現在のTop10のシステムより大規模になることを許容することとしている。

図2.13 エネルギーモデルの構成要素

このモデルを使って、2006年以降のスパコンの消費電力を計算したのが、次の図2.14である。四角の点はこれまでのTop10スパコンの値で、楽観的と悲観的なモデルによる計算値と良く一致していることが分かる。

そして、このモデルの予測では2023年ころには、1ExaFlopsのシステムは悲観モデルでは425MWを必要とし、楽観モデルでも180MWとなり、目標の20MWとは大きな乖離があるという予測になった。

図2.14 ネットワークの電力がスケールするモデルで180MW、コンスタントとなるモデルでは425MW

結論としてHeavyweightは電力が大きすぎて解にならない

結論として、無制限に開発費をつぎ込み、冷却を頑張れば、Xeon CPUのような強力なプロセサを使うHeavyweightなスパコンで1ExaFlopsのシステムを作ることは可能であるかも知れない。しかし、ここで述べたようなトレンドは継続し、消費エネルギーの予測値は陰鬱なものである。メモリシステムと通信に大きな問題があり、巨大な並列性をどう扱うかも難しい問題である。このため、従来のHeavyweightプロセサを使うスパコンを、スレッドを移動しないで処理を行うというやり方は、ExaScaleシステムの解とはなり得ない。

図2.15 結論、Heavyweightコアを使う1ExaFlopsのスパコンは、建造が可能としても消費電力が膨大であり、解とはならない

今回のエネルギーモデルの見直しは、Heavyweightを対象としたものであり、小型低電力のコアを使うLightweight型やGPUなどを併用するHybrid型については、今後の研究が必要である。

これらのアプローチはHeavyweightより良いとしても、10倍エネルギー効率の改善ができるかどうかは疑問である。このため、3Dメモリ、メモリの近くに処理装置を付けるニアメモリ処理、スレッドをデータに近いところに移動するなどを考えて行く必要があると結んだ。

図2.16 今後の研究。小規模、低電力コアを使うLightweightモデル、GPUなどを組み合わせるHybridモデルの消費エネルギーの解析が必要。しかし、10倍の改善は望み薄。3Dメモリ、ニアメモリ処理、スレッドのマイグレーションなどを検討する必要がある