PEZYグループの野望
このZS-2ノード256台を1つの液浸槽に収容すると、ピーク性能は2PFlopsとなる。仮に、ピークの75%のHPL性能が得られると想定すると、Rmax性能は1.5PFlopsとなる。そして、20GFlops/Wの電力効率が得られると考えると、67台の液浸槽で100PFlopsのシステムが構成でき、消費電力は5MWとなる。
米国の次世代スパコンである「Aurora」や「Summit」は2018年には稼働すると見られる。また、中国の天河2号のGPDSP強化版は2016年に出てくると見られるが、ピーク性能で100PFlopsと言われている。つまり、2017年にZS-2.0の70液浸槽のシステムを稼働させられれば、Top500の1位を取れる可能性がある。もちろん、これは非常に楽観的な予想であり、開発費をどうやって調達するのか?、5MWのシステムをどこに設置するのか?、年間5~10億円の電気代などの運営費をどうするのか? などにめどがついているわけではない。
100PFlopsの次はExaFlopsである。これには10nmあるいは7nmプロセスを使う8192コアの「PEZY-SC3」を開発して対応する。1液浸槽に512ノードを収容し、Rmax 8PFlops、40GFlops/Wのエネルギー効率を目指す。これを125液浸槽並べると、1ExaFlops、25MWのシステムができる計算である。このPEZY-SC3チップを2018年に作り、2019年11月には全系を動かして、世界でExaFlops一番乗りを狙う。
この時期のExaFlopsマシンの実現は国家プロジェクトのレベルであり、私企業の手に負えるプロジェクトかという懸念はあるが、齊藤社長の話を聞いていると、あながち不可能ではなく、実現できそうにも思えてくる。
さらに、2020年頃には5nmプロセスを使い、16Kコアで50TFlopsの「PEZY-SC4」を開発する。メモリバンド幅はTCIをさらに高速化し、25TB/sとする。このチップで100GFlops/Wを目指す。これができると、PEZY-SC4を2個搭載したPCIeボード1枚で100TFlops、消費電力は1kWとなる。こうなれば、1PFlopsのマシンが10枚のPCIeボードででき、研究者が個人で使えるマシンになる。また、ExaFlopsのスパコンを10MWで動かせる。
齊藤社長は、このようなスパコンが出てくれば、エネルギー問題、資源問題など現在の重要な問題の解決に大きく貢献し、前特異点を作り出すことになるという。
最近、DeepMindのAlphaGoが碁の5番勝負で、世界トップレベルのプロ棋士である李世ドル氏と対戦して勝ったという記念すべき出来事があったが、Deep Learningを使って、大局感を持つようになったことが大きく貢献していると言われる。自動運転などでもこのような総合的な分析にDeep Learningが使われ始めており、Deep Learningが大ブレークしそうな気配である。
このような情勢から、齊藤社長は、Deep Learning向けの新しいハードウェアの開発にも興味を示している。Deep Learningでは、PEZY-SCのような倍精度浮動小数点演算は必要なく、単精度、あるいは半精度、場合によってはビット演算でも良い演算もある。低い演算精度であれば演算器の面積や消費電力を減らすことができ、搭載する演算器の個数を増やしてDeep Learning演算の性能を上げることができる。
そして、メニーコアプロセサ技術、磁界結合技術、大容量・広帯域メモリ技術、液浸冷却技術のそれぞれを有機的に活用することで、まったく新しい桁外れのDeep Learning演算用ハードウェアが開発できる可能性があるという。このアプローチで、現在想定されているのとはまったく別次元のDeep Learning処理の応用を、どうやら想定している様である。
PEZYの齊藤社長の野望は止まるところを知らない。