2016年6月のTop500において、Tianhe-2に代わって1位の座に就いたのは、中国の「Sunway Taihulight(神威・太湖之光)」スパコンである。
前世代の天河2号(Tianhe-2)は汎用プロセサとしてはIntelのXeon E5-2692(2.2GHz、12コア)を使い、計算コアとしてはIntelのXeon Phi 31S1Pメニーコアプロセサを使っていた。
しかし、米国は、中国にこのXeon Phi 31S1Pを軍事目的などに使用してはならないという条件で輸出を許可したのであるが、Tianhe-2スパコンを目的外の用途にも使っていると非難し輸出を禁止した。中国はTianhe-2のXeon Phiプロセサを後継チップにアップグレードして、次期スパコンを開発する計画であったが、Xeon Phi 31S1Pの後継チップを米国から輸入できなくなり、計画の変更が必要になった。
そして中国は自力でメニーコアの計算エンジンを開発することに路線を変更した。このため、中国の次期スパコン計画は2年程度遅れたが、中国はメニーコアの「SW26010」チップを開発し、神威・太湖之光スパコンを完成した。そして、2016年6月のTop500において1位を獲得した。このスパコンは無錫市の中国国家スパコンセンタに設置された。
米国がスパコンプロセサの禁輸を行っても、結局、中国の自主開発を促進するだけという見方は当初から指摘されていたが、やはり中国はNational Research Center of Parallel Computer Engineering & Technology(NRCPC)でSW26010というプロセサを独自開発した。
図1に示すように、SW26010には4つのグループがあり、各グループには8×8個のコアと64KBのスクラッチパッドメモリを持ち、各グループはメインメモリインタフェース(MC)とMPE(Management Processing Element)を持つという構造になっている(なお、図1にはMaster Coreブロックがあるが、Master CoreはDongarra教授のレポートでは出て来ず、図1のMaster CoreはMPEを含んだ階層ではないかと思われる)。
なお、各コアは256bitのベクタエンジンを持ち、64bitの倍精度浮動小数点数を8演算/cycleで演算できる能力を持っていた。
図1のMPEはユーザモードとシステムモードの両方をサポートする64bit RISCコアで256bitのベクタ命令演算命令をサポートする、そしてMPEは32KBのL1命令キャッシュ32KBL1データキャッシュと256KB L2キャッシュを持つ汎用ハイエンドプロセサコアである。
一方、CPEは256bitのベクタ命令処理、16KBのL1命令キャッシュと64KBスクラッチパッドを持っている計算処理に特化したプロセサコアである。なお、CPEはデータキャッシュを持たず、スクラッチパッドメモリを使っているので、そのメモリの使用はソフト管理となるので、有効使用は難しそうである。