TaChyonアーキテクチャのプロセサ

VP400スパコンの100倍以上の性能を出すには、多数のベクトル演算器が必要であり、膨大な物量になる。しかし、寸法がVP400の100倍になってしまうと、配線遅延などが多くなり、性能が出せない。富士通のVP100/200/400スパコンは汎用機のMシリーズのプロセサをベースにしており、IBM 360アーキテクチャの命令セットを使っていた。しかしIBM 360命令セットは複雑で、多くのハードウェアを必要とするので、スパコン用に「TaChyon」という新規な命令セットを考案して、使用することにした。

TaChyonアーキテクチャの命令は64bit長で、この中に通常命令なら3命令を詰め込んでいる。IBM 360アーキテクチャと比較すると1.5倍の命令密度となっている。

TaChyonアーキテクチャとすることにより、命令実行ユニットが簡素になるだけでなく、命令キャッシュに格納できる命令数も1.5倍となるので、有利である。

また、通常のRISCのOut-of-Order実行では、リオーダバッファを使ってプログラム順に命令を実行したのと等価な状態を実現している。これに対して、TaChyonアーキテクチャのプロセサでは、何らかの原因で実行できない命令の後にある命令でも、実行ができる命令であれば実行を行ってしまう。そして、割り込みなどが発生した場合は、割り込み処理の後に実行し残した命令を実行するという方法をとっている。

割り込みが発生した時のプロセサ状態はプログラム順に命令を実行した場合とは異なる、いわゆるImpreciseな割り込みであるが、どの命令の実行を飛ばしたかを記憶しており、それらの命令は割り込み処理後にハードウェアが実行してくれるので、正しく実行を続けられるようになっている。リオーダバッファを使う方式に比べて必要なハードウェア量が少なく、プロセサを小さく作ることができるという。

テクノロジオンパレードのプロセサボード

そして、プロセサを小さく作るには高密度のLSIを使うことが重要である。しかし、高性能を実現するためには、高速のLSIが必要ということで、適材適所でテクノロジを使い分けている。

密度が重要な部分は72,000ゲートのBiCMOS LSIを使用した。ゲート遅延は200psである。また、BiCMOSのメモリLSIはアクセス7nsで72kbitのメモリと24,000ゲートを集積している。

超高速を必要とする部分はGaAsのロジックLSIを使用した。25,000ゲートの集積度でゲート遅延は60psである。そして、高速のメモリを必要とするところは、ECLのLSIを使用した。ゲート数は15,000ゲートでゲート遅延は70psとGaAsよりは少し遅かった。メモリLSIは容量64kbitでアクセス1.6nsで、それに3,500ゲートが使えた。

  • NWT

    NWTのプロセサボードのLSIテクノロジの使い分け。青がGaAs、黄緑色がECL、赤がBiCMOSである (出典:2011年に開催された三好甫先生記念計算科学シンポジウムにおける広島市立大学の北村名誉教授の発表スライド)

当時、富士通でNWTの論理設計に従事した北村氏は、GaAs-LSIは期待と泥沼と書いている。CrayがCray-3をGaAsで作ると発表したことから、富士通も負けじとGaAsロジックの採用を決断し、山梨にGaAs専用の半導体工場を作ったのであるが、当時は、作れども作れども不良品の山であったようである。NWTのパワーオン時には140枚のプロセサボードを集める必要があり、大変、苦労したようである。

なお、CrayもGaAs LSIには苦戦していたようで、結局、4プロセサのシステムの内の3プロセサしか動かせなかった。そして、会社が傾き、結局、CrayでGaAsシステムが商用化されることは無かった。一方、1997年6月のTop500リストでは、NWTを商用化した富士通のVPP500とその後継機が33システム載っており、その内の11システムはGaAs LSIを使うVPP500である。富士通はGaAsマシンを立派に商用化した。

しかし、VPP300とそれ以降のマシンではロジックはCMOSになっており、GaAs LSIが使われたのはNWTを商用化したVPP500マシンだけである。

それで山梨のGaAsファブは仕事が無くなってしまったのであるが、幸運にも、そのころ、TVの衛星放送が始まり、衛星放送受信機の低雑音増幅器などにGaAsトランジスタが使われ始めGaAs工場は息を吹き返した。その後、住友電工との合弁になり、現在(2020年2月時点)は住友電工デバイス・イノベーション株式会社の一部になっている。

(次回は3月6日に掲載します)