Roadrunnerでは、2個のPowerXCell 8iチップを2個搭載したQS22ブレードを2枚と2コアのOpteron CPUを2個搭載したLS21ブレードの3枚のブレードからなるTri-Bladeが構成単位となっている。
なお、Tri-Bladeと言っているが、LS21ブレードにQS22ブレードを接続する部分にExpansion Bladeという接続用のブレードが必要であり、実際には4枚のブレードが使われている。
次の図に見られるように、QS22ブレードには2個のCell eDP(Cell extended Double Precision)チップが搭載され、Cell eDPからのFlexIOの信号をI/O HUBでPCIe x8に変換し、Expansion Blade経由でLS21ブレードのOpteronに接続している。メモリはQS22ブレードにはCell eDPのDDR2メモリが搭載され、LS21ブレードにはOpteron用のDDR2メモリが搭載されている。
LS21ブレードでは2個のデュアルコアOpteronが搭載され、2個のOpteronはHyperTransport x16で相互接続されており、キャッシュコヒーレントに接続されているが、Cell eDPはチップごとに独立のメモリ空間をもつという構造になっている。
図5はブレードの写真が載っていて実装の感じは掴めるのであるが、次の図6の方はSC 2008の発表論文であり、技術的には詳しい記述である。そして、図6ではExpansion Bladeから4xのDDR Infinibandのポートが書かれている。このポートが、後述のようにシステムのネットワークにTri-Bladeを接続するためのポートである。
そして3つのTri-bladeをBlade Centerシャシーに入れ、180セットのTri-Bladeを1台のVoltair製のISR2012スイッチでまとめる。これをConnected Unit(CU)と呼ぶ。CUからは96リンクが第2段のスイッチに接続されている。
そして、図8のように18台(本当は17台で足りる)のCUを8台の第2段のIBスイッチでまとめて全体のネットワークが出来上がる。第1段のCUから、第2段の各スイッチへの接続は12リンクである。
全体でデュアルコアのOpteronの個数は6480チップで、Cell eDPチップの個数はその2倍の12960チップである。Opteron部の演算能力は47TFlops、Cell eDP部の演算能力は1.3PFlopsである。