見えない部分のレンダリングの打ち切りでエネルギー効率を改善
次にGPU(Photo22)。先ほども触れたが、Mali-T880は16個のShader Coreを持ち、各々のCoreは3つのALUと1つのLoad/Store Unit、それとTexture Unitを持つ(Photo23)。
Photo22:主に説明はMark Dickinson氏(Vice President and General Manager, Media Processing Group:右)から頂き、補足説明を左のDennis Laudick氏(Vice Prresident Partner Marketing, Media Processing Division)から頂いた |
Photo23:この図はこちらのページより抜粋 |
Mali-T860は同じく16個のShader Coreを持つが、各々のCoreは2つのALUと1つのLoad/Store Unit、それとTexture Unitの構成である(Photo24)。
Photo23:この図はこちらのページより抜粋 |
どちらも分類としては同社のMidgaldアーキテクチャに属するものとなるが、Shader Coreそのものの性能がALU比で1.5倍高速になっている訳だ。加えてプロセスの違いがある。Mali-T860は28nm HPMを使った場合に650MHz駆動で1300MTriangle/sec、10.4GPixel/secとなっている。対してMali-T880は16nm FinFET+を利用して850MHz駆動で1700MTriangle/sec、13.6GPixel/secとされる。つまり動作周波数比で30%ほど高速であり、合算すると95%ほど高速という計算になる。もちろん実際はここまで性能比は極端にはならないし、Photo18はMali-T760との比較ではあるが、概ね数字的には納得できる。
問題は40%のエネルギー効率改善の方である。これに関しては、「結果として見えない部分のレンダリングを打ち切ることで効率を改善した」(Dickinson氏)という話である。一種のAdaptive Renderingであり、古典的な方法としてはDepth Bufferを使って陰面を判断するというものだが、これはあまりに古典であり、もう少し進んだ方法を実装しているとの事。ただこの技術はこれまでずっと継続的に開発してきたもので、やっと実装に間に合ったのでMali-T880で実装したと言う話で、なので既存の他のMali-T800シリーズには含まれない技術だとの事だ。
ちなみにIn-Flight Threadの数は従来と同じ256Threadのままという話だった。また、POPの形で提供されるのはMali-T880のみで、Photo18に出てくるMali-V550/T550に関してはPOPは提供されないという話であった。
最後にInterconnet周りで言うと、Photo21からもそれとなく判るが、CCI-500の実装はI/Oコヒーレンシで完全なCPUコヒーレンシではない。なのでGPU側からCPUのキャッシュに対してコヒーレンシを保つことはできるが、CPU側からGPUのキャッシュに対してコヒーレンシは保てない(なので、もし必要ならGPU側のキャッシュをFlashする)という実装になっているとの事だ。これに関しては、完全なコヒーレンシを実現することは技術的には可能だが、必要となるコストが高くつき、しかも現状ではそうしたアプリケーションが存在しないとしており、逆にアプリケーションが出てくればそうした対応を行う事は可能という話であった。
ということでCortex-A72とMali-T880、CCI-500についての詳細をお届けした。個人的な印象でいえば、最初のライセンシにRockChipが入っており、逆にこれまで必ず名前を連ねていたSamsung Electronicsが含まれていないあたりに、なんというか時代の勢いを感じるものがある。今回北京で発表会を行った理由は、最初の4社のうち3社が中国系(MediaTekなどは台湾の会社ではあるが、同社は中国にも拠点などを置いている)ということだからだと思われる。中国系ベンダーはローエンド~ミドルレンジ向けのみ、という考えを改めるべき時期なのかもしれない。