事前資料によるレポート基調講演のUpdateがすでに掲載されているが、いくつか判らない事に関してAMDのDavid McAfee氏(Photo01)とJack Ni氏(Photo02)にお話しを伺う機会に恵まれたので、ちょっと補足情報をお届けしたい。ちなみにZen 5ベースのRyzen 9000シリーズとかRyzen AI 300シリーズに関しては、7月の発売に先立ってTech Dayが開催され、そこで細かい情報が開示されるという事だそうで、現時点では例えばZen 5コアの内部構造の詳細といった話はまだ開示されていない。

  • おなじみDavid McAfee氏(CVP&GM, Ryzen channel business)。

    Photo01: おなじみDavid McAfee氏(CVP&GM, Ryzen channel business)。

  • Jack Ni氏(Sr. Director, AI Product Management, Making AI pervasive across AMD platforms)。

    Photo02: Jack Ni氏(Sr. Director, AI Product Management, Making AI pervasive across AMD platforms)。

Zen 5 CCDについて

まず「TurinとGraniteRidgeのCCDが明らかに別物だが、もうRyzenとEPYCでは同じダイを共有するポリシーは止めたのか? という質問に対しての返事がなかなか示唆的だった。曰く「Zen 4世代でもGenoaとBergamoは異なるダイを利用していた。つまり高密度向けのダイはConsumer向け(=Ryzen)とは必ずしも共有しない」のだそうで、つまり今回基調講演で示されたTurinの192コアの製品は、Genoaの後継ではなくBergamoの後継の可能性が出てきたことになる。逆に言えば、12CCD/96coreのTurinが投入される可能性があり、これはRyzen 9000シリーズとCCDが共通という可能性が出てきたことになる。この辺に関しては詳細はTurinの出荷が近くなるまで明らかにはされない模様だ。

ちなみにRyzen 9000シリーズであるが、CCDはTSMCのN4で製造され、IODはRyzen 7000シリーズと共通のもの(製造はTSMCのN6)という話であった。

で、IODがRyzen 7000シリーズと共通ということは、内蔵されるGPUは変わらないことになるし、USB 4.0のコントローラも搭載されないし、もちろんRyzen AI Engineも搭載されない。これに関しては、そもそもRyzen AIの主目的ともいえるCopilot+に関して、MicrosoftがノートPC向けとして提供を予定しており、Desktop PCで積極的にCopilot+でどうこうという話が無い(まぁあっても対応はできないのだが)事も理由の一つとしている。というよりも、もしDesktopで必要ならIODの作り替えが必要になるが、Microsoft側からそこまで要求されなかったという事も大きな理由かと思われる。一応McAfee氏の答えは「Desktop向けは強力なGPUを搭載可能で、こちらは(NPUより)性能が高いし、消費電力枠にもゆとりがある。ノートPCの限られた電力バジェットの中でCopilot+を動かすためにNPUが必要であり、Desktopでは不要と判断された」というものだった。もっとも「Copilot+はGPUサポートしてないよね?」と確認したらMcAfee氏は嫌な顔をしていたが。

また、「Versal AI Edgeを搭載したPCIeカードをNPU Acceleratorとして提供することは不可能じゃないよね?」と確認したところ、「技術的には可能」(McAfee氏)という返事であったが、実現の可能性は薄い(というか、今のところは考えていない)ようだ。まぁVersal AI Edgeの価格を考えたらあまり現実的ではないのは理解できる。

X870/X870Eについて

開口一番言われたのは「USB 4.0はDiscreteで提供する」という話で、つまりチップセットの機能はB650/650EやX670/670Eと基本的には違わないことになる。では「何が変わったのか?」と確認したところ、X670/670Eなどを出荷してすでに2年が経過し、配線の最適化とか機能の最適化が進んだ。特にX670/670Eでは4層基板で安定して利用できるようにDesign Guideなどが改訂されたという事で、要するにより安定動作するようになった、という事らしい。ただ機能的には、USBポートやI/Oレーンが若干増えているので、まるっきりX670/X670Eと同じではないらしい。

ではX870とX870Eは何が違うかという話だが、今回の世代ではどちらもPCI Express Gen5に対応しているとのこと。ただX870Eはupstream/downstreamの2チップ構成なのに対し、X870は1チップでより消費電力を減らし、コンパクト(&多分廉価)になったという話だった。「じゃ、B650EとX870の違いは?」というと、I/Oレーンの数などとのこと。要するにB650E/X670EのMinor UpdateがX870/X870Eという事になる模様だ。

Ryzen AI 300について

Ryzen AI 300シリーズには16CUのRDNA 3.5ベースのGPUが統合されるが、「詳細はTech Dayで公開されるだろうから、簡単に違いをSummarizeして欲しい」とお願いしたところ、要するにRDNA 3.5はRDNA 3をより組み込み向けに最適化した構造、という返事が返ってきた。曰くDiscrete GPUとして使う事は考えていないため、Scalabilityは限られたものになり、また性能/消費電力比や性能/エリアサイズを(RDNA 3より)向上させたものだ、という説明であった。ただ、例えばメモリ帯域に対する性能向上などは特に施されていないそうで、純粋に統合GPU向けにむしろ物理実装に近いところで最適化を図ったもので、基本的なデザインはほぼRNDA 3から変わっていない模様だ。

またRyzen AIに搭載されるBlock FP16だが、「これはもともとOCPで決めた仕様で、ただしSiliconに実装したのはRyzen AIが最初だ」(Ni氏)とのこと。どうもOCPの"OCP Microscaling Formats (MX) Specification"に定められたMXFP8の事を指しているらしい。MXFP8はE5M2とE4M3の2種類のフォーマットが定義されており、どちらを採用しているかは不明ながら、これだとデータサイズは8bitになるのでなるほどINT8と同じ速度で動作することになる。つまりINT8とFP16を切り替えるのではなく、FP8で演算を行うことで精度を担保しつつ速度を得た、という話であった。なるほどQuantizationが必要ない訳である。

ちなみにRyzen AIの元になったVersal AI Edge Gen2のAI EngineではMX6とかMX9のサポートもあるが、Ni氏によれば技術的には動作するが、アプリケーション(この場合でいえばCopilot+とかDirectML、ONNXなど)側のサポートが必要になるので、Ryzen AIではサポートしないとのこと。またそもそもRyzen 7040→8040で10TOPSから16TOPSと60%もの性能向上を果たしているわけで、「つまりNPUには60%位のHeadroomがあるので、Ryzen AI 300も必要なら80TOPS位まで性能を上げられる?」と確認したところ、技術的には不可能ではないが、そんなことをしなくても十分高速だという返事が返ってきた。まぁRyzen 7040→8040は動作周波数を引き上げての対応であり、Ryzen AI 300のAI Engineが同じだけ動作周波数を上げられるか? というとちょっと怪しいのだが。

ということで現状判明したのはこの程度である。より深い話は7月に開催されるTech Dayで公開される模様だ。それまでの間、しばしお待ちいただきたい。