Prosákly další detaily k AMD RDNA 3: potvrzená absence PCIe 5.0, frekvence vyšší než 3 GHz

52
Ilustrace GPU AMD Navi 31 1600
Ilustrace GPU AMD Navi 31
-
Zdroj: AMD

Záhada frekvencí nových GPU AMD s architekturou RDNA 3 se komplikuje. Parametry grafik uvádí nečekaně nízké takty, ale slajdy pro novináře mluví o tom, že by se mělo dosahovat frekvencí vyšších než 3 GHz…

Už před víkendem jsme referovali o odhalení prvních grafik AMD z nové generace Radeon RX 7900 a také o jejich architektuře RDNA 3. AMD ale minulý týden ještě nezveřejnilo všechno. Pod NDA dostali novináři podle všeho i další informace o GPU Navi 31, na kterém jsou Radeon RX 7900 XT a XTX založené. Včetně diagramu GPU, který teď prosákl na veřejnost a ukazuje některé další novinky, které zatím zůstávaly tajné.

Tyto informace přinesl web VideoCardz, jemuž někdo předal fotografii schématu čipu Navi 31, který AMD ukazovalo v interní prezentaci pro média. Diagram má zejména zajímavé popisky a legendu, která odhaluje ty nové podrobnosti. Větší část sice už byla zveřejněna ve veřejné prezentaci, ale zdaleka ne vše.

Tip: Rozbor GPU architektury RDNA 3: Nová CU a Media blok, akcelerace AI, DP 2.1 pro next-gen 8K monitory

AMD také nepodporuje PCI Express 5.0

První věc: blokové schéma GPU Navi 31 potvrzuje, že opravdu nebude podporovat PCI Express 5.0, protože blok řadiče dole v schématu je popsán jako „PCIE GEN 4“ (čímž se myslí PCI Express 4.0). Radeony na tom tedy nakonec budou úplně stejně jako GeForce RTX 4000, u nichž Nvidia také zůstala jen u PCIe 4.0.

Vylepšení ROP a geometrie

Minulý týden AMD podle všeho nepředstavilo všechna zlepšení přítomná v architektuře či Navi 31. V popisu diagramu lze číst novou informaci, že Navi 31 přinese o 50 % vyšší výkon geometrického engine (zřejmě proti Navi 21, tedy nejvýkonnějšímu GPU generace RDNA 2) – ten má zpracovávat 12 primitiv za cyklus. Přítomná je také nějaká funkce nazvaná Multi Draw Indirect Accelerator (MDIA). Také se měla zdvojnásobit schopnost GPU odstraňovat z výpočtů geometrie primitivy a vertexy scény irelevantní pro výsledný obraz, například protože nejsou viditelné.

Zlepšení uvádí AMD i v rasterizaci ve smyslu ROP jednotek. Je podporováno rasterizování šesti primitiv za cyklus a může být vygenerováno až 192 pixelů za jeden cyklus – obojí by mělo být zlepšení o 50 % proti Navi 21.

Co je zmiňovaná funkce Pixel Wait Sync, ještě nevíme. S ní je ale uvedená jako novinka také schopnost Random Order Opaque Exports, v jejímž případě už asi tušíme. Jde o to, že výsledky pixel shaderů je další fáze pipeline schopná přijímat v jakémkoli pořadí, takže mohou být vykonávány stylem „out of order“ a asi i paralelně, aniž by musela v pipeline být přítomná nějaká mezifronta, ve které by se řadily. Toto je potvrzení funkce, o které už mluvily před pár měsíci úniky jako o „OREO“ (Opaque Random Export Order).

Větší cache

Při prezentaci AMD veřejně sdělilo, že zvětšilo objem registrů, s kterými GPU může pracovat (soubor registrů je o 50 % větší). Nepochlubilo s už, že zvětšené jsou i cache – s výjimkou Infinity Cache druhé generace, jejíž kapacita se o třetinu zmenšila ze 128 MB na 96 MB, ale měla by mít lepší propustnost a lepší politiku plnění a nahrazování dat.

Uniklý slajd s diagramem GPU navi 31 architektury RDNA 3
Uniklý slajd s diagramem GPU Navi 31 architektury RDNA 3 (zdroj: VideoCardz)

Slajd se schématem píše, že Navi 31 má nově o 50 % větší L2 cache – 6 MB místo 4 MB v Navi 21. Tato cache je společná pro celé GPU. L1 cache byla údajně zvětšená rovnou o 300 % na 3 MB. Zde se bavíme ale ne o jednom bloku cache, ale o součtu L1 cache. V architekturách RDNA se L1 cache nachází vždy na úrovni shader array, což je sada bloků CU – tyto shader array jsou vždy dvě v každém shader enginu. GPU Navi 21 mělo čtyři shader enginy a tím pádem osm shader array, každý se 128kB L1 cache. U Navi 31 jednak máme víc shader enginů (6) a shader array (12), ale také mají jednotlivé L1 cache zdvojnásobenou kapacitu na 256 kB. Ono uváděné 3× zlepšení je tedy součtem samotného zvětšení kapacit a zvětšení počtu těchto cache v čipu.

A zvětšená je i L0 cache. Ta je zase přítomná vždy na úrovni jednoho workgroup processoru, což jsou dvě CU, které L0 cache sdílí. V architekturách RDNA 1 a 2 měla L0 cache 32 kB, ale RDNA 3 to zdvojnásobuje na 64 kB. Navi 31 obsahuje 48 workgroup processorů (96 CU), takže celkem to dělá 3 MB celkové kapacity všech L0 cache. Vychází to na 2,4× kapacity distribuované v Navi 21 (40 WGP × 32 kB = 1280 kB).

RDNA 3 prý přece jenom má dosahovat taktů přes 3 GHz?

A na konec jsme si nechali možná nejzajímavější položku. Tedy aspoň v tom kontextu, že neoficiální úniky před odhalením RDNA 3 mluvily o tom, že tato GPU budou mít velmi vysoké frekvence, což se ale nepotvrdilo. AMD u Radeonu RX 7900 XT a RX 7900 XTX oznámilo frekvence, podle nichž to spíš vypadá, že se takty nezlepšily, pokud dokonce nejsou horší než u čipů RDNA 2 v Radeonech RX 6000. Uváděný boost Radeonu RX 7900 XTX je jen 2500 MHz, ačkoliv předběžná šuškanda si byla takřka jistá tím, že takty budou nad 3 GHz – možná o hodně.

Schéma čipu Navi 31 ale opravdu uvádí něco trošku jiného, než co jsme viděli ve specifikacích karet. Architektura RDNA 3 je podle legendy na slajdu navržená tak, že je schopná dosáhnout frekvence přesahující 3 GHz. Takže nakonec drby mohly mít nějaký reálný základ. Otázka je, proč tedy, je-li GPU schopno jít výš, toto není využité?

Představení GPU architektury AMD RDNA 3 18
Specifikace Radeonu RX 7900 XTX. Takt boostu je pro něj 2,5 GHz (zdroj: AMD, via: AnandTech)

Stalo se snad, že sice čipy Navi 31 jsou schopné dosáhnout takto vysokých frekvencí, ale je to jen u malého procenta vyrobených čipů, takže nelze (aspoň zatím) vydat takový model komerčně? Nebo je to sice možné, ale spotřeba by byla neúměrně vysoká? Nebo snad GPU opravdu budou na 3 GHz boostovat, i když mají ve specifikacích boost jenom 2500 MHz? Nebo je to fungování nad 3 GHz něco, co se zrealizuje až v menších GPU s menším počtem jednotek? (Je pravda, že taková progrese frekvencí byla vidět mezi Navi 21, 22 a 23 v generaci RDNA 2.)

Nějaké odpovědi nebo náznaky odpovědí možná dostaneme, až se grafiky začnou prodávat a bude možné analyzovat průběhy frekvencí při hraní a obecně chování těchto GPU v reálu. Každopádně zatím tuto informaci o frekvenčním „potenciálu“ (nebo nenaplněném očekávání?) RDNA 3 berte spíš jako zajímavost a neslibujete si od toho, že po vydání nastane nějaké velké překvapení.

AMD pravděpodobně na prezentaci minulý týden ukázalo reálný výkon těchto grafik, takže i pokud se zjistí, že ve skutečnosti běží nad 3 GHz, už to bylo v jejich prezentovaných výsledcích téměř určitě zahrnuté.

Zdroj: VideoCardz

Prosákly další detaily k AMD RDNA 3: potvrzená absence PCIe 5.0, frekvence vyšší než 3 GHz
Ohodnoťte tento článek!
3.9 (78.95%) 19 hlasů

52 KOMENTÁŘE

  1. Je škoda, že došlo k absenci PCI e 5.0
    Sice je ta propustnost zbytečně velk a zbytečná, ale mohli to tam dát když už mají AM5 desky PCIe5.
    Co se boostu týče, tak to podle mě půjde ještě tak o 100-250MHz nahoru reálně. Známe AMD. Představuje nižší než je realita.
    3GHz budou podle mě spíš nějaké OC 3x8pin verze a připravovaná 7950XTX nebo jak se bude jmenovat, která bude hnaná na krev a bude konkurovat 4090(Ti?)

      • 😀

        Ale je fakt že dnes jak grafiky tak CPU stejně boostí podle sebe, podle aktuálních podmínek atp. Otázkou je kolik to reálně přináší výkonu, to škálování může, nemusí a většinou ani nebývá lineární, Třeba Ryzeny 6000 v laptopech, do 25-30W to má super výkon proti konkurenci, u 35W jsou na tom stejně ale když se tomu dá 40-50-60 nebo i více W tak Intel AMDčku vymete rybník protože s vyšším příkonem škáluje. Ano v laptopu vxyšší spotřeba obvykle není potřeba, ale stroje s 40-60W limity napájení nejsou ultrabooky kde se hledí na výdrž baterie ale pracovní stanice kde baterie s trochou nadsázky funguje jen jako UPSka.

        • To máš pravdu, ty Intelí AL laptopy jsou takové hlučné a horké pomalé desktopy s hodinovou UPS. Ale asi jsem vážně Intel nepochopil, proč bych měl toto chtít do laptopu. Holt honba za pomyslným prvenstvím jim nedá a evidentně marketingové ego utrpělo také.
          Ke článku, osobně se domnívám, že 3GHz už jsou tyto čipy tak vysoko, že razantně utrpí spotřeba, proto ty informace o 2,5GHz. Třeba se mýlím a budu příjemně překvapen, i když 250+W monstra nejsou nic pro mě.

    • Vždy je něco za něco. Samozřejmě jen spekuluji, ale v případě základních desek s plnou podporou PCIe-5 jsme se dostali na dost vysoké ceny základních desek, pravděpodobně právě kvůli plnohodnotné podpoře PCIe-5. Je možné, že při návrhu GPU této generace se počítalo, že tato technologie bude levnější, než je.
      Z toho mi vychází, že podpora nebyla udělána právě s ohledem na konovou cenu GPU, kde by třeba významně ovlivnila konečnou cenu GPU se skoro neměřitelným užitkem.
      Je to spekulace, ale dává mi to logiku.

          • Přesně tak, jak někde měli LTT video, blind test, 3 PCčka. SATA SSD, 3.0 NVMe, 4.0 NvMe, nechali na tom lidi dělat běžné věci, hrát a nějaká náročnější kreativita a nikdo nebyl schopný říct kde je jaký disk, někteří dokonce sestavu se SATA diskem označili za nejrychlejší… Jaký rozdíl pak bude v 5.0 disku proti 4.0 který už tak nikdo ani nepozná

            Samo pokud někdo bude mít zdroj dat ke kopírování a objem dat který to urychlí, tak samozřejmě fajn, ale mě nelimituje většinou ani ta SATA a i podřadné NVMe je pro mě overkill 🙂

            • Dedekhribb, těch testů, které dokazují malý výkonový přínos PCIe 4 oproti 3 je na Internetu poměrně dost. Mezi 5 a 4 už rozdíl není. Tedy pro GPU to význam nemá. Větší význam má PCIe 5 pro NVMe, které ale také ještě nejsou mainstream.
              Ad slot pro grafiku – já to chápu tak, že AM5 tu s námi bude cca 3 generace CPU a do té doby se situace ohledně GPU a PCIe 5 zřejmě změní, proto ta podpora PCIe 5 v rámci MB a CPU už teď.

            • Mezi 5 a 4 už rozdíl není.
              To nemůžeme úplně vědět. Z toho, že RTX 4090 už má ten 2-3% rozdíl mezi PCIe 4.0 ×8 a ×16, by mohlo vyplývat, že už by tam třeba procento mohlo být i mezi PCIe 4.0 ×16 a PCIe 5.0 ×16.
              Ale je možné, že prostě těm firmám vycházelo ekonomičtější dát tam levnější Gen4 PHY a ušetřit třeba milimetr plochy, který se pomyslně mohl „přesunout“ na konto plochy výpočetních jednotek.

    • Co by tym ziskali? K comu by to bolo dobre? Okrem PR.
      Mne to pride logicky krok. Je dobre, ze platforma/dosky su na to pripravene(ocakava sa podobna zivotnost AM5), hoci aj s cisto PCIe 4.0 prvou vlnou AM5 dosak by som nemal problem.

      • To si predsa mohli povedat i vyrobcovia dosiek. A takymto pristupom by nebol ziadny vyvoj v pred. Toto su top modely co maju tu technologiu prezentovat a nie ju ignorovat. Na setrenie je priestor pri nizsich radach tychto rivalov (i ked technicky to nie je tak jednoduche).

      • Ona je spíš otázka, proč by to ta karta měla umět? U desky to vidím jako pozitivum v tom směru, že případná grafika s PCIe 5, která bude mít jen 8 linek (nebo snad i 4?) tu sběrnici využít může. Kdežto x16 dle mého názoru nikoli.

            • No tak někdo něco na testovací konfiguraci neumí vyrobit. Je to otázka kde je špunt.

          • Dedekhribb
            Nevím, jestli to má stejný vliv jako ta sběrnice, jakože asi jo, tak vzhledem k tomu, že rozdíl u 3090 mezi PCIe3 a 4 je prakticky nulový, tak mezi 4 a 5 bude v této generaci taky nulový.

            • A to je další věc. Nemusí to být v HW ale také tím čím to testují. Testovacím SW.

            • nevím, jestli se dá nějak změřit maximální tok dat z grafiky přes sběrnici. Pokud ano, pak by se dalo měřit, jestli má u grafiky smysl dělat to či ono PCIe

            • Dá se měřit výkon s různou konfigurací PCIe, TPU to dělá. Teď jim u RTX 4090 vychází, že PCIe 3.0 ×16 (a PCIe 4.0 ×8 by mělo být totéž) ubírá v průměru asi 2% výkonu v 1440P a 4K a 3 % v 1080p. Postupně to roste, u RTX 3080 naměřili tuším jenom -1 %.
              https://www.techpowerup.com/review/nvidia-geforce-rtx-4090-pci-express-scaling/28.html

              Pokud by nové grafiky uměly PCIe 5.0, tak by se snížil propad výkonu v situaci, kdy má GPU jenom osm linek (narazili jsme na to dneska u Z790 desky při použití PCIe 5.0 SSD, kdy GPU dostane jen PCIe 4.0 ×8 a místo toho to mohlo být PCIe 5.0 ×8…).

            • Jan, jenže to je problém trochu jinde. Grafika má uvedeno např. PCIe 4.0 x 16, MB uvádí kdejaké připojení PCIe. Co je ale u MB pod čarou a malým písmem je právě to snížení linek při použití např. NVMe PCIe 5.0. To je malinko podpásovka. Ale aby to nebylo tak jednoduché, tak existují CPU (AMD APU), které jsou schopny tyto linky ještě pokrátit díky iGPU.
              Tzn. je třeba nekupovat šitózní čipsety (a MB), když vím, že chci stavět super rychlé monstrum (pokud pořizuji top grafiku, tak ji nebudu párovat s low MB, CPU, RAM a storage).

            • Jan Olšan
              Já jsem to myslel jinak. Nedokážeme změřit ono konkrétní číslo.
              Jakože spěrnice PCIe 4 x16 má jednosměrně 32 GB/s .
              Jakého čísla dokáže v maximálním využití podat ta která grafika? Je to 30? 40? 15?
              Tak jak u NVMe disků. Tam víme, že gen 3 nemůžou jít přes 4GB/s, protože spěrnice PCIe 3 x4 zvládne jen ty 4GB/s.
              Čili jaká je ona rychlost grafických karet?

              To o těch grafikách s 8 linkama jsem přesně psal. Jakmile dojde na toto „ořezání“, tak tam už má smysl mít tu rychlejší sběrnici.

            • Jo, já vím, tím jsem myslel, že se to brát jako taková nouzová náhrada – je-li pokles výkonu, tak se dá předpokládat, že aspoň někdy je to limit.
              I když je možné, že nějakaé profilovací nástroje pro vývoj her umožňují sledovat, jak moc je připojení využité..

  2. Jak všichni pomlouvali Nvidii za absenci PCIe 5.0
    ….a teď AMD xD xD

    Co se týká frekvencí, prý jde o nějaký problém v čipu, stejný problém jako před 17 lety u Radeonu X1800,
    Spekuluje se že by časem mohl vyjít refresh generace který těch 3GHz už dosáhne
    AMD nejspíš nechce jít za každou cenu na vyšší spotřebu, nejspíš by těch 3GHz ten čip dosáhl, ale za stejné spotřeby jako má Nvidie a se stejně velkým chladičem

  3. Poučení pro zavádění PCIe-6 – strčte si ho jen do workstation desek nebo do hajzlu, ale ne k normálnímu socketu.
    I pro SSD bude PCIe-5 k prdu. Lidi sotva poznají rozdíl a jen nějaký fakt náročný profík co dá jen do SSDéček min. 25 tisíc Kč to v něčem přece jenom pozná.