Čipletové Radeony „Navi 31“ prý můžou mít až 3× víc jednotek, 15 360 shaderů

18

Příští generace grafik Nvidia GeForce RTX sice prý bude mít dvakrát lepší výkon, což byl normálně drtivý skok. ale teď máme informaci, že next-gen Radeony prý zase budou mít dokonce třikrát výpočetních jednotek. Kdo bude mít vyšší výkon, teda zdaleka není uzavřené.

Nedávno jsme tu měli zprávu, že příští generace grafických karet Nvidia, GeForce RTX 4000, má přinést až 2× navýšení výkonu. Ani to ale nemusí stačit, aby měla jisté výkonnostní prvenství. I AMD prý totiž chystá velký mezigenerační skok. Podle aktuálních zpráv by prý mohlo Navi 31, next-gen highendové GPU s architekturou RDNA 3 zvýšit počet výpočetních jednotek až 3× proti dnešku, takže nárůst výkonu by mohl být brutální.

Dosud se na internetu objevovaly informace (nebo možná spíše dohady), že by Navi 31 mělo být čipletové GPU, které by používalo dva čiplety s výpočetních jednotkami, každý prý se 80 CU (5120 shadery), šlo by tedy o něco jako dvojici Navi 21 (Radeonů RX 6900 XT) v jednom. Čipletová stavba asi stále platí, ale nyní od twitterových leakerů přicházejí informace, že čiplety budou mít jiný počet jednotek.

RDNA 3 už bez tradičních CU, až 2×7680 shaderů?

Zatímco Navi 21 má čtyři Shader Enginy, v každém dvojici Shader Arrays a v těch pak po 10 CU (CU = Compute Unit), kde každá má 64 shaderů – celkem tedy 80 CU a 5120 shaderů. Leaker KittyYYuko ale teď uvádí, že jeden čiplet Navi 31 by mohl být místo toho šest největších stavebních bloků (Shader Enginů?) a v nich v každém 10 podbloků, takže celkově 60. ovšem jeden z těchto podbloků už asi nemusí být „CU“, má totiž obsahovat 128 (4×32) shaderů místo 64.

AMD Radeon Navi RX 5700 prezentace 26 Zdroj: AMD

Galerie: GPU architektura RDNA (Navi) a Radeony RX 5700 (prezentace na E3 2019)

Údajně by to mohlo 60 Workgroup Processorů. V architektuře RDNA 2 a RDNA se jako jeden Workgroup Processor označuje dvojice CU. Proto se nyní spekuluje, že Navi 31 a jeho nová architektura RDNA 3 by už nemusely uvádět CU jako základní stavební jednotku a tou by se místo toho stal až Workgroup Processor. Samotné shadery by v něm ale asi pořád byly organizované do jednotek SIMD se šířkou 32 (takže 32 shaderů) a vykonávaly by warpy/wavefronty o šířce 32 (takže by je jednotky zpracovávaly v jediném průchodu). Změna by tedy byla, že místo Workgroup Processoru o dvou CU, kde každá obsahuje dvojici SIMD32, bude nyní jeden Workgroup Processor se čtyřmi SIMD32.

Pokud se toto potvrdí, tak 60 WP neboli ekvivalent 120 starých CU pro jeden čiplet znamená 7680 shaderů v jednom čipletu a má-li Navi 31 být složené ze dvou, pak maximální plnotučná konfigurace pojede na oněch 15 360 shaderech. Výkon by mohl být proto velmi vysoký, není vyloučeno, že by dokonce narostl víc než 2× pro nynějším nejrychlejším Radeonům, tedy relativně více, než má být ono zrychlení u GeForce RTX 4000.

Schéma GPu Navi 21
Schéma GPU Navi 21 (Zdroj: AMD/AnandTech). Můžete vidět organizaci do čtyři Shader Enginů. Workgroup Processor (dvě CU) je označený jako „Dual Compute Unit“

Zatím pozor na predikce výkonu

Zatím je ovšem na místě opatrnost a asi by se nemělo předpokládat, že výkon těchto grafik poroste lineárně s počtem shaderů (takže by grafika s 15 360 shadery měla třikrát tak vysoký výkon jako Radeon RX 6900 XT s 5120 shadery). Jednak mohou být limitem paměti, vedle toho také TDP (spotřeba) nebo jiné architektonické „bottlenecky“, než je výkon shaderových jednotek. Ale protože jde o čipletové GPU, také by zejména škálování výkonu mohlo být horší kvůli tomuto aspektu.

Také ale nevíme, jak by případné navýšení počtu shaderových ALU fungovalo. Vzpomeňte si například na zdvojnásobení počtu FP32 jednotek v architektuře Ampere grafik GeForce RTX 3000. U těch byla druhá sada FP32 ALU přidána do pipeline, která již v Turingu a Voltě zpracovává celočíselné (INT) operace, a ačkoliv se zdvojnásobením FP32 zdvojnásobil teoretický výkon v TFLOPS udávaný „v papírech“, reálný výkon ani zdaleka nestoupl o takovýto kus. Stejné nebo podobné by to mohlo být i u reorganizace GPU, kteout prý teď chystá AMD. RDNA 3 může proto se stejným počtem jednotek dosahovat nižšího výkonu než RDNA 2. To je třeba brát v úvahu o onoho údajného highendového GPU s 15 360 shadery.

Každopádně jsou toto vše hodně předběžné informace, a tak je třeba je brát s obzvlášť dobře nafoukanou rezervou a počítat s tím, že se nakonec realita může dostavit v poněkud jiné podobě.

Schematická vizualizace GPU AMD Navi 21 s architekturou RDNA 2
Schematická vizualizace GPU AMD Navi 21 s architekturou RDNA 2 (Zdroj: AMD)

RDNA 3 je pořád plánovaná na podzim 2022

Příchod těchto GPU na trh se očekává v druhé polovině a pravděpodobně až čtvrtém kvartálu roku 2022. Vedle Navi 31, (což bude čipletové řešení s dvěma výpočetními čiplety, jak už bylo řečeno) má existovat minimálně ještě Navi 33. To by měl být buď monolitický méně výkonný návrh, nebo snad řešení s jen jedním výpočetním čipletem (který by pak mohl být společný s Navi 31 a tudíž by taková grafika mohla mít v plné konfiguraci 7680 shaderů).

Navi 33 údajně čeká tape-out v Q4 2021, zatímco tape-out čipletového Navi 31 by snad mohl být dříve. KittyYYuko uvádí ještě, že by mohlo existovat Navi 32, které by asi mělo tape-out ještě o něco později (možná v Q1 2022, takže by na trh mohlo jít třeba až v Q1 2023), ale u něj nemáme moc představu, jak velké/výkonné GPU by to bylo.

Zdroje: KittyYYuko (1, 2), VideoCardz

Čipletové Radeony „Navi 31“ prý můžou mít až 3× víc jednotek, 15 360 shaderů
Ohodnoťte tento článek!
4.9 (98.75%) 16 hlasů

18 KOMENTÁŘE

            • Nedivil bych se, že EU přijde za nějaký čas s tím, že např. GPU, který budou mít přes tolik nebo tolik W se nesmí na EU trhu prodávat 🙂

            • Take si myslim, ze to nejde. Ono staci vydat stejny HW s jinym FW, ktery spotrebu omezuje. Uzivateli uz pak jen staci stahnout a preflashovat „plnotucny“. Analogie treba s „priskrcenyma“ motorkama, ktere jsou papirove na 25kW, realne na 75. Poznat to jde jen na meraku, pro zakon je smerodatne to, co je v papirech.

  1. Já jsem hlavně zvědav, jak si to nacení. A je zajímavé, jak tyhle velké skoky ve výkonu často přichází nedlouho po příchodu nových konzolí. Vývojáři se ještě učí dělat hry pro „next-gen“ a PC už jej nechává v prachu za sebou…

    • No hlavne kdyby dnes neprogramoval kazdy, kdo ma diru do zadku, tak by treba ten kod i za neco stal a a misto plytvani vykonem a prostorem by se pekne optimalizoval SW a clovek by nepotreboval kW zdroj, aby to vse uzivil. Jenze to by pak vyvoj trval mnohem dele a tolik by se nevydelalo.
      Ale porad jeste existuji spolecnosti, ktere maji +- dobry vyvoj, kdyz teda vezmu v potaz herni spolecnosti, tak treba id Software, ktery stale produkuje dobre vypadajici hry, ktere maji stovky FPS i na mainstream HW. Takze ono to jde, kdyz se chce.

    • Ono to asi dost souvisí. Konzole přinesou vždy to nejlepší, jen v balení takovém, aby se to potichu uchladilo v TV stolku, zabalené do plastikové skříňky. Takže „plnotučné“ grafiky pak mohou těžit i technologií, které se dostaly do konzolí, jen nejsou tak omezeny spotřebou, prostorem i náklady na chlazení.
      Spolupráce AMD se Sony i MS evidentně svědčí, to je prostě vidět.

  2. tynyt 27.7.2021 at 12:21
    „Ono to asi dost souvisí. Konzole přinesou vždy to nejlepší, jen v balení takovém, aby se to potichu uchladilo v TV stolku“
    To je jasne, ale ten chladici blok v Xboxu S X je take pekny macek. Myslim, ze vyrobci konzoli omezuji i prikon, preci jen herni konzole, ktera si bere 600W, by nevypadala tak vabne, nehlede na rozmery (i treba kvuli zdroji).