Prosákly další detaily k AMD RDNA 3: potvrzená absence PCIe 5.0, frekvence vyšší než 3 GHz

8. 11. 2022

Navi 31, předchozí highendové GPU používající čiplety, v generaci RDNA 3

Záhada frekvencí nových GPU AMD s architekturou RDNA 3 se komplikuje. Parametry grafik uvádí nečekaně nízké takty, ale slajdy pro novináře mluví o tom, že by se mělo dosahovat frekvencí vyšších než 3 GHz…

Už před víkendem jsme referovali o odhalení prvních grafik AMD z nové generace Radeon RX 7900 a také o jejich architektuře RDNA 3. AMD ale minulý týden ještě nezveřejnilo všechno. Pod NDA dostali novináři podle všeho i další informace o GPU Navi 31, na kterém jsou Radeon RX 7900 XT a XTX založené. Včetně diagramu GPU, který teď prosákl na veřejnost a ukazuje některé další novinky, které zatím zůstávaly tajné.

Tyto informace přinesl web VideoCardz, jemuž někdo předal fotografii schématu čipu Navi 31, který AMD ukazovalo v interní prezentaci pro média. Diagram má zejména zajímavé popisky a legendu, která odhaluje ty nové podrobnosti. Větší část sice už byla zveřejněna ve veřejné prezentaci, ale zdaleka ne vše.

Tip: Rozbor GPU architektury RDNA 3: Nová CU a Media blok, akcelerace AI, DP 2.1 pro next-gen 8K monitory

AMD také nepodporuje PCI Express 5.0

První věc: blokové schéma GPU Navi 31 potvrzuje, že opravdu nebude podporovat PCI Express 5.0, protože blok řadiče dole v schématu je popsán jako „PCIE GEN 4“ (čímž se myslí PCI Express 4.0). Radeony na tom tedy nakonec budou úplně stejně jako GeForce RTX 4000, u nichž Nvidia také zůstala jen u PCIe 4.0.

Vylepšení ROP a geometrie

Minulý týden AMD podle všeho nepředstavilo všechna zlepšení přítomná v architektuře či Navi 31. V popisu diagramu lze číst novou informaci, že Navi 31 přinese o 50 % vyšší výkon geometrického engine (zřejmě proti Navi 21, tedy nejvýkonnějšímu GPU generace RDNA 2) – ten má zpracovávat 12 primitiv za cyklus. Přítomná je také nějaká funkce nazvaná Multi Draw Indirect Accelerator (MDIA). Také se měla zdvojnásobit schopnost GPU odstraňovat z výpočtů geometrie primitivy a vertexy scény irelevantní pro výsledný obraz, například protože nejsou viditelné.

Zlepšení uvádí AMD i v rasterizaci ve smyslu ROP jednotek. Je podporováno rasterizování šesti primitiv za cyklus a může být vygenerováno až 192 pixelů za jeden cyklus – obojí by mělo být zlepšení o 50 % proti Navi 21.

Co je zmiňovaná funkce Pixel Wait Sync, ještě nevíme. S ní je ale uvedená jako novinka také schopnost Random Order Opaque Exports, v jejímž případě už asi tušíme. Jde o to, že výsledky pixel shaderů je další fáze pipeline schopná přijímat v jakémkoli pořadí, takže mohou být vykonávány stylem „out of order“ a asi i paralelně, aniž by musela v pipeline být přítomná nějaká mezifronta, ve které by se řadily. Toto je potvrzení funkce, o které už mluvily před pár měsíci úniky jako o „OREO“ (Opaque Random Export Order).

Větší cache

Při prezentaci AMD veřejně sdělilo, že zvětšilo objem registrů, s kterými GPU může pracovat (soubor registrů je o 50 % větší). Nepochlubilo s už, že zvětšené jsou i cache – s výjimkou Infinity Cache druhé generace, jejíž kapacita se o třetinu zmenšila ze 128 MB na 96 MB, ale měla by mít lepší propustnost a lepší politiku plnění a nahrazování dat.

Uniklý slajd s diagramem GPU Navi 31 architektury RDNA 3 (zdroj: VideoCardz)

Slajd se schématem píše, že Navi 31 má nově o 50 % větší L2 cache – 6 MB místo 4 MB v Navi 21. Tato cache je společná pro celé GPU. L1 cache byla údajně zvětšená rovnou o 300 % na 3 MB. Zde se bavíme ale ne o jednom bloku cache, ale o součtu L1 cache. V architekturách RDNA se L1 cache nachází vždy na úrovni shader array, což je sada bloků CU – tyto shader array jsou vždy dvě v každém shader enginu. GPU Navi 21 mělo čtyři shader enginy a tím pádem osm shader array, každý se 128kB L1 cache. U Navi 31 jednak máme víc shader enginů (6) a shader array (12), ale také mají jednotlivé L1 cache zdvojnásobenou kapacitu na 256 kB. Ono uváděné 3× zlepšení je tedy součtem samotného zvětšení kapacit a zvětšení počtu těchto cache v čipu.

A zvětšená je i L0 cache. Ta je zase přítomná vždy na úrovni jednoho workgroup processoru, což jsou dvě CU, které L0 cache sdílí. V architekturách RDNA 1 a 2 měla L0 cache 32 kB, ale RDNA 3 to zdvojnásobuje na 64 kB. Navi 31 obsahuje 48 workgroup processorů (96 CU), takže celkem to dělá 3 MB celkové kapacity všech L0 cache. Vychází to na 2,4× kapacity distribuované v Navi 21 (40 WGP × 32 kB = 1280 kB).

RDNA 3 prý přece jenom má dosahovat taktů přes 3 GHz?

A na konec jsme si nechali možná nejzajímavější položku. Tedy aspoň v tom kontextu, že neoficiální úniky před odhalením RDNA 3 mluvily o tom, že tato GPU budou mít velmi vysoké frekvence, což se ale nepotvrdilo. AMD u Radeonu RX 7900 XT a RX 7900 XTX oznámilo frekvence, podle nichž to spíš vypadá, že se takty nezlepšily, pokud dokonce nejsou horší než u čipů RDNA 2 v Radeonech RX 6000. Uváděný boost Radeonu RX 7900 XTX je jen 2500 MHz, ačkoliv předběžná šuškanda si byla takřka jistá tím, že takty budou nad 3 GHz – možná o hodně.

Schéma čipu Navi 31 ale opravdu uvádí něco trošku jiného, než co jsme viděli ve specifikacích karet. Architektura RDNA 3 je podle legendy na slajdu navržená tak, že je schopná dosáhnout frekvence přesahující 3 GHz. Takže nakonec drby mohly mít nějaký reálný základ. Otázka je, proč tedy, je-li GPU schopno jít výš, toto není využité?

Specifikace Radeonu RX 7900 XTX. Takt boostu je pro něj 2,5 GHz (zdroj: AMD, via: AnandTech)

Stalo se snad, že sice čipy Navi 31 jsou schopné dosáhnout takto vysokých frekvencí, ale je to jen u malého procenta vyrobených čipů, takže nelze (aspoň zatím) vydat takový model komerčně? Nebo je to sice možné, ale spotřeba by byla neúměrně vysoká? Nebo snad GPU opravdu budou na 3 GHz boostovat, i když mají ve specifikacích boost jenom 2500 MHz? Nebo je to fungování nad 3 GHz něco, co se zrealizuje až v menších GPU s menším počtem jednotek? (Je pravda, že taková progrese frekvencí byla vidět mezi Navi 21, 22 a 23 v generaci RDNA 2.)

Nějaké odpovědi nebo náznaky odpovědí možná dostaneme, až se grafiky začnou prodávat a bude možné analyzovat průběhy frekvencí při hraní a obecně chování těchto GPU v reálu. Každopádně zatím tuto informaci o frekvenčním „potenciálu“ (nebo nenaplněném očekávání?) RDNA 3 berte spíš jako zajímavost a neslibujete si od toho, že po vydání nastane nějaké velké překvapení.

AMD pravděpodobně na prezentaci minulý týden ukázalo reálný výkon těchto grafik, takže i pokud se zjistí, že ve skutečnosti běží nad 3 GHz, už to bylo v jejich prezentovaných výsledcích téměř určitě zahrnuté.

Zdroj: VideoCardz

Vstoupit do diskuse (51 názorů)

Jan Olšan

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Témata:

Přechroupá CPU?Myslím si že tohle není jediný případ kdy CPU nechroupá a ani nedutá. Both GPUDirect RDMA and GPUDirect Storage avoid extra copies through a bounce buffer in the CPU’s memory and enable a direct memory access (DMA) engine near the NIC or storage to move data on a direct path into or out of GPU memory, all without burdening the CPU or GPU (Figure 1).https://developer.nvidia.com/blog/gpudirect-storage/

bez přezdívky

Sdílet

AMD také nepodporuje PCI Express 5.0

Vylepšení ROP a geometrie

Větší cache

RDNA 3 prý přece jenom má dosahovat taktů přes 3 GHz?

Autor článku

Jan Olšan

Témata:

Anketa

Má podle vás Mironet právo na odškodné?

Kvíz týdne

Finanční výsledky AMD: Lisa Su jde k dalšímu rekordu, kvartální tržby se blíží k 12 miliardám $

Vysněný procesor bez E-Core konečně otestován: Je Bartlett Lake nejlepší herní procesor Intelu?

Seká se vám prohlížeč? Možná za to může chyba YouTube, která sežere až 7 GB RAM

Děti si malují na obličej knír, jiné kradou občanky. Systémy pro ověření věku nejsou příliš spolehlivé

Aplikace Lidl Plus nefunguje? Tahle rychlá oprava vás zbaví problémů u pokladny

Kdy přijdou paměti DDR6? Podle výrobců nejdřív za 2–3 roky, v herních PC ale možná až v roce 2030

Video v novém formátu AV2 přehrajete i na starém mobilu nebo počítači. S Dav2d to půjde bez hardwarové akcelerace

CETIN a O2 mají vlastního transformera. Mobilní vysílač na kolech rozjede signál kdekoliv během pár hodin

Elektromobil jako pojízdné autokino: Huawei má světla, která se umí přepnout do režimu projektoru

ACE je triumf AMD nad Intelem: Prosadilo do x86 procesorů jako standard svoji akceleraci AI místo AMX

Prosákly další detaily k AMD RDNA 3: potvrzená absence PCIe 5.0, frekvence vyšší než 3 GHz

Sdílet

AMD také nepodporuje PCI Express 5.0

Vylepšení ROP a geometrie

Větší cache

RDNA 3 prý přece jenom má dosahovat taktů přes 3 GHz?

Autor článku

Jan Olšan

Témata:

Anketa

Má podle vás Mironet právo na odškodné?

Kvíz týdne

Nejnovější články

Finanční výsledky AMD: Lisa Su jde k dalšímu rekordu, kvartální tržby se blíží k 12 miliardám $

Vysněný procesor bez E-Core konečně otestován: Je Bartlett Lake nejlepší herní procesor Intelu?

Seká se vám prohlížeč? Možná za to může chyba YouTube, která sežere až 7 GB RAM

Děti si malují na obličej knír, jiné kradou občanky. Systémy pro ověření věku nejsou příliš spolehlivé

Aplikace Lidl Plus nefunguje? Tahle rychlá oprava vás zbaví problémů u pokladny

Kdy přijdou paměti DDR6? Podle výrobců nejdřív za 2–3 roky, v herních PC ale možná až v roce 2030

Video v novém formátu AV2 přehrajete i na starém mobilu nebo počítači. S Dav2d to půjde bez hardwarové akcelerace

CETIN a O2 mají vlastního transformera. Mobilní vysílač na kolech rozjede signál kdekoliv během pár hodin

Elektromobil jako pojízdné autokino: Huawei má světla, která se umí přepnout do režimu projektoru

ACE je triumf AMD nad Intelem: Prosadilo do x86 procesorů jako standard svoji akceleraci AI místo AMX

Dále u nás najdete

U EET musíte nahlásit provozovny, kde přijímáte neevidované tržby

JMHZ v praxi: Jak správně využít služby a vyhnout se chybám

Agentní nákupy startují, nakupovat budou za biliony

CreditShare míří na drobné investory, úvěry vybírá přísně

Květnové svátky a nákupy: kdy bude otevřeno?

Pracujícím důchodcům se zas bude zvyšovat penze

Končí lhůta pro elektronická přiznání za rok 2025. Čtěte souhrn všeho potřebného

Stát hodil školy přes palubu. Ty teď řeší, kde vzít na povinné plavání

Podívejte se, co asi budí šéfa Nvidie ze spaní

Na Univerzitě Karlově dupe a funí humanoid Karel

Zranitelnosti na historickém maximu, nejohroženější je Linux

Zdanění kryptoměn: kam v přiznání patří a na co dát pozor?

Lidé cupují kulturu pro všechny a bojí se o kvalitu muzeí

V Česku se budou řešit „zabijácké akvizice“

Prodal byt, aby mohl pražit. Dnes má jednu z nejlepších káv v Evropě

Vysílací rada dohlédne na youtubera Fiziho a Kluky z Prahy

Otestovali jsme za vás novou vlakovou linku z Prahy do Varšavy

Ministerstvo zvýší penze. Ale později, než se čekalo

Od televize po nákupní AI agenty: Fascinující cesta e-commerce

Ukládání dat v EU láká. Půlka českých firem by za to připlatila