Ada je tu: Nvidia uvádí GeForce RTX 4090, 4080 a 4080. Až 2–4× rychlejší, ale i o 80 % dražší

20. 9. 2022

Nová architektura GPU je konečně odhalená: má novou architekturu shaderů, RT jader i Tensor jader, na druhou stranu některé novinky jí chybí. Šok jsou však ceny, které jsou hlavně u „levnějších“ modelů někde úplně jinde…

Přidat mezi oblíbené zdroje na Googlu

Nvidia měla na dnešek naplánovanou keynote na konferenci GTC 2022. Jak se všeobecně čekalo, šéf firmy Jen-Hsun Huang na této prezentaci vedle různých enterprise, AI a automobilních věcí konečně představil a odhalil nové grafiky: GeForce RTX 4090 a GeForce RTX 4080 s novou architekturou Ada Lovelace. Přijdou na trh v příštích dvou měsících, nicméně nemáme úplně dobré zprávy o cenách, které za ně bude Nvidia účtovat.

GeForce RTX 4000 je nová generace GPU i nová architektura. Ta se jmenuje po rané průkopnici programování a původně jsme o ní psali jako o Lovelace. Nicméně se zdá, že zatímco celé označení je „Ada Lovelace“, Nvidia teď většinou používá zkrácené označení Ada. Jde každopádně o jednu a tu samou architekturu, v tomto se neoficiální průsaky nemýlily. Nvidia pro výrobu čipů architektury Ada Lovelace používá proces 4N, který je upravenou verzí 4nm procesu TSMC (nebo podle některých neoficiálních zdrojů 5nm, nicméně úpravy mohou být tak dalekosáhlé, že si označení za 4nm zaslouží).

Ada (Lovelace): Nové shadery, RT jádra a Tensor jádra

Architektura přináší novou generaci bloků SM se shadery (FP32 jednotkami), čtvrtou generaci Tensor jader s podporou FP8 výpočtů (jde zřejmě o stejnou architekturu, jakou mají GPU Hopper) a třetí generaci RT jader pro ray tracing.

Ta mají údajně až 2× kapacitu pro hledání průsečíků paprsků s trojúhelníky. RT jádra třetí generace mají také nové enginy OMM (Opacity Micromap) a DMM (Displaced Micro-Mesh). První zrychluje výpočty ray tracingu s průhlednými texturami a objekty, druhý zrychluje budování BVH struktury (pomocné struktury boxů obalujících 3D struktury používané při analýze paprsků) u scén s komplexní geometrií.

Ada asi obnáší řadu různých změn pod povrchem (GPU mimochodem podporují CUDA 8.9, zatímco Ampere CUDA 8.6), ale Nvidia se zatím v prezentaci omezila na odhalení jedné důležité architektonické změny: Shader Execution Reordering (SER).

Zřejmě by mělo jít o nějakou formu schopnosti dynamicky měnit scheduling shaderů jednotlivým jednotkám SM a řadit jejich vykonání tak, aby optimálně využívaly zdroje GPU. Mohlo by tedy jít o nějakou obdobu Out-of-Order vykonávání instrukcí na procesorech. Tato technika má výrazně zlepšovat výkon shaderů (FP32 jednotek).

GPU Nvidia AD102 s architekturou Ada Lovelace, ilustrace (zdroj: Nvidia)

V této první vlně Nvidia oznámila dvě, respektive spíš tři modely grafik nové generace:

GeForce RTX 4090

Špičkou nabídky je GeForce RTX 4090, která by měla být založená na největším GPU generace Ada Lovelace, AD102, nicméně nemá jeho plnou konfiguraci. Podle Nvidie čip AD102 obsahuje 76,3 miliard tranzistorů a přes 18 000 jednotek FP32 (mělo by jít o 144 bloků SM, takže přesně 18 432 shaderů, 576 Tensor jader a 144 RT jader). Dokáže s nimi vyrobit výkon v FP32 výpočtech až 90 TFLOPS. Plocha křemíku je 608,4 mm².

V GeForce RTX 4090 je tento čip ale osekaný na 16 384 shaderů (128 bloků SM) a uvádí se pro ni teoretický výkon „jen“ 83 TFLOPS. Jejich takt je 2,23 GHz v základu a boost je uváděn 2,52 GHz, přičemž reálně asi GPU poběží výš. Podle Nvidie se „v laboratořích“ podařilo GPU Ada přetaktovat nad 3,0 GHz, ale nevíme, zda je řeč o čipu AD102 a zda to bylo prakticky použitelné.

Nvidia GeForce RTX 4090 Founders Edition (zdroj: Nvidia)

Karta používá plnou 384bitovou sběrnici čipu AD102 a na ní nese 24 GB paměti GDDR6X, která by měla mít frekvenci 21,0 GHz efektivně, a tím pádem propustnost 1008 GB/s. GPU má 176 ROP a 72 MB L2 cache.

Tato grafika bude mít výchozí TDP 450 W jako GeForce RTX 3090 Ti (ale OC karty ho asi mohou mít zvýšené). Proti té je podle Nvidie tato karta rychlejší až 2–4×, nicméně ten čtyřnásobek asi platí pro nějaký vybraný netypický případ, bližší typickému výkonu asi bude ten údaj 2×. Ovšem pozor, Nvidia zřejmě také tyto údaje zakládá na testech ve hrách s aktivním upscalingem DLSS, takže pozor na to, že v nativním rozlišení by to mohlo být jiné. Jako obvykle pamatujte, že jde o oficiální výsledky, které mohou být selektivní nebo jinak ovlivněné. S „děláním obrázku“ proto raději počkejte na nezávislé recenze.

Nvidia GeForce RTX 4090 Founders Edition (zdroj: Nvidia)

Ty nejsou tak daleko, protože podle Nvidie bude GeForce RTX 4090 vydaná 12. 10., tedy za tři týdny. Karta bude nabízená v nereferenčních verzích různých výrobců, ale i v provedení Founders Edition přímo od Nvidie, které můžete vidět na obrázcích. Jde o tříslotovou kartu se stejným principem chlazení, jaké je u RTX 3090 a 3090 Ti, ale ventilátory jsou větší.

RTX 4090 používá napájení 16pinovým konektorem ATX 3.0 / 12VHPWR, který musí dodávat alespoň 450 W. Volitelně je ale možné použít adaptér ze tří klasických osmipinových konektorů. Doporučen je 850W zdroj a lepší.

Tip: 660W spotřeba realita? Nereferenční karta GeForce RTX 4090 má čtyřslotový chladič, 13 heatpipe

Nepotěšující je cena. Jen-Hsun Huang oznámil, že za tento model zaplatíte v referenční verzi 1599 dolarů, tedy ještě víc, než stála při uvedení top karta minulé generace Ampere (RTX 3090). U nás to nyní s DPH vychází na 47 800 Kč / 1941 €.

Představení Nvidia GeForce RTX 4090 (zdroj: Nvidia)

GeForce RTX 4080 16GB

Nvidia rovnou oznámila druhý model v řadě, ale jak už prosáklo dříve, ve skutečnosti jsou to modely dva. Lepší z těchto karet je „GeForce RTX 4080 16GB“. Nebylo to řečeno oficiálně, ale je zřejmě založená na dalším čipu, AD103. I zde Nvidia uvádí podobné zrychlení 2–4×, ale proti GeForce RTX 3080 Ti opět asi počítejte s tím, že typicky bude výsledek na spodní straně tohoto intervalu.

Tato 16GB verze GeForce RTX 4080 má 9728 shaderů (76 SM), které běží na podobném taktu jako u vyššího modelu – oficiálně je to 2,21 GHz v základu a 2,505 GHz v boostu.

Tato karta má 256bitovou paměťovou sběrnici s 16 GB paměti GDDR6X. Dle neoficiálních informací ale již na taktu 22,4 GHz efektivně, což jí dává propustnost 716 GB/s (to je přes 90 % propustnosti GeForce RTX 3080 10GB). Použité GPU má 64MB L2 cache a 112 ROP.

DP této karty má být údajně 320 W a také vyžaduje napájení buď ATX 3.0 16pinem s podporou 450 W, nebo adaptérem na tři osmipiny.

I tato karta bude dostupná jak v nereferenčních provedeních, tak v referenční verzi Founders Edition s podobným chladičem o tloušťce tři sloty. Tato karta vyjde až později, má být na prodej v listopadu (novembri). Cenu Nvidia stanovila na 1199 $, to u nás momentálně znamená 35 900 Kč / 1456 €. Připomeňme, že před dvěma lety obdoba této karty (RTX 3080) měla doporučenou cenu 699 $. Zdražení je to o 71,5 %…

Představení Nvidia GeForce RTX 4080 (zdroj: Nvidia)

GeForce RTX 4070 RTX 4080 12GB

Nvidia ale bude prodávat ještě GeForce RTX 4080 s 12GB pamětí GDDR6X. Ta je nicméně asi natolik odlišná, že by asi spíše měla být nazývána RTX 4070 a fakticky jde asi spíš o třetí model v nabídce (jakým před dvěma lety byla RTX 3070 a před čtyřmi RTX 2070). Dokonce je údajně i založen na jiném čipu AD104.

GeForce RTX 4080 12GB má jen 7680 shaderů (60 SM). Jejich takty jsou asi o 100 MHz vyšší (základ 2,31 GHz, boost 2,61 GHz), to ale nedožene velkou redukci výpočetních jednotek. Také je zde problém, že se snížila nejen kapacita pamětí, ale i propustnost. GPU má jen 192bitovou sběrnici a na ní paměti GDDR6X s efektivní frekvencí 21,0 GHz, což dává propustnost 504 GB/s. Použité GPU má 48MB L2 cache a 80 ROP.

Specifikace prvních tří modelů GeForce RTX 4000 (zdroj: Nvidia)

TDP této karty je 285 W a její napájení je buď 16pinem (ovšem už stačí, aby zdroj dodával 300 W), nebo adaptérem na dva klasické osmipiny. Tato karta možná nebude mít Founders Edition verzi, ale jen nereferenční karty. Její vydání také zřejmě bude až v listopadu.

Výkon bude kvůli specifikacím výrazně nižší než u RTX 4080 16GB, nejspíš bude zhruba odpovídat postavení, které by normálně měl model RTX 4070. Proč Nvidia toto jméno tedy nepoužila? Možná proto, že i tato karta bude mít hodně vysokou cenu – firma si řekne o 899 $. Tato cena je o 80 % vyšší, než kolik stála oficiálně GeForce RTX 3070, takže o číslo vyšší označení ji asi má učinit stravitelnější. U nás doporučená částka po přidání DPH za nynějších měnových kurzů odpovídá 26 900 Kč / 1092 €.

Levnější grafiky pořád jen RTX 3000

Zbytek nabídky zatím oznámen nebyl a přijde asi až v příštím roce. Nvidia dokonce v prezentaci explicitně ukázala, že pod úrovní tří nových grafik Ada dál bude prodávat část GPU generace Ampere – modely GeForce RTX 3080, RTX 3070 a RTX 3060.

Vtírá se domněnka, zda Nvidia třeba tak brutálně zdražila oba modely GeForce RTX 4080 proto, aby ponechala prostor pro pokračující doprodávání těchto GPU generace Ampere bez toho, aby u nich musely být výrazně snížené ceny. Uvidíme, zda ji třeba později nepřinutí zlevnit konkurenční tlak od AMD, které během zhruba dvou měsíců uvede vlastní novou generaci GPU taktéž. AMD ale může prostě nasadit vyšší ceny také.

Mimochodem: leaker Kopite7kimi, který má velmi dobré interní zdroje, uvádí, že i cena RTX 4090 původně mohla být vyšší, na 1599 $ prý podle něj byla zrevidovaná až poměrně krátce před samotným zveřejněním prezentace. Tedy alespoň dle jeho zdrojů, jde ale o těžko ověřitelné tvrzení (pokud neuniknou nějaké pracovní slajdy).

Nereferenční grafiky GeForce generace RTX 4000 (zdroj: Nvidia)

Konektivita a multimediální výbava: bez DisplayPortu 2.0 a jen s PCIe 4.0, ale zase s enkodérem do AV1

GPU architektury Ada Lovelace na druhou stranu nepřinášejí některé nové věci, které byste možná čekali. Například je zachováno rozhraní PCI Express 4.0 ×16, tato GPU tedy nepoužívají pro připojení do systému PCI Express 5.0. Nemusí to nutně být na škodu, je možné, že by dvojnásobná propustnost nové generace rozhraní nepřinesla nějaké reálné nárůsty výkonu. Nvidia také úplně odebrala podporu NVLinku a SLI, už ji nemá ani nejvyšší model RTX 4090.

Co je také bez změny, je zřejmě výstup DisplayPort. Podle specifikací Ada Lovelace zatím umí jen DisplayPort 1.4a, a ne DisplayPort 2.0, nicméně i tak je podporováno rozlišení až 7680 × 4320 bodů, včetně 12-bitového HDR při 60 Hz. Rozlišení 4K je možné až při 240 Hz, ale tyto konfigurace vyžadují kompresi DSC. Výstupy HDMI 2.1a podporují 4K při 120 Hz a 8K při 60 Hz, včetně HDR.

Také hardwarové dekodéry videa jsou, zdá se, beze změny proti Ampere, Nvidia použila stejnou 5. generaci dekódovacího bloku, která však podporuje víceméně všechny relevantní formáty až po AV1 (není však podporován formát VVC).

Ovšem důležitější je, že Ada Lovelace má už nový enkódovací (komprimační) blok 8. generace (Ampere a Turing mají 7. generaci). Přesněji, tyto enkodéry jsou na GeForce RTX 4080 i RTX 4090 dokonce dva paralelní. Nová generace by mohla dosahovat lepší kvality kódovaného videa, zejména ale přináší poprvé u Nvidie podporu enkódování do formátu AV1. Není to ale prvenství, to získal Intel se svými GPU Arc.

Zdroje: Nvidia (1, 2, 3), VideoCardz (1, 2)