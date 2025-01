Když Nvidia minulý týden triumfálně odhalila novou generaci grafik, prakticky u všech modelů od nejvyšší GeForce RTX 5090 až po relativně (na poměr grafik Nvidia) levnou GeForce RTX 5070 říkala, že jsou dvakrát výkonnější než předchozí modely stejného číslování z generace RTX 4000. GeForce RTX 5070 dokonce na CES Jen-Hsun Huang prezentoval tak, že má výkon dosavadního highendu za 1599 $, GeForce RTX 4090. Mělo to ale háček.

Tato čísla byla založená na tom, že benchmarkované hry na nových kartách používaly DLSS 4 s vícenásobným dogenerováním snímků, zatímco u modelů generace RTX 4000 ne. Tato technika doplní do výstupu hry tři uměle interpolované snímky na každý snímek, který GPU opravdu ve hře vykreslí (čili 75 % uměle interpolovaných snímků), zatímco DLSS 3.x na grafikách GeForce RTX 4000 přidává jen jeden. Ve skutečnosti to tedy není dvojnásobný výkon, ale dvakrát více snímků po generování, což při trojnásobku umělých snímků nakonec v podstatě znamená, že reálných snímků je pořád stejně.

Byla tedy dost otázka, o kolik se zvýšil reálný výkon GPU bez tohoto v podstatě softwarového triku. V článku k odhalení karet už jsme zkoušeli z grafů Nvidie (které nebyly popsané) vyčíst, o kolik stoupne výkon v těch hrách, které DLSS 4 nepoužívají oproti těm, kde je ono vícenásobné generování FPS aktivní, a v nichž Nvidii vycházejí ty nárůsty přesahující 2×.

Firma teď sama ukázala víc benchmarků, mezi nimiž jsou i nějaké hry bez DLSS 4, takže dávají lepší představu o reálném rozdílu ve výkonu generace Ada Lovelace a Blackwell – je to ve hrách Resident Evil 4 a Horizon Forbidden West. První z těchto her používá ray tracing a druhá z her zase DLSS (byť ne DLSS 4 s vícenásobným generováním FPS). Je teoreticky možné, že výkon nových GPU při použití těchto technik se zlepšil více (nebo méně), než kolik by se naměřilo ve srovnáním bez nich, jak se říká v čistě rasterizační hře. To uvidíme až po recenzích.





Zajímavý ještě na grafech od Nvidie může být výkon v programu DaVinci Resolve, který by také mohl izolovat výpočetní výkon od vlivu věcí jako je DLSS 4. Výsledky v testu „Generative AI“ reflektují to, že Blackwell poprvé podporuje AI výpočty s datovým typem FP4, který automaticky dává 2× výkon, než výpočty v FP8, které jsou zřejmě použité u GPU generace RTX 4000.

GeForce RTX 5090: + 33 %

GeForce RTX 5090 by podle těchto grafů měla mít „čistý“ nárůst výkonu zhruba o nějakých +33 % proti GeForce RTX 4090, toto je pro rozlišení monitoru 4K. To v podstatě odpovídá tomu, o kolik má více výpočetních jednotek (21 760 shaderů / 170 SM proti 16 384 shaderům / 128 SM), šířky paměťové sběrnice (512 bitů proti 384 bitům, nicméně propustnost naroste více, o tři čtvrtiny) a skoro i spotřeby (575 W proti 450 W). Cena je oficiálně vyšší o 20 %.

Oficiální benchmarky GeForce RTX 5090 proti RTX 4090 Autor: Nvidia

Neznamená to, že architektura Blackwell má horší „IPC“ (výkon na jednu výpočetní jednotku a 1 MHz frekvence) než předchozí Ada Lovelace. Je totiž možné, že RTX 5090 v zátěži jede na nižších taktech. GeForce RTX 5090 je jediná grafika nové generace, která má takto výrazně širší a větší GPU co do počtu prostředků a jednotek proti předchozí generaci. Jak ještě uvidíme, zřejmě tomu odpovídá i to, že z nové generace bude právě tato karta přinášet největší výkonnostní pokrok proti předchůdci.

GeForce RTX 5080: + 15 %

Druhý model v řadě se neopírá o takové zvětšení použitého GPU, to má stále jen 256bitovou sběrnici. Výpočetní jednotky stouply ze 76 SM / 9728 shaderů na 84 SM / 10 752 shaderů a TDP z 320 W na 360 W. Grafika má tedy v základu prostředků cca o 11 % víc (ovšem paměťová propustnost šla nahoru o 28 %).

Oficiální benchmarky GeForce RTX 5080 proti RTX 4080 Autor: Nvidia

Podle grafů Nvidie se zdá, že v Resident Evil 4 a Horizon Forbidden West má GeForce RTX 5080 nárůst výkonu proti RTX 4080 někde okolo +15 % v rozlišení 4K. Toto naopak vypadá na nejnižší mezigenerační nárůst z modelů generace Blackwell.

GeForce RTX 5070 Ti: + 20 %

GeForce RTX 5070 Ti podle těchto grafů vypadá na nárůst výkonu zhruba o +20 % proti GeForce RTX 4070 Ti (tato srovnání obecně ignorují modely Super, které také mezitím přinesly o něco vyšší výkon než první vlna karet RTX 4000). V tomto a následujícím případě už se bavíme o výkonu s rozlišením monitoru 1440p.

Oficiální benchmarky GeForce RTX 5070 Ti proti RTX 4070 Ti Autor: Nvidia

Nová grafika má ve svém GPU GB203 o šestinu více výpočetních jednotek (70 SM proti 60 SM), ale o třetinu vyšší paměťovou sběrnici a o 78 % vyšší propustnost díky GDDR7. Referenční spotřeba není o moc vyšší – 300 W proti 285 W.

GeForce RTX 5070: + 20 %

Podobně to vypadá také pro GeForce RTX 5070, kde by také mohl být nárůst výkonu zhruba o +20 % proti GeForce RTX 4070 (opět rozlišení monitoru 1440p). GeForce RTX 5070 nemá přitom o moc posílenou konfiguraci, polepšila si z 46 bloků SM (5888 shaderů) na 48 SM (6144 shaderů), což není navýšení ani o 5 %. Víc ale mohou dát vyšší takty, protože spotřeba šla o 25 % nahoru. A paměťová propustnost je o třetinu lepší.

Oficiální benchmarky GeForce RTX 5070 proti RTX 4070 Autor: Nvidia

Je třeba říct, že všechna tato procenta vyjadřující nárůsty výkonu jsou potenciálně nepřesná, protože marketing Nvidie nedodal přesná čísla, ale jen sloupečky v grafech. Tudíž údaje aplikujte určitou rezervu.

Zatím jen dílčí výsledky

Tyto výsledky jsou navíc jenom ze dvou her, takže se z nich nedá zatím vyvozovat všechno. Je možné, že po nezávislém testování ve větším množství her to bude vypadat trošku jinak. Oficiální benchmarky mohou zkreslovat obraz například tím, že se vyberou čísla z her, která vychází „nad-typicky dobře“.

Je možný i opak, tedy že Nvidia krotí očekávání tím, že neukáže ty nejlepší výsledky, aby pak v recenzích grafiky příjemně překvapily (v anglicky mluvícím světě se takové předběžné připravování pozdějšího pozitivního překvapení označuje termínem „sandbagging“, příležitostně ho ve fanouškovských půtkách můžete potkat).

Lze zmínit a asi je na to třeba pamatovat, že v předchozí sadě benchmarků ukázané minulý týden obě hry (Far Cry 6 a Plague Tale: Requiem) vykazovaly vyšší nárůsty výkonu než zde prezentované hry Resident Evil 4 a Horizon Forbidden West, až okolo + 40 %. Že by tedy realita byla někde mezi tím?

Pořád tedy platí, že na zhodnocení těchto grafik je ještě brzo a bude lepší čekat až na finální výsledky v nezávislých testech – ideálně ve víc testech, protože i třeba volba her v metodice také může mít netriviální vliv na konečné průměry a vyznění. Recenze GeForce RTX 5080 by snad měly vyjít 29. 1. (referenční karty) a 30. 1. (přetaktované), dalších grafik patrně až v únoru.

