DirectX 12 vs. DirectX 11 v Rise of the Tomb Raider

0

V nejnovějším díle sice už není Lara Croft tak prvoplánově smyslná jako v dílech starších, zato je zase o kus blíže realitě. A to samozřejmě platí nejen pro hlavní postavu, ale pro vizuální zpracování celé hry. Širší paletu otestovaných grafických karet v této hře vám odprezentujeme v právě připravovaném velkém testu grafických karet a vliv mnoha voleb nastavení detailů na obraz a výkon najdete třeba v tomto článku na GeForce.com . V této rychlovce se zaměříme ale čistě na přínos DirectX 12.

Majitelé posledního titulu ze série Tomb Raider si možná před pár dny všimli, že jim v menu přibyla možnost otestovat výkon pomocí zabudovaného benchmarku (Start benchmark) a v nastavení pak možnost volby DirectX 12 API. Pátý patch RoTR hru dostane do sestavení 1.0.638.8 a kromě benchmarku a DX12 přináší ještě funkční technologii VXAO (Nvidia Voxel Ambient Occlusion vypadá ještě o něco lépe než HBAO+, viz třeba zde ).

RoTR jsem začal testovat v březnu klasicky Frapsem a tak nějak v souladu s metodikou mnoha webů hned spolehlivě opakovatelným začátkem ve sněhové bouři na hřebeni velehor. S novým patchem jsem mohl naměřené výsledky nejen zahodit, ale stejnou metodiku jsem nemohl použít ani pro srovnání DX11 vs. DX12. Fraps totiž pod API DX12 nefunguje (resp. nefunguje overlay Frapsu, takže je potřeba testovat „naslepo“). Naštěstí byl do hry přidán zmíněný integrovaný benchmark, který mi stejně ukázal, že existují výrazně náročnější lokace než zasněžené hřebeny hor (v benchmarku jsou celkem tři různé lokace).

Pro otestování výkonu v RoTR používám následující nastavení:

Vypnuty tedy nechávám absurdní efekty napodobující nedokonalosti objektivů, ale jinak jde v podstatě o testování na maximum (o anti-aliasing se pak stará především vysoké rozlišení, což je koneckonců nejlepší způsob). Pro 1440p i 2160p uvidíte vždy dva grafy – v prvním je průměrná snímková frekvence ze všech tří lokací v benchmarku, minimum je pak opravdu tím minimem ze všech tří částí.

Jak vidíte, průměrná snímková frekvence je po přepnutí na API DX12 při stejné kvalitě obrazu nižší než s API DX11. Naopak minima se kromě jediné výjimky (GTX 980) s DX12 vždy zlepší. To je trochu v rozporu s tím, co bychom obecně od přechodu k API DX12 očekávali. Pokud se ale podíváte na vývojářský blog , uvidíte příklad s Core i7-2600K a specifickou scénu, kde optimalizace s DX12 pomohla odstranit úzké hrdlo v podobě CPU a lepší paralelizací zkrátit časy zpracování v tomto místě.

Integrovaný benchmark je však zaměřen zřejmě více na prověření GPU a zatím s tím asi nic neuděláme. Jak jsem zmínil, Fraps pod DX12 (aspoň zatím) nepracuje a po přepnutí na API DX12 nefunguje třeba ani overlay Steamu. Další věcí je, že testujeme na přece jen silnějším Sandy Bridge-E (šest jader přetaktovaných na 4 GHz, čtyřkanálová RAM, 15MB L3 cache…):

Testbed

  Testbed   Testbed Testbed Testbed

A pro pořádek ještě doplním detaily o čtyř v grafech zastoupených highendových grafikách a použitých ovladačích:

GeForce GTX 980 Ti Radeon R9 Fury X GeForce GTX 980 OC Radeon R9 390X OC
Výrobce karty Nvidia AMD Asus Sapphire
Označení modelu ref. karta ref. karta Strix-GTX980-DC2OC-4GD5 390X Tri-X
Takt GPU [MHz] 1000 1050 1178 1055
Takt Boost [MHz] 1076 1279
Takt pamětí (efektivně) [MHz] 7012 1000 7012 6000
Velikost grafické paměti [MB] 6144 4096 4096 8192
Šířka paměťové sběrnice [bit] 384 4096 256 512
Verze ovladače 364.51 16.2.1 Crimson 364.51 16.2.1 Crimson
Zjištěný takt GPU v zátěži [MHz] 1177 (občas na 1152) 1050 (občas padá na 800) 1291 často throttlí na 858
Cena vč. DPH [Kč] 18 400 18 500 15 300 11 500