Integrovaný Radeon R7 (Spectre) z A10-7850K (Kaveri) v herních testech

0

Vystraší Spectre i HD 7730 a GT 640?

V druhé části testu A10-7850K se dostáváme k chloubě AMD – integrované grafice. Nepravidelné čtenáře upozorním na CPU testy A10-7850K (Recenze AMD A10-7850K (Kaveri), část I.: CPU Steamroller v akci, případně Jaký levný CPU na hry: čtyřjádro od AMD, nebo dvoujádro od Intelu?) v nichž Kaveri soupeří především s dvoujádrovými Haswelly a (ne)ukazuje výraznější zlepšení oproti Trinity či Richlandu.

Rozbor architektury včetně přínosů GPU v Kaveri, jste si mohli přečíst už v půli ledna: Čekání končí, APU Kaveri je tu. Se Steamrollerem, GCN a HSA v záloze. Nyní se dostáváme k tomu, abychom ověřili papírové předpoklady vlastními testy.

U Kaveri AMD konečně přechází na svou nejnovější architekturu GPU, označenou GCN – APU této řady budou konečně technologicky rovna aktuálním dedikovaným kartám. AMD sice již GCN nasadilo v loňských čipech Kabini, jenže „velká“ APU, u nichž lze již mluvit o herních grafikách, doposud používala shadery staré architektury VLIW4. Samotná architektura GCN se pravda na trhu pohybuje již třetím rokem, nicméně v APU Kaveri AMD použilo její nejčerstvější revizi, přítomnou v novém GPU Hawaii (Radeon R9 290/290X). APU tak může těžit z optimalizací pro dedikované karty, teoreticky mu může hrát do karet i to, že sdílí architekturu s Xboxem One a Playstationem 4.

APU Kaveri - grafické jádro
APU Kaveri – grafické jádro

Smysluplné CrossFire?

Díky architektuře GCN má také mnohem lépe fungovat hybridní CrossFire, tedy režim, kdy spárujete integrované GPU s dedikovanou kartou. Pokud je APU spjato s podobně výkonnou kartou, má docházet k poměrně efektivnímu zvýšení výkonu. Ideální je GPU má parametry co možná odpovídajícími – AMD zde doporučuje Radeon R7 240 s pamětí DDR3.

Běh v tandemu s APU A10-7850K má údajně zhruba zdvojnásobit (+ 95 %) výkon této – pravda, ne nějak superrychlé – samostatné grafiky, a to při rozlišení 1920 × 1080 bodů. Integrované GPU má umět spolupracovat s jakoukoliv kartou založenou na GCN, ale jak už bylo řečeno, nejlépe to bude fungovat s rychlostně blízkými Radeony R7.

Podpora Mantle a TrueAudio

Díky tomu, že běží na architektuře GCN, mohou integrované Radeony R7 také těžit z podpory pro grafické API Mantle. To má značně omezit výkonnostní bariéry, které klade architektura rozhraní DirectX, jenž je stále značně závislé na jednovláknovém výkonu. Obecně také jeho běh spotřebovává relativně hodně výkonu CPU, což následně může přiškrtit i grafický výkon – zejména, pokud je CPU slabší, jako u APU.

Nezávislé testy přínosu Mantle:

V testovacím demu Star Swarm od Oxide Games je navozena situace, která toto úzké hrdlo výkonu poměrně extrémně odhaluje. APU A10-7850K spojené s Radeonem R9 290X v něm dosahuje pod DirectX méně než 10 fps; s použitím Mantle je ale stejná komplexní scéna schopna běžet až na 30 snímcích za sekundu. Vedle snížené náročnosti na CPU se projevuje též to, že Mantle umí lépe využívat více vláken. Relativně slabé CPU tak mnohem lépe živí i highendové GPU.

Star Swarm lze považovat za syntetické demo, takže tatko masivní nárůst nelze čekat v reálné herní scéně. Nicméně i tak můžou být dopady velké. V Battlefield 4 si lze zejména s relativně slabším procesorem polepšit také o 10–15 %.

Vedle Mantle umí APU Kaveri i druhou vymoženost, kterou AMD představilo spolu s uvedením čipu Hawaii, a sice akceleraci prostorového zvuku a audio efektů TrueAudio. Kaveri má integrováno patřičné DSP a jeho uživatelé tedy budou moci vyzkoušet akcelerovaný zvuk ve hrách, které budou TrueAudio podporovat (jak jsme psali v článku o této technologii, několik titulů již bylo oznámeno). Vedle herního audia je ale integrované DSP možno použít i k dalším výpočtům nad zvukovými daty – například pro potlačování šumu ve vstupu z mikrofonu.

Nový videoprocesor – UVD 4

AMD do Kaveri také integrovalo novou generaci multimediálních akcelerátorů. Relativně malé změny se týkají obvodu UVD, jenž má dostat robustnější dekodér pro formát H.264 – bude tedy snášet i abnormální streamy a zejména bude použitelnější třeba při ztrátě packetů na síti či jiných přenosových potížích. AMD zatím nepřineslo podporu pro dekódování formátu HEVC (alias H.265). Podle toho, co zatím víme, ji ale nemají mít ani procesory Broadwell. Dekódování H.265 tedy bude probíhat na CPU, nicméně na trhu by se údajně měly objevit softwarové ovladače používající alespoň částečnou akceleraci pomocí OpenCL/HSA (AMD uvádí Telestream Switch).

UVD 4 v Kaveri
UVD 4 v Kaveri

Kaveri však dostane jinou zajímavou novinku týkající se sledování videa, a to technologii nazvanou Fluid Motion Video. Jedná se o řešení situace, která nastává prakticky při každém sledování filmu na počítači. Zatímco zdrojové video má frekvenci 24 snímků za vteřinu, počítačové obrazovky prakticky vždy běží na 60 Hz. Při vykreslování tedy musí GPU kreslit snímky v průměru dvaapůlkrát, což znamená, že snímky jsou střídavě zobrazovány třikrát a dvakrát. Podobně jako microstuttering při hraní toto vede k nepříjemnému cukání obrazu, který lze pozorovat při plynulých zoomech, rotacích a pojezdech kamery, či pokud je na obrazovce plynule se hýbající objekt.

AMD Fluid Motion Video
AMD Fluid Motion Video

AMD Fluid Motion Video tuto nepříjemnost řeší tak, že snímkovou frekvenci zvýší na 60 Hz pomocí interpolace. Kvalita této konverze bude pochopitelně záležet na tom, jak dobře bude algoritmus rozpoznávat pohyb a jak kvalitně bude syntetizovat nové snímky. Pokud vše bude fungovat dobře, bude pohyb mnohem plynulejší než i při přehrávání na nativních 24 Hz.

Konverze snímkové frekvence by měla běžet na GPU a fungovat by snad měla v rámci existujících přehrávačů videa založených na frameworku DirectShow. Snad by tedy mohla fungovat transparentně v rámci vykreslovače, i když to jen spekuluji; teoreticky také může vyžadovat dekódování na UVD, aby mělo GPU k dispozici informaci o pohybových vektorech ve videu.

 

Nicméně s přepočítáváním je obvykle spojen určitý úbytek kvality, neboť program jednoduše není vševědoucí a v mnoha případech jednoduše není správné interpolace schopen – zejména pokud dochází k pohybu nepravidelnému, na scéně se něco objevuje, mění se osvětlení. Interpolace obecně dosti špatně funguje například u kreslené animace. Použití Fluid Motion Videa tedy asi bude záležitostí vkusu (osobně bych preferoval raději přehrávání na kompatibilní frekvenci, tedy 24/48/120 Hz, či řešení tohoto problému pomocí G-sync či FreeSync).

VCE 2 v Kaveri
VCE 2 v Kaveri

Větší změny než u UVD nastaly u enkodéru VCE. Kaveri nese jeho druhou generaci, která je oproti té první v čipech Trinity poněkud schopnější. Zatímco původní VCE kódovalo H.264 s omezenými schopnostmi (umělo například jen snímky typu I a P), Kaveri by mělo kvalitu výstupu o něco zlepšit (umí už i snímky s obousměrnou predikcí, tzv. B-frames).

VCE 2 ale přináší zlepšení kvality i pro bezdrátový přenos obrazu AMD Wireless Display. Pro jeho potřeby dokáže enkodér video komprimovat ve formátu se vzorkováním 4:4:4, takže nedochází k rozmazávání například červeného textu kvůli podvzorkování kanálů chroma U/V. Tento režim je zejména důležitý pro kvalitní a ostré zobrazení GUI programů a operačního systému, a často také textu. Vzorkování 4:4:4 ale VCE 2 zřejmě umí jen při intra-kompresi, takže AMD má co zlepšovat. Pokud by totiž enkodér zvládl i P-snímky, mohly by se snížit nároky na přenosovou rychlost bezdrátové sítě či zvýšit kvalita. Pochopitelně by ale byla nutná podpora i ze strany přijímače.

Parametry GPU A10-7850K a detekce schopností videoprocesoru

   

Parametry referenčních karet/grafických řešení

  A6-5400K A8-5800K A10-6800K A10-7850K Pentium G3420 Core i5-4670K
  HD 7540D HD 7660D HD 8670D R7 HD Graphics HD Graph. 4600
Jádro Devastator Devastator Devastator Spectre Haswell GT1 Haswell GT2
Výrobní proces 32 nm 32 nm 32 nm 28 nm 22 nm 22 nm
Velikost jádra 246 mm² 246 mm² 246 mm² 245 mm² 118 mm² 177 mm²
Tranzistorů 1,3 mld. 1,3 mld. 1,3 mld. 2,41 mld. ? mld. 1,4 mld.
Stream procesorů 48 (192) 96 (384) 96 (384) 512 10 20
Takt jádra 760 MHz 800 MHz 844 MHz 720 MHz 1100 MHz 1200 MHz
Takt SP 760 MHz 800 MHz 844 MHz 720 MHz 1100 MHz 1200 MHz
ROP/RBE 4 8 8 8 2 2
Texturovacích jedn. 24 24 24 32 2 4
Paměť sdílená sdílená sdílená sdílená sdílená sdílená
Takt pamětí 1866 MHz 1866 MHz 2133 MHz 2400 MHz 1600 MHz 1600 MHz
Šířka sběrnice 128-bit 128-bit 128-bit 128-bit 128-bit 128-bit
Propustnost pamětí 29,9 GB/s 29,9 GB/s 34,1 GB/s 38,4 GB/s 25,6 GB/s 25,6 GB/s
Fillrate (pixely) 3 GPx/s 6,4 GPx/s 6,75 GPx/s 5,8 GPx/s 2,2 Gpx/s 2,4 Gpx/s
Fillrate (textury) 18,2 GTx/s 19,2 GTx/s 20,3 GTx/s 23 GTx/s 2,2 GTx/s 4,8 GTx/s
FLOPS 292 GFLOPS ~700 GFLOPS 779 GFLOPS 737 GFLOPS
TDP 65 W (s CPU) 100 W (s CPU) 100 W (s CPU) 95 W (s CPU) 53 W (s CPU) 84 W (s CPU)
Délka karty
DirectX 11.0 11.0 11.0 11.2 11.1 11.1
  Radeon Radeon Radeon Radeon Radeon Radeon
  HD 6670 HD 7730 R7 250 HD 7750 R7 260 HD 7770 GHz Ed.
Jádro Turks Cape Verde Oland Cape Verde Bonaire Cape Verde
Výrobní proces 40 nm 28 nm 28 nm 28 nm 28 nm 28 nm
Velikost jádra 118 mm² 123 mm² 90 mm² 123 mm² 160 mm² 123 mm²
Tranzistorů 716 mil. 1,5 mld. 1,04 mld. 1,5 mld. 2,08 mld. 1,5 mld.
Stream procesorů 96 (480) 384 384 512 768 640
Takt jádra 800 MHz 800 MHz 1000/1050 MHz 800 MHz 1000 MHz 1000 MHz
Takt SP 800 MHz 800 MHz 1000/1050 MHz 800 MHz 1000 MHz 1000 MHz
ROP/RBE 8 8 8 16 16 16
Texturovacích jedn. 24 24 24 32 48 40
Paměť 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 2 GB GDDR5 1 GB GDDR5
Takt pamětí 4 GHz 4,5 GHz 4,5 GHz 4,5 GHz 6 GHz 4,5 GHz
Šířka sběrnice 128-bit 128-bit 128-bit 128-bit 128-bit 128-bit
Propustnost pamětí 64 GB/s 72 GB/s 73,6 GB/s 72 GB/s 96 GB/s 72 GB/s
Fillrate (pixely) 6,4 GPx/s 6,4 GPx/s 8 GPx/s 12,8 GPx/s 16 GPx/s 16 GPx/s
Fillrate (textury) 19,2 GTx/s 19,2 GTx/s 24 GTx/s 25,6 GTx/s 48 GTx/s 40 GTx/s
FLOPS 768 GFLOPS 614 GFLOPS 768 GFLOPS 819 GFLOPS 1536 GFLOPS 1280 GFLOPS
TDP >66 W ? W >65 W >55 W >95 W >80 W
Délka karty 15 cm 15 cm 15 cm 15 cm 21 cm 17 cm
DirectX 11.0 11.2 11.2 11.2 11.2 11.2
  GeForce GeForce GeForce GeForce GeForce  GeForce
  GT 640 DDR3 GTX 460 GTX 560 GTX 650 GTX 650 Ti GTX 650 Ti Boost
Jádro GK107 GF104 GF114 GK107 GK106 GK106
Výrobní proces 28 nm 40 nm 40 nm 28 nm 28 nm 28 nm
Velikost jádra 118 mm² ~330 mm² ~330 mm² 118 mm² 221 mm² 221 mm²
Tranzistorů 1,3 mld. 1,95 mld. 1,95 mld. 1,3 mld. 2,54 mld. 2,54 mld.
Stream procesorů 384 336 336 384 768 768
Takt jádra 900 MHz 675 MHz  810 MHz 1058 MHz 925 MHz 980/1033 MHz
Takt SP 900 MHz 1350 MHz 1620 MHz 1058 MHz 925 MHz 980/1033 MHz
ROP/RBE 16 32 32 16 16 24
Texturovacích jedn. 32 56 56 32 64 64
Paměť 2 GB DDR3 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 2 GB GDDR5
Takt pamětí 1,8 GHz 3600 MHz  4004 MHz 5 GHz 5400 MHz 6008 MHz
Šířka sběrnice 128-bit 256-bit 256-bit 128-bit 128 b 192 b
Propustnost pamětí 28,5 GB/s 115,2 GB/s  128 GB/s 80 GB/s 86,4 GB/s 144,2 GB/s
Fillrate (pixely) 14,4 Gpx/s 21,6 Gpx/s 25,9 Gpx/s 16,9 Gpx/s 14,8 Gpx/s 23,5 Gpx/s
Fillrate (textury) 28,8 Gtx/s 37,8 Gtx/s  45,4 Gtx/s 33,9 Gtx/s 59,2 Gtx/s 62,7 Gtx/s
FLOPS 691 GFLOPS 907 GFLOPS  1088 GFLOPS 813 GFLOPS 1421 GFLOPS 1881 GFLOPS
TDP 65 W 160 W 150 W 64 W 110 W 134 W
Délka karty 15 cm 21 cm 21 cm 15 cm 23 cm 23 cm
DirectX 5.0 11.0 11.0 11.0 11.0 11.0

 

Testovací sestavy a návod na interaktivní grafy

Testovací sestavy

Společným bodem testovacích sestav byly tyto komponenty:

  • procesor: AMD A10-5800K (v případě testování diskrétních grafických karet)
  • chladič: Noctua NH-C12P
  • paměti: 2× 2 GB DDR3-2000 Kingston HyperX T1
    (nastaveny na 1600-8-8-24-1T v případě Intel Core i3/i5 a na 1866-9-10-9-27-1T v případě AMD A10-5800K, na 2133-11-12-11-30-2T s 1,6 V u A10-6800K a konečně 2400-11-13-13-30-2T@1,65V s A10-7850K)
  • zdroj: Seasonic EnergyKnight (T3), 400 W
  • pevný disk: WD Caviar (WD3200AAKS), 320 GB
  • operační systém: Windows 7 Enterprise SP1, 64-bit

Není-li řečeno jinak, je testováno v rozlišení 1920 × 1080 px.

Kingston Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston

 

Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution

 

Monitor

FS2333

K testování grafických karet nám poskytla herní monitor Foris FS2333 společnost EIZO.

EIZO

Platforma FM2+

Při sledování příkon celého PC (platformy) je důležité mít na paměti, že i při stejném nastavení je A88X-Pro trochu „žravější“ než Gigabyte F2A85X-UP4. Tak například v kombinaci s procesorem A10-5800K a zmíněnou GTX 460 (kterou se mi nakonec povedlo v F2A85X-UP4 rozjet) činil rozdíl příkonu celé sestavy v idle 6 W (52 na F2A85X a 58 s A88X-Pro), ve hře World in Conflict, kde je zatíženo poměrno dost CPU i GPU činil rozdíl 5 W (231 vs. 236 W). S GTX 660 ve slotu byl rozdíl kupodivu menší (46 vs. 48 W) a s Radeonem R9 270 jsem se opět dostal na zřetelně více wattů u A88X-Pro (52 vs. 59 W v idle, 210 vs. 220 W ve World in Conflict).

Platforma FM2

APU Trinity a Richland byla osazena do desky Gigabyte A85X-UP4. Ta patří v dané platformě spíše k těm dražším a dá se tedy očekávat, že v případě testů přetaktování lze snadno najít možnosti daného řešení (či alespoň kusu).

AMD A10-5800K s Gigabyte GA-F2A85X-UP4

Platforma LGA 1150

Integrované grafiky CPU Haswell byly otestovány v základní desce Gigabyte Z87X-UD3H.

Platforma LGA 1155

Core i5-3225 jsem testoval v základní desce Gigabyte Z77X-UD5H. Jedná se určitě o vyšší střední třídu desek se silnou napájecí kaskádou pro stabilitu při přetaktování, takže to se mohlo podepsat i na příkonu.

 

Za zapůjčení základních desek děkujeme společnosti Gigabyte

 

Interaktivní grafy 2.0

  1. Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace. 
  2. Pořadí testovaných produktů můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, podle různých skupin apod.
  3. Po najetí myší na některou z položek se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek.
  4. Budete-li chtít nějakou položku v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
  5. Cenu a další základní parametry můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
  6. Zámek základu (produkt, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad produktem (či jeho pruhem v grafu), který chcete uzamknout.
  7. Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problému smažte i příslušné cookies.
  8. Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
  9. V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.

 

 

Aliens vs. Predator, Battlefield 3

Aliens vs. Predator

 

Scénu z úvodu hry jsme nově nahradili samostatným benchmarkem, který je na internetu k dispozici ke stažení zdarma. Běží v režimu DirectX 11 a je o poznání náročnější než náš původní test. Používáme výchozí nastavení benchmarku zahrnující zapnutou teselaci.

     

 

Battlefield 3

V Battlefield 3 je využit předvolený profil nastavení kvality Vysoký. Benchmarkujeme tradičně scénu ze začátku druhého dějství kampaně (výstup z transportéru a briefing na orientálnímu trhu).


 

 

Battlefield 4, BioShock Infinite

Battlefield 4

V Battlefield 4 testuji jednu z nejnáročnějších cutscén kampaně. U multiplayeru budou zejména nároky na CPU vyšší, ale co se náročnosti GPU týče, tak tento průchod lodí s všemožnými efekty patří k těm nejlépe škálujícím.

    

Do celkového výsledku počítám jen předvolený profil nastavení kvality Vysoký. Testuji ale i tři další profily celkového nastavení detailů:

 

BioShock Infinite

Stejně jako další nové hry z AMD Game Evolved (či přímo Never Settle) i BioShock Infinite obsahuje docela hezký zabudovaný benchmark, který odzkouší několik lokací. Nastavení Ultra (DX11) zajistí využití všech moderních ve hře využitých technologií kromě DDOF (Diffusion Depth Of Field). Výsledkem v grafu jsou průměrná fps napříč všemi lokacemi (průměr průměrných fps).

     

Call of Duty 4, Crysis 3

Call of Duty 4: Modern Warfare

Ačkoli se asi nejvíce zapsal druhý díl této série, tak i čtvrtý byl v multiplayeru hodně rozšířen. Nijak zvlášť náročnou hru jsem testoval se všemi detaily na maximu a také s 4× MSAA a 8× AF.

 

Crysis 3

V Crysis 3 jsem nakonec musel zvolit předvolbu Nízký, aby hra byla plynulá alespoň na Radeonu HD 7750. Testuji scénu ze začátku příběhu, kdy se v dešti objevíte v přístavu a máte běžet za Psychem. Po vyběhnutí schodů FRAPS vypínám v první místnosti.

 

Enemy Territory: Quake Wars, F1 2012

Enemy Territory: Quake Wars

Enemy Territory představuje jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám nejvyšší detaily s 4× MSAA a 8× AF, přes konzoli vypínám limit 30 (com_unlockFPS 1) i 60 fps (com_unlock_maxFPS 0, je vhodné nastavit do autoexec.cfg).

    

Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.

 

F1 2012

Formule od Codemasters mají také zabudovaný benchmark a tím testuji celkové nastavení určené profilem Ultra.

   

IL-2 Sturmovik: Cliffs of Dover, Mafia II

IL-2 Sturmovik: Cliffs of Dover

 

V IL-2 Sturmovik: Cliffs of Dover používám replay BlackDeath.trk. 210sekundový průběh záznamu zachytím FRAPSem, předtím v nastavení vyberu profil detailů Vysoké. Anti-aliasing nezapínám, vypnuté zůstává i SSAO.

 

Mafia II

     

Druhou Mafii už i na levných grafikách testuji s celkovým nastavením High, APEX PhysX zůstává vypnuta.

    

Metro Last Light, Resident Evil 6

Metro Last Light

Metro: Last Light - galerie

Metro: Last Light navazuje na postapokalyptické Metro 2033. Hru pohání 4A Engine, který je dílem vývojářů z 4A Games. Stojí za ním spoluautoři X-Ray Engine použitého v herní sérii S.T.A.L.K.E.R. Engine, poprvé použitý v Metro 2033, vznikl pro herní konzole a PC. Podporoval rozhraní DirectX 9, DirectX 10 a DirectX 11 a řadu pokročilých efektů a technik včetně volumetrické mlhy, rozostření (pohybové) objektů, sub-surface scattering (simulace částečné průsvitnosti objektů, což je důležité třeba pro napodobení kůže) nebo parallax mapping (simulace nerovností povrchů). Pro vykreslování obrazu s využitím velkého množství světelných zdrojů se využívá deferred lighting (či deferred shadding nebo rendering).

V novém Metro: Last Light přibyla řada efektů a technologií. Vývojáři ale pořádně zapracovali i na optimalizaci. Hra se i přes lepší grafiku chová při maximálních detailech o poznání lépe než její předchůdce. 

  Very High High Medium Low
Ambient Occlusion Precomputed + SSAO Precomputed + SSAO Approximate Approximate
Analytical Anti-Aliasing Enabled Enabled Enabled Enabled
Bump Mapping Precise Precise Coarse Coarse
Detail Texturing Enabled Enabled Enabled Disabled
Geometric Detail Very High High Normal Low
Image Post-Processing Full Full Normal Normal
Light-Material Interaction Full Normal Normal Normal
Motion Blur Camera + Objects Camera Disabled Disabled
Parallax Mapping Enabled + POM Enabled Disabled Disabled
Shadow Filtering Hi-Quality Hi-Quality Normal Fast
Shadow Resolution 9,43 Mpx 6,55 Mpx 4,19 Mpx 2,35 Mpx
Skin Shading Subsurface Scattering Simple Disabled Disabled
Soft Particles Enabled Enabled Disabled Disabled
Volumetric Texturing Full Quality + Sun Shafts Low Precision Disabled Disabled

Nastavení grafiky přímo ve hře je oproti předchůdci výrazně zjednodušené. Podrobnější nastavení detailů zmizelo a nahradilo je jen globální nastavení. Jak ovlivňuje jednotlivé efekty je shrnuto v tabulce z GeForce.com. Pro podrobnější popis toho, co které nastavení znamená, vás odkáži tamtéž, s příklady by to vydalo na další článek.

 

Resident Evil 6

Pro test RE6 používám samostatný benchmark s výchozím nastavením (FXAA3HQ, Motion Blur: On, Shadow/Texture/Screen Quality: High).


 

     

Sleeping Dogs, Stalker: Call of Pripyat

Sleeping Dogs

 

 Také Sleeping Dogs nemohli být oproštěni od zabudovaného benchmarku. Profil High jsem upravil jen na místě anti-aliasingu (volba Normal znamená pouze FXAA).

 

    

 

Stalker: Call of Pripyat

Ke třetímu dílu Stalkera naštěstí existuje volně šiřitelný benchmark, v něm používám k testům pouze čtvrtou, nejnáročnější část (nastavení se slunečními paprsky – SunShafts). Vše je nastaveno na naprosté maximum (DX11 funkce jako teselace nebo CHS), MSAA pak na stupeň 4×.

  

The Elder Scrolls V: Skyrim, The Witcher 2 (Zaklínač 2)

The Elder Scrolls V: Skyrim

TES V: Skyrim-0018

Problémy nastíněné v článku Skyrim a HiRes Texture Pack: porovnání grafik mě přivedly na následující metodiku testování: po projití několika uložených pozic a zjištění, že Markarth už nedělá problémy ani Radeonům, ani GeForce, jsem vybral tři uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby), Riverwood (stromy, voda, vesnice) a Ragged Flagon (podzemí Riftenu). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím dvacet sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr tří dvacetisekundových měření. Více o testování v článku Skyrim a HiRes Texture Pack: porovnání grafik.

První graf je pro méně náročné nastavení, při němž je nejdříve předvolen profil High a poté jen vypnut anti-aliasing. Druhý graf obsahuje výsledky s předvolbou Ultra High a zahrnuje tak právě třeba i 8× MSAA.

 

The Witcher 2

Testováno bylo ve verzi hry 3.3 a měřeno bylo v rozlišení 1920 × 1080 px s upraveným profilem detailů Nízký. Jen limit paměti textur byl navýšen na Vyšší a také vzdálenost zobrazování jsem změnil na Normální.

Po seznámení se hrou jsme vybrali dvě lokace, jež patří určitě mezi nejnáročnější: poslední část kapitoly zvané Vedení útoku, kdy drak proboří hradby a útočí na vaši družinu i nepřátelské vojáky, a z pokročilejší fáze hry potom v lese se odehrávající misi Hnízda Nekkerů. První souhrnný graf prezentuje průměr z těchto dvou lokací.

Více o testování v článku Witcher 2 v2.1 – rychlotest 19 grafických karet

Tomb Raider (2013), Total War: Shogun 2

Tomb Raider (2013)

Tomb Raider screenshots

S novým Tomb Raiderem jste se mohli setkat už ve dvou testech podrobných měření s nástrojem FCAT (viz např. FCAT a testy (ne)plynulosti: když se nehraje jen na průměry), takže jste s teselovanou Larou jistě obeznámeni. V nastavení Normal není měřeno s teselací, v nastavení High je naopak teselaci zkoušena.

   

 

Total War: Shogun 2

 

Plná verze Shoguna 2 nabízí nejen DirectX 11, ale také vestavěný benchmark. Testuji jednak s přednastaveným profilem 1080p High a poté ještě s vlastním nastavením vycházející z celkových detailů „Medium“ s pár úpravami.

World in Conflict, World of Tanks

World in Conflict

Testuji s profilem Nejvyšším (zahrnuje DX10 rendering a 4× MSAA), detailně je použité nastavení vidět na screenshotech:

    

 

World of Tanks 8.5

 

Co se týče využití GPU, jsou nejnáročnější záležitostí World of Tanks určitě křoví nejlépe v kombinaci s pohledem skrze optiku režimu snipera. Takový záznam bitvy s delším střílením skrze křoví na malebné mapě Fjords jsme pořídili a zatím grafiky mučíme s takovýmto nastavením Graphics: Improved, vše na Low, jen Textures a Visibility: Maximum a samozřejmě Extra Effects in Sniper mode: Off.

Instrukce pro srovnatelné testování:

  • uložte replay na pevný disk
  • spusťte FRAPS a na kartě FPS nastavte Stop benchmark after 300 s
  • pokud máte příponu .wotreplay asociovánu s WorldOfTanks.exe, potom na ni stačí poklepat. V opačném případě si vytvořte zástupce WorldOfTanks.exe a .wotreplay na ni přetáhněte
  • počkejte, až na odpočtu bude 00:28 do startu zápasu (vpravo nahoře), pak spusťte logování (implicitně F11)
  • výsledek najdete ve složce Frapsu jako FRAPSLOG.TXT

Více o testování a technické stránce hry v článku World of Tanks: průvodce hardwarem a nastavením pro ty, co spěchají.

Unigine Heaven 4.0 a Valley 1.0

Unigine Heaven 4.0

Jakých změn doznal Heaven, jehož první inkarnace vyšla už v roce 2009? Vývojáři údajně „drasticky“ vylepšili efekt SSDO (scene-space dimensional occlusion), vylepšili refrakci světla na čočkách (lens flare) a do části sekvence, která se odehrává v noci, zapracovali hvězdnou oblohu. Při testech nechávám teselaci na normal, anizotropní filtr nastavuji na 8:1 a multi-sampling raději vypnutý.

  

 

Unigine Valley 1.0

Poslední benchmark od Unigine vaši grafickou kartu potrápí rozlehlou krajinou a hustou, detailně renderovanou vegetací. Nastavení benchmarku vidíte na screenshotu a bude asi ještě chvíli trvat, než jej takto třída grafik zvládne.

3DMark

3DMark

Po rozličných experimentech s názvy jako 3DMark 99, 3DMark 2000 nebo 3DMark Vantage pojmenoval Futuremark nový benchmark nejjednodušeji, jak to šlo – 3DMark. Důvodem je to, že se pod tímto označením nově rozumí celý balík testů.

Verze pro Windows obsahuje tři testy – pro DirectX 11, 10 a 9. Všechny tři testy běží na enginu pro DirectX 11, takže je pro běh 3DMarku vyžadovaný operační systém s podporou DX11 (Windows Vista, Windows 7 a Windows 8), u testů pro nižší verze DirectX se ale využívají jen instrukce příslušené dané verzi, takže k jejich spuštění pak stačí grafická karta s podporou DirectX 10, případně DirectX 9.

Fire Strike

Fire Strike je určený pro výkonná PC, ze tří testů je nejnáročnější, běží pod DirectX 11 a využívá více vláken. Skládá se ze dvou testů grafiky, testu fyziky a kombinovaného testu, který zatěžuje zároveň procesor i grafickou kartu.

V enginu pro tento test se využívá multithreading, teselace (PN triangles, phong a displacement mapping s podporou triangle i quad teselace), deferred lighting, ambient occlusion, pro výpočty osvětlení povrchů může mimo jiné využívat i horizon based screen space ambient occlusion (HBAO), dále volumetrické osvětlení a osvětlení částic. Post processing zahrnuje efekty jako particle based distortion (pod tím si můžete představit třeba vlnění teplého vzduchu), depth of field (hloubka ostrosti), odrazy od čoček, bloom (počítaný Rychlou Fourierovou transformací), antialiasing (MSAA a po tone mappingu FXAA) či simulace dýmu.

Podrobnější popis použitých technologií a způsobu využití najdete opět v původní dokumentaci v angličtině, jejich přepis by vydal na další čtyři strany (kvůli používané terminologii beztak napůl anglického textu). Pokud se v daných technologiích orientujete, nemělo by vám to ani v angličtině dělat problémy.

Cloud Gate

Cloud Gate je navržený pro notebooky a domácí PC. Jde o méně náročný test, který využívá pouze rozšíření DirectX 10_0, takže se dá pouštět i na starších kartách nebo integrovaných grafikách, které DirectX 11 nepodporují. Samotný engine, na kterém běží, ale DirectX 11 vyžaduje, takže je pro spuštění zapotřebí, aby vše bylo nainstalované na operačním systému, který DirectX 11 podporuje.

Test je složený ze dvou test grafické karty a jednoho testu fyziky a je ekvivalentem pro 3DMark Vantage (v tom, že oba běží na DirectX 10). Použitý engine se ale samozřejmě liší a ani výsledné skóre není vzájemně porovnatelné. Pro test se využívá stejný engine jako u Fire Strike, pochopitelně bez rozšíření DX11.

Standardně se testuje v rozlišení 1280 × 720 bodů, test je stavěný na 256 MB videopaměti.

Ice Storm

Ice Storm je určen pro měření výkonu tabletů, ultrapřenosných notebooků a levných PC. Na měření výkonu GPU slouží první dva testy, ve třetím se testuje fyzika.

 

Jde o (pro PC) hodně nenáročný test, který na GeForce GTX 660 Ti někde pod dvěma tisíci fps. Má být jakýmsi ekvivalentem pro 3DMark06 pro DirectX 9, byť už není jako 3DMark06 svého času postavený na testování výkonných PC, ale na rozdíl od něj už je určený pro test výkonných mobilních zařízení.

Standardní rozlišení pro test je 1280 × 720 bodů a počítá se se 128 MB grafické paměti. S rozličnými rozměry displejů mobilních zařízení se Futuremark vyrovnal tím, že obraz v daném rozlišení renderuje napevno a následně jej zvětšuje nebo zmenšuje podle rozměrů obrazovky.

Výsledky v detailech

Radeon R7 (A10-7850K)

   

    

Radeon HD 5770

  

   

Radeon R9 270 OC

   

   

GeForce GTX 660 OC

    

    

Radeon HD 6950

   

  

GeForce GTX 560

   

  

GeForce GTX 460

  

   

Radeon R7 260X

 

 

Radeon HD 5850

 

Radeon HD 7850 OC 1 GB

   

   

GeForce GTX 650 Ti OC

  

    

GeForce GTX 650 Ti Boost OC

   

    

GeForce GT 640 GDDR5

  

   

Radeon HD 7770 GHz Ed.

   

    

Radeon HD 7790

  

    

Radeon HD 7730

  

   

Radeon HD 6670

   

    

GeForce GTX 650

  

   

GeForce GT 640

 

 

AMD Radeon HD 8670D

  

     

Intel HD 4600

  

   

Intel HD 4000

  

AMD Radeon HD 7660D

   

AMD Radeon HD 7540D

  

   

AMD Radeon HD 7750

    

   

Příkon (spotřeba), shrnutí výkonu a vyhodnocení

Příkon (spotřeba)

wattmetr

Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce.

Při testování příkonu při přehrávání videa je využit program Media Player Classic Home Cinema. To, kde je DXVA (GPU) akcelerace přehrávání videa aktivní, poznáte asi i bez průkazného screenshotu.

 

Přetaktování

Většina Radeonů R7 v A10-7850K se při přetaktování v recenzích dostala na frekvenci okolo 1 GHz. Od 960 MHz nahoru už přestane fungovat detekce frekvence v GPU-Z, funkčnost nastavení z AMD OverDrive lze ale ověřit nárůstem v testech. Takřka optimální je GPU OpenCL test v AIDA64, kde se frekvence téměř rovná předvedeným GFLOPS (takže s taktem grafiky těsně nad 1 GHz v benchmarku dosáhnete 1 TFLOPS v single-precision).

Původní jsem myslel, že pro můj vzorek bude stabilní právě takt 1 GHz (navýšení o 280 MHz z původních 720), ale to platí jen pro některé testy. Například Bioshock Infinite či Metro Last Light v takovém přetaktování stabilní nebyly. Momentálně ověřuji stabilitu a výkon v těchto hrách při 960 945 MHz.

Aktualizace: 945 MHz pro jádro se zdá být stabilním taktem pro všechny zatím odzkoušené hry.

  GeForce GTX 650 OC Radeon HD 7750 (s G3420) Radeon HD 7730 Radeon R7 OC @ 945 MHz (A10-7850K) Radeon R7 (A10-7850K)
BioShock Infinite – medium [avg. fps] 48,3 45,2 32,1 33,6 31,2
Metro Last Light – low [avg. fps] 37,4 41,8 26,1 24,3 22,9
Total War: Shogun 2 – med. [avg. fps] 42,9 45,2 32 33,8 31,8

 

Shrnutí výkonu a verdikt

Shrnující graf je vytvořen tak, že v každé hře tvoří 100 % (základ) nejlepší výkon a od něj jsou odvezeny další relativní výkony. Takto nemá žádná hra větší váhu. V případě her, kde jsou kvůli změně metodiky otestována dvě nastavení (Tomb Raider, Bioshock Infinite, Shogun 2: Total War, World of Tanks, F1 2012 a Aliens vs. Predator), jsem do průměru v tomto případě už započítal méně náročné nastavení. Slabší grafiky tak nejsou penalizovány a naopak spíše méně vynikne odstup karet jako R9 270 či GTX 660.

Jelikož jsem u spousty her jako Battlefield 3, Crysis 3, IL-2: Cliffs of Dover, Skyrim nebo Witcher 2 ještě speciálně kvůli souboji GTX 660 s R9 270 metodiku rozšířil o měření náročnějšího nastavení (vysokých či maximálních detailů). Pokud bych průměroval jen tato náročnější nastavení a vyškrtl z počítání hry, kde obě karty běží v průměru nad 100 fps (ET:QW a Call of Duty 4). Do průměrování je přidána hra Battlefield 4 (v celkovém nastavení vysokých detailů):

Ale jak by to dopadlo, kdybych se soustředil jen na vybrání těch skutečně náročných karet i pro kalibr typu R9 270 OC? Následující graf právě ukazuje průměr z her, kde se i grafiky za 4500 Kč notně zapotí (Battlefield 4, Bioshock Infinite (Ultra), Metro Last Light (High + Teselace), Skyrim (Ultra, 8× MSAA), Tomb Raider (High + Teselace), Total War: Shogun 2, Witcher 2 a World of Tanks s max. detaily):

Jestli se vám to nechce počítat, ale stejně po tom prahnete, tak tady (pro diskrétní grafiky) najdete jednoduché srovnání poměru výkon/cena. Žádný index nenajdete u karet, které se již neprodávají, a také u IGP. 

 

Verdikt

Když jsem navrhoval novou metodiku testů levných grafik tak, aby se v ní Radeon HD 7750 pohyboval kolem ještě hratelných snímkových frekvencí, věřil jsem, že nová generace integrovaných grafik AMD bude dosahovat právě jeho výkonu. A možná by byla velmi blízko, kdyby došlo na GDDR5M, nebo čtyřkanálový řadič. Na srovnání s Radeonem HD 7730 je bohužel vidět, že 2400 MHz efektivně při 128bitové šířce paměťové sběrnice už neumožňuje plně využít potenciál 512 stream procesorů architektury GCN v kombinaci se solidním počtem texturovacích jednotek (32).

Samotné APU A10-7850K je zcela zabito cenou. Momentálně se dá dokonce uvažovat nejen o párování CPU s HD 7750, ale třeba i HD 7770 (alias R7 250X). A těmto diskrétním grafikám nemůže Spectre zadržovaná nízkou propustností paměti konkurovat. Z tohoto pohledu jsou také slibnější levnější varianty Kaveri, kde má R7 „jen“ 384 stream procesorů. Zde nebude brzda tak citelná, výkon ve hrách nejspíše tedy jen o málo nižší a cena rozumnější.

A10-7850K je zajímavá asi jen pro vskutku maličká PC s mini-ITX a bez místa na diskrétní grafiku. Tam oceníte možnost mít v malé krabičce povětšinou použitelnou herní grafiku, nebo naopak docela výkonný procesor pro nějakou konverzi videa nebo jakou náročnější činnost zrovna děláte.

Radeon R7 (A10-7850K)

Plusy / mínusy
  nejvýkonnější dostupná integrovaná grafika
  zlepšuje možnosti postavit velmi malé PC použitelné na hry
  moderní technologie (DirectX 11.2, Mantle, TrueAudio, OpenCL 1.2, HSA, …)
  pokročilý videoprocesor
  podpora tří monitorů v Eyefinity
  rezerva pro přetaktování (které je díky OverDrive snadné)
  absurdní cena
  citelné omezení dvěma kanály DDR3 – pomalejší než HD 7730
  kombinace levnějších CPU s HD 7750/7770 jsou výhodnější
Cena 4300 Kč (celé APU, tedy procesor i integrovaná grafika)

 


Další testy A10-7850K či A8-7600 hledejte v tématu AMD Kaveri – „extra“ testy, GPGPU, přetaktování…. V něm se také můžete zeptat na to, co konkrétně vás zajímá a pokud to už nebude otestováno jinde a současně to bude pro mě realizovatelné, pokusím se to otestovat. Podmínkou je mít některé APU zrovna v testovací sestavě na stole (kit se musí prostřídat ještě v další redakci).