Radeon R7 v A8-7600: poznáte rozdíl 384 a 512 stream procesorů?

0

R7 v APU: oběť paměťového řadiče

Maratón testů APU A10-7850K a A8-7600, jež většina z vás zná i pod kódovým označením Kaveri, se konečně blíží do cílové rovinky. Mezitím jste si už mohli přečíst detailní popis architektury (viz bod 4 v následujícím seznamu), GPU testy R7 v A10-7850K (1), zjištění rozdílu výkonu při použití Pentia G a čtyřjádrového Trinity v herních testech s diskrétní grafikou (2) nebo CPU testy obou Kaveri (3 a 5):

  1. Integrovaný Radeon R7 (Spectre) z A10-7850K (Kaveri) v herních testech
  2. Jaký levný CPU na hry: čtyřjádro od AMD, nebo dvoujádro od Intelu?
  3. AMD A8-7600: Kaveri s lidovější cenou a volitelným TDP 65 a 45 W
  4. Čekání končí, APU Kaveri je tu. Se Steamrollerem, GCN a HSA v záloze
  5. Recenze AMD A10-7850K (Kaveri), část I.: CPU Steamroller v akci
  6. AMD Kaveri – „extra“ testy, GPGPU, přetaktování…

Pod šestou odrážkou se skrývá trochu nesourodá sbírka testů, do níž už přispívají i někteří uživatelé fóra. Díky nim vyplulo také na povrch, že při současné zátěži CPU a GPU snižuje APU Kaveri frekvenci jedné či druhé části a to i navzdory „tvrdému“ nastavení v UEFI či AMD OverDrive. Tento problém možná poškozuje synchronizaci při zapojení CrossFire (APU s diskrétní grafikou – nedělejte to proboha!), ale v praxi se nezdá být problémem ani při delší zátěži.

Pokud něco renderujete nebo převádíte video, tak zatěžujete jen 100% CPU a CPB vám bude držet takty všech jader typicky o jeden až dva kroky pod maximálním násobičem frekvence Turbo. Jestliže hrajete nějakou hru, co delší dobu zatěžuje GPU i CPU, tak sice může docházet k zaznamenatelným poklesům frekvence, ale ten se nepromítne v nějaké poškubávání (stuttering) „navíc“.

Metro Last Light, druhý průchod testy, 1080p, nízké detaily:


 


 

Dalším problémem může být i to, zda monitorovací programy nehlásí nesmysly. V případě A8-7600 sice můžete v AMD OverDrive zvýšit frekvenci integrovaného R7 ze 720 třeba na 930 MHz, GPU-Z, OverDrive (GPU Status) i další programy vám budou poslušně reportovat aktuální frekvenci 930 MHz, ale v reálu je takt uzamčen na oněch 720 MHz. O tom se ale přesvědčíte až při testech výkonu, jež zůstanou shodné se základní frekvencí. Dobrým testem je třeba AIDA64 GPGPU, jelikož v něm dochází do jisté míry k izolování CPU a GPU a v některých dílčích testech pak i k omezení vlivu rychlosti pamětí.

 

V předchozím testu GPU v A10-7850K se jasně ukázalo, že úzkým hrdlem je propustnost paměťové sběrnice. Doufal jsem, že testem stejného GPU jen s 384 stream procesory se to bude dát krásně ukázat, ale bohužel to lehounce znepřehledňuje fakt, že A8-7600 mi ve zkoušených deskách bylo ochotno běžet jen s DDR3-2133 (tedy ne 2400 jako A10-7850K). Něco získává zpět lepší časování, ale i tak je samozřejmě teoretická propustnost ještě nižší.

 

Parametry Radeonu R7 v A8-7600 a detekce schopností videoprocesoru

          

    


 


  

      

AMD do Kaveri také integrovalo novou generaci multimediálních akcelerátorů. Relativně malé změny se týkají obvodu UVD, jenž má dostat robustnější dekodér pro formát H.264 – bude tedy snášet i abnormální streamy a zejména bude použitelnější třeba při ztrátě packetů na síti či jiných přenosových potížích. AMD zatím nepřineslo podporu pro dekódování formátu HEVC (alias H.265). Podle toho, co zatím víme, ji ale nemají mít ani procesory Broadwell. Dekódování H.265 tedy bude probíhat na CPU, nicméně na trhu by se údajně měly objevit softwarové ovladače používající alespoň částečnou akceleraci pomocí OpenCL/HSA (AMD uvádí Telestream Switch).

UVD 4 v Kaveri
UVD 4 v Kaveri

Kaveri však dostane jinou zajímavou novinku týkající se sledování videa, a to technologii nazvanou Fluid Motion Video. Jedná se o řešení situace, která nastává prakticky při každém sledování filmu na počítači. Zatímco zdrojové video má frekvenci 24 snímků za vteřinu, počítačové obrazovky prakticky vždy běží na 60 Hz. Při vykreslování tedy musí GPU kreslit snímky v průměru dvaapůlkrát, což znamená, že snímky jsou střídavě zobrazovány třikrát a dvakrát. Podobně jako microstuttering při hraní toto vede k nepříjemnému cukání obrazu, který lze pozorovat při plynulých zoomech, rotacích a pojezdech kamery, či pokud je na obrazovce plynule se hýbající objekt.

Parametry referenčních karet/grafických řešení

  A8-5800K A10-6800K A8-7600 A10-7850K Pentium G3420 Core i5-4670K
  HD 7660D HD 8670D R7 R7 HD Graphics HD Graph. 4600
Jádro Devastator Devastator Spectre Spectre Haswell GT1 Haswell GT2
Výrobní proces 32 nm 32 nm 28 nm 28 nm 22 nm 22 nm
Velikost jádra 246 mm² 246 mm² 245 mm² 245 mm² 118 mm² 177 mm²
Tranzistorů 1,3 mld. 1,3 mld. 2,41 mld. 2,41 mld. ? mld. 1,4 mld.
Stream procesorů 96 (384) 96 (384) 384 512 10 20
Takt jádra 800 MHz 844 MHz 720 MHz 720 MHz 1100 MHz 1200 MHz
Takt SP 800 MHz 844 MHz 720 MHz 720 MHz 1100 MHz 1200 MHz
ROP/RBE 8 8 8 8 2 2
Texturovacích jedn. 24 24 24 32 2 4
Paměť sdílená sdílená sdílená sdílená sdílená sdílená
Takt pamětí 1866 MHz 2133 MHz 2133 MHz 2400 MHz 1600 MHz 1600 MHz
Šířka sběrnice 128-bit 128-bit 128-bit 128-bit 128-bit 128-bit
Propustnost pamětí 29,9 GB/s 34,1 GB/s 34,1 GB/s 38,4 GB/s 25,6 GB/s 25,6 GB/s
Fillrate (pixely) 6,4 GPx/s 6,75 GPx/s 5,8 GPx/s 5,8 GPx/s 2,2 Gpx/s 2,4 Gpx/s
Fillrate (textury) 19,2 GTx/s 20,3 GTx/s 17,3 GTx/s 23 GTx/s 2,2 GTx/s 4,8 GTx/s
FLOPS ~700 GFLOPS 779 GFLOPS 553 GFLOPS 737 GFLOPS
TDP 100 W (s CPU) 100 W (s CPU) 65 W (s CPU) 95 W (s CPU) 53 W (s CPU) 84 W (s CPU)
Délka karty
DirectX 11.0 11.0 11.2 11.2 11.1 11.1
  A6-5400K Radeon Radeon Radeon Radeon Radeon
  HD 7540D HD 6670 HD 7730 R7 250 HD 7750 R7 260
Jádro Devastator Turks Cape Verde Oland Cape Verde Bonaire
Výrobní proces 32 nm 40 nm 28 nm 28 nm 28 nm 28 nm
Velikost jádra 246 mm² 118 mm² 123 mm² 90 mm² 123 mm² 160 mm²
Tranzistorů 1,3 mld. 716 mil. 1,5 mld. 1,04 mld. 1,5 mld. 2,08 mld.
Stream procesorů 48 (192) 96 (480) 384 384 512 768
Takt jádra 760 MHz 800 MHz 800 MHz 1000/1050 MHz 800 MHz 1000 MHz
Takt SP 760 MHz 800 MHz 800 MHz 1000/1050 MHz 800 MHz 1000 MHz
ROP/RBE 4 8 8 8 16 16
Texturovacích jedn. 24 24 24 24 32 48
Paměť sdílená 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 2 GB GDDR5
Takt pamětí 1866 MHz 4 GHz 4,5 GHz 4,5 GHz 4,5 GHz 6 GHz
Šířka sběrnice 128-bit 128-bit 128-bit 128-bit 128-bit 128-bit
Propustnost pamětí 29,9 GB/s 64 GB/s 72 GB/s 73,6 GB/s 72 GB/s 96 GB/s
Fillrate (pixely) 3 GPx/s 6,4 GPx/s 6,4 GPx/s 8 GPx/s 12,8 GPx/s 16 GPx/s
Fillrate (textury) 18,2 GTx/s 19,2 GTx/s 19,2 GTx/s 24 GTx/s 25,6 GTx/s 48 GTx/s
FLOPS 292 GFLOPS 768 GFLOPS 614 GFLOPS 768 GFLOPS 819 GFLOPS 1536 GFLOPS
TDP 65 W (s CPU) >66 W ? W >65 W >55 W >95 W
Délka karty 15 cm 15 cm 15 cm 15 cm 21 cm
DirectX 11.0 11.0 11.2 11.2 11.2 11.2
  GeForce GeForce GeForce GeForce GeForce  GeForce 
  GT 640 DDR3 GTX 460 GTX 560 GTX 650 GTX 650 Ti GTX 750 Ti
Jádro GK107 GF104 GF114 GK107 GK106 GM107
Výrobní proces 28 nm 40 nm 40 nm 28 nm 28 nm 28 nm
Velikost jádra 118 mm² ~330 mm² ~330 mm² 118 mm² 221 mm² 148 mm²
Tranzistorů 1,3 mld. 1,95 mld. 1,95 mld. 1,3 mld. 2,54 mld. 1,87 mld.
Stream procesorů 384 336 336 384 768 640
Takt jádra 900 MHz 675 MHz  810 MHz 1058 MHz 925 MHz 1020/1085 MHz
Takt SP 900 MHz 1350 MHz 1620 MHz 1058 MHz 925 MHz 1020/1085 MHz
ROP/RBE 16 32 32 16 16 16
Texturovacích jedn. 32 56 56 32 64 40
Paměť 2 GB DDR3 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 2 GB GDDR5
Takt pamětí 1,8 GHz 3600 MHz  4004 MHz 5 GHz 5400 MHz 5400 MHz
Šířka sběrnice 128-bit 256-bit 256-bit 128-bit 128 b 128 b
Propustnost pamětí 28,5 GB/s 115,2 GB/s  128 GB/s 80 GB/s 86,4 GB/s 86,4 GB/s
Fillrate (pixely) 14,4 Gpx/s 21,6 Gpx/s 25,9 Gpx/s 16,9 Gpx/s 14,8 Gpx/s 16,3 Gpx/s
Fillrate (textury) 28,8 Gtx/s 37,8 Gtx/s  45,4 Gtx/s 33,9 Gtx/s 59,2 Gtx/s 40,8 Gtx/s
FLOPS 691 GFLOPS 907 GFLOPS  1088 GFLOPS 813 GFLOPS 1421 GFLOPS 1233 GFLOPS
TDP 65 W 160 W 150 W 64 W 110 W 60 W
Délka karty 15 cm 21 cm 21 cm 15 cm 23 cm 15 cm
DirectX 5.0 11.0 11.0 11.0 11.0 11.0

 

Testovací sestavy a návod na interaktivní grafy

Testovací sestavy

Společným bodem testovacích sestav byly tyto komponenty:

  • procesor: AMD A10-5800K (v případě testování diskrétních grafických karet)
  • chladič: Noctua NH-C12P
  • paměti: 2× 2 GB DDR3-2000 Kingston HyperX T1
    (nastaveny na 1600-8-8-24-1T v případě Intel Core i3/i5 a na 1866-9-10-9-27-1T v případě AMD A10-5800K, na 2133-11-12-11-30-2T s 1,6 V u A10-6800K a konečně 2400-11-13-13-30-2T@1,65V s A10-7850K)
  • zdroj: Seasonic EnergyKnight (T3), 400 W
  • pevný disk: WD Caviar (WD3200AAKS), 320 GB
  • operační systém: Windows 7 Enterprise SP1, 64-bit

Není-li řečeno jinak, je testováno v rozlišení 1920 × 1080 px.

Kingston Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston

 

Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution

 

Monitor

FS2333

K testování grafických karet nám poskytla herní monitor Foris FS2333 společnost EIZO.

EIZO

Platforma FM2+

Při sledování příkon celého PC (platformy) je důležité mít na paměti, že i při stejném nastavení je A88X-Pro trochu „žravější“ než Gigabyte F2A85X-UP4. Tak například v kombinaci s procesorem A10-5800K a zmíněnou GTX 460 (kterou se mi nakonec povedlo v F2A85X-UP4 rozjet) činil rozdíl příkonu celé sestavy v idle 6 W (52 na F2A85X a 58 s A88X-Pro), ve hře World in Conflict, kde je zatíženo poměrno dost CPU i GPU činil rozdíl 5 W (231 vs. 236 W). S GTX 660 ve slotu byl rozdíl kupodivu menší (46 vs. 48 W) a s Radeonem R9 270 jsem se opět dostal na zřetelně více wattů u A88X-Pro (52 vs. 59 W v idle, 210 vs. 220 W ve World in Conflict).

Platforma FM2

APU Trinity a Richland byla osazena do desky Gigabyte A85X-UP4. Ta patří v dané platformě spíše k těm dražším a dá se tedy očekávat, že v případě testů přetaktování lze snadno najít možnosti daného řešení (či alespoň kusu).

AMD A10-5800K s Gigabyte GA-F2A85X-UP4

Platforma LGA 1150

Integrované grafiky CPU Haswell byly otestovány v základní desce Gigabyte Z87X-UD3H.

Platforma LGA 1155

Core i5-3225 jsem testoval v základní desce Gigabyte Z77X-UD5H. Jedná se určitě o vyšší střední třídu desek se silnou napájecí kaskádou pro stabilitu při přetaktování, takže to se mohlo podepsat i na příkonu.

 

Za zapůjčení základních desek děkujeme společnosti Gigabyte

 

Interaktivní grafy 2.0

  1. Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace. 
  2. Pořadí testovaných produktů můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, podle různých skupin apod.
  3. Po najetí myší na některou z položek se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek.
  4. Budete-li chtít nějakou položku v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
  5. Cenu a další základní parametry můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
  6. Zámek základu (produkt, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad produktem (či jeho pruhem v grafu), který chcete uzamknout.
  7. Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problému smažte i příslušné cookies.
  8. Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
  9. V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.

 

 

Aliens vs. Predator, Battlefield 3

Aliens vs. Predator

 

Scénu z úvodu hry jsme nově nahradili samostatným benchmarkem, který je na internetu k dispozici ke stažení zdarma. Běží v režimu DirectX 11 a je o poznání náročnější než náš původní test. Používáme výchozí nastavení benchmarku zahrnující zapnutou teselaci.

     

 

Battlefield 3

V Battlefield 3 je využit předvolený profil nastavení kvality Vysoký. Benchmarkujeme tradičně scénu ze začátku druhého dějství kampaně (výstup z transportéru a briefing na orientálnímu trhu).


 

 

Battlefield 4, BioShock Infinite

Battlefield 4

V Battlefield 4 testuji jednu z nejnáročnějších cutscén kampaně. U multiplayeru budou zejména nároky na CPU vyšší, ale co se náročnosti GPU týče, tak tento průchod lodí s všemožnými efekty patří k těm nejlépe škálujícím.

    

Do celkového výsledku počítám jen předvolený profil nastavení kvality Vysoký. Testuji ale i tři další profily celkového nastavení detailů:

 

BioShock Infinite

Stejně jako další nové hry z AMD Game Evolved (či přímo Never Settle) i BioShock Infinite obsahuje docela hezký zabudovaný benchmark, který odzkouší několik lokací. Nastavení Ultra (DX11) zajistí využití všech moderních ve hře využitých technologií kromě DDOF (Diffusion Depth Of Field). Výsledkem v grafu jsou průměrná fps napříč všemi lokacemi (průměr průměrných fps).

     

Call of Duty 4, Crysis 3

Call of Duty 4: Modern Warfare

Ačkoli se asi nejvíce zapsal druhý díl této série, tak i čtvrtý byl v multiplayeru hodně rozšířen. Nijak zvlášť náročnou hru jsem testoval se všemi detaily na maximu a také s 4× MSAA a 8× AF.

 

Crysis 3

V Crysis 3 jsem nakonec musel zvolit předvolbu Nízký, aby hra byla plynulá alespoň na Radeonu HD 7750. Testuji scénu ze začátku příběhu, kdy se v dešti objevíte v přístavu a máte běžet za Psychem. Po vyběhnutí schodů FRAPS vypínám v první místnosti.

 

Enemy Territory: Quake Wars, F1 2012

Enemy Territory: Quake Wars

Enemy Territory představuje jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám nejvyšší detaily s 4× MSAA a 8× AF, přes konzoli vypínám limit 30 (com_unlockFPS 1) i 60 fps (com_unlock_maxFPS 0, je vhodné nastavit do autoexec.cfg).

    

Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.

 

F1 2012

Formule od Codemasters mají také zabudovaný benchmark a tím testuji celkové nastavení určené profilem Ultra.

   

IL-2 Sturmovik: Cliffs of Dover, Mafia II

IL-2 Sturmovik: Cliffs of Dover

 

V IL-2 Sturmovik: Cliffs of Dover používám replay BlackDeath.trk. 210sekundový průběh záznamu zachytím FRAPSem, předtím v nastavení vyberu profil detailů Vysoké. Anti-aliasing nezapínám, vypnuté zůstává i SSAO.

 

Mafia II

     

Druhou Mafii už i na levných grafikách testuji s celkovým nastavením High, APEX PhysX zůstává vypnuta.

    

Metro Last Light, Resident Evil 6

Metro Last Light

Metro: Last Light - galerie

Metro: Last Light navazuje na postapokalyptické Metro 2033. Hru pohání 4A Engine, který je dílem vývojářů z 4A Games. Stojí za ním spoluautoři X-Ray Engine použitého v herní sérii S.T.A.L.K.E.R. Engine, poprvé použitý v Metro 2033, vznikl pro herní konzole a PC. Podporoval rozhraní DirectX 9, DirectX 10 a DirectX 11 a řadu pokročilých efektů a technik včetně volumetrické mlhy, rozostření (pohybové) objektů, sub-surface scattering (simulace částečné průsvitnosti objektů, což je důležité třeba pro napodobení kůže) nebo parallax mapping (simulace nerovností povrchů). Pro vykreslování obrazu s využitím velkého množství světelných zdrojů se využívá deferred lighting (či deferred shadding nebo rendering).

V novém Metro: Last Light přibyla řada efektů a technologií. Vývojáři ale pořádně zapracovali i na optimalizaci. Hra se i přes lepší grafiku chová při maximálních detailech o poznání lépe než její předchůdce. 

  Very High High Medium Low
Ambient Occlusion Precomputed + SSAO Precomputed + SSAO Approximate Approximate
Analytical Anti-Aliasing Enabled Enabled Enabled Enabled
Bump Mapping Precise Precise Coarse Coarse
Detail Texturing Enabled Enabled Enabled Disabled
Geometric Detail Very High High Normal Low
Image Post-Processing Full Full Normal Normal
Light-Material Interaction Full Normal Normal Normal
Motion Blur Camera + Objects Camera Disabled Disabled
Parallax Mapping Enabled + POM Enabled Disabled Disabled
Shadow Filtering Hi-Quality Hi-Quality Normal Fast
Shadow Resolution 9,43 Mpx 6,55 Mpx 4,19 Mpx 2,35 Mpx
Skin Shading Subsurface Scattering Simple Disabled Disabled
Soft Particles Enabled Enabled Disabled Disabled
Volumetric Texturing Full Quality + Sun Shafts Low Precision Disabled Disabled

Nastavení grafiky přímo ve hře je oproti předchůdci výrazně zjednodušené. Podrobnější nastavení detailů zmizelo a nahradilo je jen globální nastavení. Jak ovlivňuje jednotlivé efekty je shrnuto v tabulce z GeForce.com. Pro podrobnější popis toho, co které nastavení znamená, vás odkáži tamtéž, s příklady by to vydalo na další článek.

 

Resident Evil 6

Pro test RE6 používám samostatný benchmark s výchozím nastavením (FXAA3HQ, Motion Blur: On, Shadow/Texture/Screen Quality: High).


 

     

Sleeping Dogs, Stalker: Call of Pripyat

Sleeping Dogs

 

 Také Sleeping Dogs nemohli být oproštěni od zabudovaného benchmarku. Profil High jsem upravil jen na místě anti-aliasingu (volba Normal znamená pouze FXAA).

 

    

 

Stalker: Call of Pripyat

Ke třetímu dílu Stalkera naštěstí existuje volně šiřitelný benchmark, v něm k testům levných a integrovaných grafik používám k testům průměr ze všech čtyř dílčích výsledků (různých podmínek v testované lokaci). Používám preset High a renderer Enhanced full dynamic lighting (DX11). Kvalita SSAO je nastavena na Nízkou, využívám DX10.1, teselaci i kvalitnější stíny (CHS).

  

The Elder Scrolls V: Skyrim, The Witcher 2 (Zaklínač 2)

The Elder Scrolls V: Skyrim

TES V: Skyrim-0018

Problémy nastíněné v článku Skyrim a HiRes Texture Pack: porovnání grafik mě přivedly na následující metodiku testování: po projití několika uložených pozic a zjištění, že Markarth už nedělá problémy ani Radeonům, ani GeForce, jsem vybral tři uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby), Riverwood (stromy, voda, vesnice) a Ragged Flagon (podzemí Riftenu). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím dvacet sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr tří dvacetisekundových měření. Více o testování v článku Skyrim a HiRes Texture Pack: porovnání grafik.

   

    

První graf je pro méně náročné nastavení, při němž je nejdříve předvolen profil High a poté jen vypnut anti-aliasing. Druhý graf obsahuje výsledky s předvolbou Ultra High a zahrnuje tak právě třeba i 8× MSAA.

 

The Witcher 2

Testováno bylo ve verzi hry 3.3 a měřeno bylo v rozlišení 1920 × 1080 px s upraveným profilem detailů Nízký. Jen limit paměti textur byl navýšen na Vyšší a také vzdálenost zobrazování jsem změnil na Normální.

Po seznámení se hrou jsme vybrali dvě lokace, jež patří určitě mezi nejnáročnější: poslední část kapitoly zvané Vedení útoku, kdy drak proboří hradby a útočí na vaši družinu i nepřátelské vojáky, a z pokročilejší fáze hry potom v lese se odehrávající misi Hnízda Nekkerů. První souhrnný graf prezentuje průměr z těchto dvou lokací.

Více o testování v článku Witcher 2 v2.1 – rychlotest 19 grafických karet

Tomb Raider (2013), Total War: Shogun 2

Tomb Raider (2013)

Tomb Raider screenshots

S novým Tomb Raiderem jste se mohli setkat už ve dvou testech podrobných měření s nástrojem FCAT (viz např. FCAT a testy (ne)plynulosti: když se nehraje jen na průměry), takže jste s teselovanou Larou jistě obeznámeni. V nastavení Normal není měřeno s teselací, v nastavení High je naopak teselaci zkoušena.

   

 

Total War: Shogun 2

 

Plná verze Shoguna 2 nabízí nejen DirectX 11, ale také vestavěný benchmark. Testuji jednak s přednastaveným profilem 1080p High a poté ještě s vlastním nastavením vycházející z celkových detailů „Medium“ s pár úpravami.

World in Conflict, World of Tanks

World in Conflict

Testuji s profilem Nejvyšším (zahrnuje DX10 rendering a 4× MSAA), detailně je použité nastavení vidět na screenshotech:

    

 

World of Tanks 8.5

 

Co se týče využití GPU, jsou nejnáročnější záležitostí World of Tanks určitě křoví nejlépe v kombinaci s pohledem skrze optiku režimu snipera. Takový záznam bitvy s delším střílením skrze křoví na malebné mapě Fjords jsme pořídili a zatím grafiky mučíme s takovýmto nastavením Graphics: Improved, vše na Low, jen Textures a Visibility: Maximum a samozřejmě Extra Effects in Sniper mode: Off.

Instrukce pro srovnatelné testování:

  • uložte replay na pevný disk
  • spusťte FRAPS a na kartě FPS nastavte Stop benchmark after 300 s
  • pokud máte příponu .wotreplay asociovánu s WorldOfTanks.exe, potom na ni stačí poklepat. V opačném případě si vytvořte zástupce WorldOfTanks.exe a .wotreplay na ni přetáhněte
  • počkejte, až na odpočtu bude 00:28 do startu zápasu (vpravo nahoře), pak spusťte logování (implicitně F11)
  • výsledek najdete ve složce Frapsu jako FRAPSLOG.TXT

Více o testování a technické stránce hry v článku World of Tanks: průvodce hardwarem a nastavením pro ty, co spěchají.

Unigine Heaven 4.0 a Valley 1.0

Unigine Heaven 4.0

Jakých změn doznal Heaven, jehož první inkarnace vyšla už v roce 2009? Vývojáři údajně „drasticky“ vylepšili efekt SSDO (scene-space dimensional occlusion), vylepšili refrakci světla na čočkách (lens flare) a do části sekvence, která se odehrává v noci, zapracovali hvězdnou oblohu. Při testech nechávám teselaci na normal, anizotropní filtr nastavuji na 8:1 a multi-sampling raději vypnutý.

  

 

Unigine Valley 1.0

Poslední benchmark od Unigine vaši grafickou kartu potrápí rozlehlou krajinou a hustou, detailně renderovanou vegetací. Nastavení benchmarku vidíte na screenshotu a bude asi ještě chvíli trvat, než jej takto třída grafik zvládne.

3DMark

3DMark

Po rozličných experimentech s názvy jako 3DMark 99, 3DMark 2000 nebo 3DMark Vantage pojmenoval Futuremark nový benchmark nejjednodušeji, jak to šlo – 3DMark. Důvodem je to, že se pod tímto označením nově rozumí celý balík testů.

Verze pro Windows obsahuje tři testy – pro DirectX 11, 10 a 9. Všechny tři testy běží na enginu pro DirectX 11, takže je pro běh 3DMarku vyžadovaný operační systém s podporou DX11 (Windows Vista, Windows 7 a Windows 8), u testů pro nižší verze DirectX se ale využívají jen instrukce příslušené dané verzi, takže k jejich spuštění pak stačí grafická karta s podporou DirectX 10, případně DirectX 9.

Fire Strike

Fire Strike je určený pro výkonná PC, ze tří testů je nejnáročnější, běží pod DirectX 11 a využívá více vláken. Skládá se ze dvou testů grafiky, testu fyziky a kombinovaného testu, který zatěžuje zároveň procesor i grafickou kartu.

V enginu pro tento test se využívá multithreading, teselace (PN triangles, phong a displacement mapping s podporou triangle i quad teselace), deferred lighting, ambient occlusion, pro výpočty osvětlení povrchů může mimo jiné využívat i horizon based screen space ambient occlusion (HBAO), dále volumetrické osvětlení a osvětlení částic. Post processing zahrnuje efekty jako particle based distortion (pod tím si můžete představit třeba vlnění teplého vzduchu), depth of field (hloubka ostrosti), odrazy od čoček, bloom (počítaný Rychlou Fourierovou transformací), antialiasing (MSAA a po tone mappingu FXAA) či simulace dýmu.

Podrobnější popis použitých technologií a způsobu využití najdete opět v původní dokumentaci v angličtině, jejich přepis by vydal na další čtyři strany (kvůli používané terminologii beztak napůl anglického textu). Pokud se v daných technologiích orientujete, nemělo by vám to ani v angličtině dělat problémy.

Cloud Gate

Cloud Gate je navržený pro notebooky a domácí PC. Jde o méně náročný test, který využívá pouze rozšíření DirectX 10_0, takže se dá pouštět i na starších kartách nebo integrovaných grafikách, které DirectX 11 nepodporují. Samotný engine, na kterém běží, ale DirectX 11 vyžaduje, takže je pro spuštění zapotřebí, aby vše bylo nainstalované na operačním systému, který DirectX 11 podporuje.

Test je složený ze dvou test grafické karty a jednoho testu fyziky a je ekvivalentem pro 3DMark Vantage (v tom, že oba běží na DirectX 10). Použitý engine se ale samozřejmě liší a ani výsledné skóre není vzájemně porovnatelné. Pro test se využívá stejný engine jako u Fire Strike, pochopitelně bez rozšíření DX11.

Standardně se testuje v rozlišení 1280 × 720 bodů, test je stavěný na 256 MB videopaměti.

Ice Storm

Ice Storm je určen pro měření výkonu tabletů, ultrapřenosných notebooků a levných PC. Na měření výkonu GPU slouží první dva testy, ve třetím se testuje fyzika.

 

Jde o (pro PC) hodně nenáročný test, který na GeForce GTX 660 Ti někde pod dvěma tisíci fps. Má být jakýmsi ekvivalentem pro 3DMark06 pro DirectX 9, byť už není jako 3DMark06 svého času postavený na testování výkonných PC, ale na rozdíl od něj už je určený pro test výkonných mobilních zařízení.

Standardní rozlišení pro test je 1280 × 720 bodů a počítá se se 128 MB grafické paměti. S rozličnými rozměry displejů mobilních zařízení se Futuremark vyrovnal tím, že obraz v daném rozlišení renderuje napevno a následně jej zvětšuje nebo zmenšuje podle rozměrů obrazovky.

Výsledky v detailech

Radeon R7 (A8-7600)

  

  

GeForce GTX 750 Ti

   

    

Radeon R7 (A10-7850K)

   

    

Radeon HD 5770

  

   

Radeon R9 270 OC

   

   

GeForce GTX 660 OC

    

    

Radeon HD 6950

   

  

GeForce GTX 560

   

  

GeForce GTX 460

  

   

Radeon R7 260X

 

 

Radeon HD 5850

 

Radeon HD 7850 OC 1 GB

   

   

GeForce GTX 650 Ti OC

  

    

GeForce GTX 650 Ti Boost OC

   

    

GeForce GT 640 GDDR5

  

   

Radeon HD 7770 GHz Ed.

   

    

Radeon HD 7790

  

    

Radeon HD 7730

  

   

Radeon HD 6670

   

    

GeForce GTX 650

  

   

GeForce GT 640

 

 

AMD Radeon HD 8670D

  

     

Intel HD 4600

  

   

Intel HD 4000

  

AMD Radeon HD 7660D

   

AMD Radeon HD 7540D

  

   

AMD Radeon HD 7750

    

   

Příkon (spotřeba), shrnutí výkonu a vyhodnocení

Příkon (spotřeba)

wattmetr

Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce.

Při testování příkonu při přehrávání videa je využit program Media Player Classic Home Cinema. To, kde je DXVA (GPU) akcelerace přehrávání videa aktivní, poznáte asi i bez průkazného screenshotu.

 

Přetaktování

GPU v A8-7600 nelze v podstatě nijak pomoct. Už frekvenci 2400 MHz (i s AMP) mi toto APU odmítalo a posuvník v AMD OverDrive pro navýšení frekvence ze 720 MHz výše asi zapomněl jen někdo deaktivovat. Můžete si sice navolit nějakou frekvenci, ta se následně reportuje jako skutečně navolená, ale výkon zůstane stejný (= ve skutečnosti zůstane frekvence 720 MHz).


 

   

Shrnutí výkonu a verdikt

Shrnující graf je vytvořen tak, že v každé hře tvoří 100 % (základ) nejlepší výkon a od něj jsou odvezeny další relativní výkony. Takto nemá žádná hra větší váhu. V případě her, kde jsou kvůli změně metodiky otestována dvě nastavení (Tomb Raider, Bioshock Infinite, Shogun 2: Total War, World of Tanks, F1 2012 a Aliens vs. Predator), jsem do průměru v tomto případě už započítal méně náročné nastavení. Slabší grafiky tak nejsou penalizovány a naopak spíše méně vynikne odstup karet jako R9 270 či GTX 660.

Jelikož jsem u spousty her jako Battlefield 3, Crysis 3, IL-2: Cliffs of Dover, Skyrim nebo Witcher 2 ještě speciálně kvůli souboji GTX 660 s R9 270 metodiku rozšířil o měření náročnějšího nastavení (vysokých či maximálních detailů). Pokud bych průměroval jen tato náročnější nastavení a vyškrtl z počítání hry, kde obě karty běží v průměru nad 100 fps (ET:QW a Call of Duty 4). Do průměrování je přidána hra Battlefield 4 (v celkovém nastavení vysokých detailů):

Ale jak by to dopadlo, kdybych se soustředil jen na vybrání těch skutečně náročných karet i pro kalibr typu R9 270 OC? Následující graf právě ukazuje průměr z her, kde se i grafiky za 4500 Kč notně zapotí (Battlefield 4, Bioshock Infinite (Ultra), Metro Last Light (High + Teselace), Skyrim (Ultra, 8× MSAA), Tomb Raider (High + Teselace), Total War: Shogun 2, Witcher 2 a World of Tanks s max. detaily):

Jestli se vám to nechce počítat, ale stejně po tom prahnete, tak tady (pro diskrétní grafiky) najdete jednoduché srovnání poměru výkon/cena. Žádný index nenajdete u karet, které se již neprodávají, a také u IGP. 

Verdikt

Spectre v A8-7600 je asi tak výkonný jako Devastator v nejlepším Richlandu (A10-6800K). Cena je nižší, příkon taky, frekvence pamětí stačí stejná. Z této stránky opět dobré. Jenže je tu možnost kombinace CPU s cenou kolem 1500 Kč s podobně drahou diskrétní grafikou. GeForce GT 640 i Radeon HD 7730 (či 6670) vyjdou sice o něco dráž, nicméně příplatek jde na výkonu jasně vidět. A pokud bychom místo v dvoujádrového Pentia architektury Haswell vzali v úvahu dvoujádrový Celeron téže generace, pak se s velkou pravděpodobností za nižší cenu dostaneme na lepší herní výkon.

 

APU bude zajímavé tam, kde už se prostě žádná diskrétní grafika nevejde. V případě A8-7600 tomu nahrává nižší příkon než u A10-7850K (všimněte si, že v herních testech ale není rozdíl 30 W jako stanovuje TDP) a tím předpoklady pro cpaní do maličkých PC s nevalným chlazením. Znovu připomínám, že testovací deska Asus A88X-Pro má vyšší příkon než by bylo potřeba a s nějakými mini-ITX deskami se dostanete na třeba i o 10 W nižší hodnoty.

Radeon R7 (A10-7600K)

Plusy / mínusy
  výkonnější grafika než v Richlandu, rozdíl oproti R7 v A10 není velký
  zlepšuje možnosti postavit velmi malé PC použitelné na hry
  moderní technologie (DirectX 11.2, Mantle, TrueAudio, OpenCL 1.2, HSA, …)
  pokročilý videoprocesor
  podpora tří monitorů v Eyefinity
  nízké zahřívání
  cena (kombinace levných CPU s GT 640 či HD 7730 vyjde lépe)
  citelné omezení dvěma kanály DDR3 a frekvencí 2133 MHz
  GPU nelze přetaktovat
Cena 2900 Kč vč. DPH (cena za APU, odhad z doporučené ceny AMD)

Další testy A10-7850K či A8-7600 hledejte v tématu AMD Kaveri – „extra“ testy, GPGPU, přetaktování….

Radeon R7 v A8-7600: poznáte rozdíl 384 a 512 stream procesorů?

Ohodnoťte tento článek!