První Maxwell v testu: supertichá MSI GeForce GTX 750 Ti Gaming

0

Everything For Efficiency

Když Nvidia už někdy v době uvedení Fermi ukazovala grafy s exponenciální křivkou vyjadřující nárůsty efektivity dalších generací GPU (populární výkon/watt), zapochybovali asi nejen příznivci její konkurence. Po Fermi však přišel Kepler a pravděpodobně do načrtnuté exponenciály zapadl. GeForce GTX 750 Ti a GTX 750 jsou prvními vyslankyněmi architektury Maxwell a mají tak ještě ve zmíněném ohledu dalece předčit všechna GPU Kepler.

Nvidia přitom musela ale pracovat s tím, co je – tedy 28nm výrobním procesem. Sama uvádí, že po stránce funkcí je Maxwell takřka stejný jako Kepler. Spousta prvků v GPU je ale redesignována tak, aby byla co nejefektivnější. První čip z rodiny Maxwellů – GM107 – míří do nižší střední třídy a Nvidia nahrazuje GeForce GTX 650 Ti. To je grafická karta za ceny kolem 3000 Kč a blízko této hranice se pohybovala také GTX 650 Ti Boost. O ní se Nvidia zmíní teprve na explicitní otázku a stručně odpovídá, že tato karta už byla dříve ukončena.

Letmý pohled na uspořádání čipu vám neprozradí žádné zásadní změny. Ve srovnání Kepleru a Maxwellu jsou však důležité počty prováděcích jednotek a samozřejmě TDP:

  GTX 650 GTX 650 Ti GTX 750 GTX 750 Ti GTX 650 Ti Boost GTX 660
Jádro GK107 GK106 GM107 GM107 GK106 GK106
Velikost jádra 118 mm² 221 mm² 148 mm² 148 mm² 221 mm² 221 mm²
Tranzistorů 1,3 mld. 2,54 mld. 1,87 mld. 1,87 mld. 2,54 mld. 2,54 mld.
Stream procesorů 384 768 512 640 768 960
Takt jádra 1058 MHz 925 MHz 1020/1085 MHz 1020/1085 MHz 980/1033 MHz 980/1033 MHz
ROP/RBE 16 16 16 16 24 24
Texturovacích jedn. 32 64 32 40 64 80
Takt pamětí 5 GHz 5400 MHz 5400 MHz 5400 MHz 6008 MHz 6008 MHz
Šířka sběrnice 128-bit 128 b 128 b 128 b 192 b 192 b
Propustnost pamětí 80 GB/s 86,4 GB/s 86,4 GB/s 86,4 GB/s 144,2 GB/s 144,2 GB/s
Fillrate (textury) 33,9 Gtx/s 59,2 Gtx/s 32,6 Gtx/s 40,8 Gtx/s 62,7 Gtx/s 78,4 Gtx/s
TDP 64 W 110 W 55 W 60 W 134 W 140 W

GM107 papírově nevypadá opravdu bůhvíjak úžasně. Nvidia však přepracovala ALU tak, že každý SM obsahující původně u Kepleru celkem 192 stream procesorů (v hantýrce Nvidie CUDA procesorů) už není opatřen jednou řídící jednotkou, ale celkem čtyřmi. Navíc SM už je složen jen z celkem 128 SP, takže jedna kontrolní jednotka připadá na 32 SP. To dle slov Nvidie přineslo o 35 % výkonu navíc a především zdvojnásobení výkonu na watt. Co se týče šířky paměťové sběrnice (128 bitů) a relativné nízkého taktu GDDR5 (5,4 GHz efektivně), tak Nvidia tvrdí, že díky efektivní práci L2 cache v Maxwellu je dopad tohoto úzkého hrdla minimalizován.

Nvidia si jako působivá srovnání vytahuje karty z minulých generací. Například GTX 480 s TDP 250 W by měla dnes podle Nvidie předvést asi tak podobný výkon jako 60W GTX 750 Ti a údajně ještě stále populární GTX 550 Ti má ani ne poloviční herní výkon při takřka dvojnásobném příkonu. Z konkurence si bere na mušku Radeon R7 260X, který by měl být ve většině her asi o 10–25 % pomalejší a mít také takřka dvakrát vyšší TDP.

 

První otestovanou GTX 750 Ti se na EHW stala karta od MSI. Ta je v edici Gaming mírně přetaktována, ale především je na vlastním (větším) PCB s už mnohokrát vychváleným chladičem Twin Frozr IV. Na provedení mě trochu drásá volba výstupů: D-Sub, DVI-D a HDMI. Správně to mělo být DVI-I, HDMI a DisplayPort. Tak snad příště.


 


 


 


 

Referenční GeForce GTX 750 (Ti) je mnohem kratší (necelých 15 cm) a má velmi jednoduchý chladič. Přídavné napájení nepotřebuje ani jedna varianta GM107.

MSI bude GTX 750 i 750 Ti prodávat i ve variantě s jednodušším chladičem a o dvě stovky levněji.

Nvidia pro GTX 750 Ti stanovila cenu 115 EUR a u nás by to mělo být 3799 Kč vč. DPH (doporučená maloobchodní cena). GTX 750 s 1 GB GDDR5 by měla být k mání za 92 EUR čili 2999 Kč vč. DPH. MSI GTX 750 Ti OC s Twin Frozr IV bude stát 3950 Kč, s obyčejným chladičem pak 3750 Kč. Tytéž variace od MSI na téma GTX 750 (bez Ti) přijdou na 3150, resp. 2950 Kč.

Parametry GTX 750 Ti a detekce schopností videoprocesoru

    

 

      

Ovladače GeForce 334.69

               

GPGPU testy

 
 

Parametry referenčních karet/grafických řešení

  GeForce GeForce  GeForce  GeForce  GeForce GeForce 
  GTX 650 GTX 650 Ti GTX 750 GTX 750 Ti GTX 650 Ti Boost GTX 660
Jádro GK107 GK106 GM107 GM107 GK106 GK106
Výrobní proces 28 nm 28 nm 28 nm 28 nm 28 nm 28 nm
Velikost jádra 118 mm² 221 mm² 148 mm² 148 mm² 221 mm² 221 mm²
Tranzistorů 1,3 mld. 2,54 mld. 1,87 mld. 1,87 mld. 2,54 mld. 2,54 mld.
Stream procesorů 384 768 512 640 768 960
Takt jádra 1058 MHz 925 MHz 1020/1085 MHz 1020/1085 MHz 980/1033 MHz 980/1033 MHz
Takt SP 1058 MHz 925 MHz 1020/1085 MHz 1020/1085 MHz 980/1033 MHz 980/1033 MHz
ROP/RBE 16 16 16 16 24 24
Texturovacích jedn. 32 64 32 40 64 80
Paměť 1 GB GDDR5 1 GB GDDR5 1/2 GB GDDR5 2 GB GDDR5 2 GB GDDR5 2 GB GDDR5
Takt pamětí 5 GHz 5400 MHz 5400 MHz 5400 MHz 6008 MHz 6008 MHz
Šířka sběrnice 128-bit 128 b 128 b 128 b 192 b 192 b
Propustnost pamětí 80 GB/s 86,4 GB/s 86,4 GB/s 86,4 GB/s 144,2 GB/s 144,2 GB/s
Fillrate (pixely) 16,9 Gpx/s 14,8 Gpx/s 16,3 Gpx/s 16,3 Gpx/s 23,5 Gpx/s 23,5 Gpx/s
Fillrate (textury) 33,9 Gtx/s 59,2 Gtx/s 32,6 Gtx/s 40,8 Gtx/s 62,7 Gtx/s 78,4 Gtx/s
FLOPS 813 GFLOPS 1421 GFLOPS 986 GFLOPS 1233 GFLOPS 1881 GFLOPS 1888 GFLOPS
TDP 64 W 110 W 55 W 60 W 134 W 140 W
Délka karty 15 cm 23 cm 15 cm 15 cm 23 cm 23 cm
DirectX 11.0 11.0 11.0 11.0 11.0 11.0
  Radeon Radeon Radeon Radeon Radeon Radeon
  HD 7750 R7 260 HD 7770 GHz Ed. HD 7850 R7 260X R9 270
Jádro Cape Verde Bonaire Cape Verde Pitcairn Bonaire Curacao
Výrobní proces 28 nm 28 nm 28 nm 28 nm 28 nm 28 nm
Velikost jádra 123 mm² 160 mm² 123 mm² 212 mm² 160 mm² 212 mm²
Tranzistorů 1,5 mld. 2,08 mld. 1,5 mld. 2,8 mld. 2,08 mld. 2,8 mld.
Stream procesorů 512 768 640 1024 896 1280
Takt jádra 800 MHz 1000 MHz 1000 MHz 860 MHz 1100 MHz 900/925 MHz
Takt SP 800 MHz 1000 MHz 1000 MHz 860 MHz 1100 MHz 900/925 MHz
ROP/RBE 16 16 16 32 16 32
Texturovacích jedn. 32 48 40 64 56 80
Paměť 1 GB GDDR5 2 GB GDDR5 1 GB GDDR5 2 GB GDDR5 2 GB GDDR5 2 GB GDDR5
Takt pamětí 4,5 GHz 6 GHz 4,5 GHz 4,8 GHz 6,5 GHz 5,6 GHz
Šířka sběrnice 128-bit 128-bit 128-bit 256-bit 128-bit 256-bit
Propustnost pamětí 72 GB/s 96 GB/s 72 GB/s 153,6 GB/s 104 GB/s  179,2 GB/s
Fillrate (pixely) 12,8 GPx/s 16 GPx/s 16 GPx/s 27,5 GPx/s 17,6 GPx/s 29,6 GPx/s
Fillrate (textury) 25,6 GTx/s 48 GTx/s 40 GTx/s 55 GTx/s 61,6 GTx/s 74 GTx/s
FLOPS 819 GFLOPS 1536 GFLOPS 1280 GFLOPS 1761 GFLOPS 1969 GFLOPS 2,37 TFLOPS
TDP >55 W >95 W >80 W >130 W >115 W >150 W
Délka karty 15 cm 21 cm 17 cm 21 cm 21 cm 25 cm (MSI)
DirectX 11.2 11.2 11.2 11.2 11.2 11.2
  GeForce GeForce GeForce Radeon Radeon Radeon
  GT 640 DDR3 GTX 460 GTX 560 HD 6670 HD 7730 R7 250
Jádro GK107 GF104 GF114 Turks Cape Verde Oland
Výrobní proces 28 nm 40 nm 40 nm 40 nm 28 nm 28 nm
Velikost jádra 118 mm² ~330 mm² ~330 mm² 118 mm² 123 mm² 90 mm²
Tranzistorů 1,3 mld. 1,95 mld. 1,95 mld. 716 mil. 1,5 mld. 1,04 mld.
Stream procesorů 384 336 336 96 (480) 384 384
Takt jádra 900 MHz 675 MHz  810 MHz 800 MHz 800 MHz 1000/1050 MHz
Takt SP 900 MHz 1350 MHz 1620 MHz 800 MHz 800 MHz 1000/1050 MHz
ROP/RBE 16 32 32 8 8 8
Texturovacích jedn. 32 56 56 24 24 24
Paměť 2 GB DDR3 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5 1 GB GDDR5
Takt pamětí 1,8 GHz 3600 MHz  4004 MHz 4 GHz 4,5 GHz 4,5 GHz
Šířka sběrnice 128-bit 256-bit 256-bit 128-bit 128-bit 128-bit
Propustnost pamětí 28,5 GB/s 115,2 GB/s  128 GB/s 64 GB/s 72 GB/s 73,6 GB/s
Fillrate (pixely) 14,4 Gpx/s 21,6 Gpx/s 25,9 Gpx/s 6,4 GPx/s 6,4 GPx/s 8 GPx/s
Fillrate (textury) 28,8 Gtx/s 37,8 Gtx/s  45,4 Gtx/s 19,2 GTx/s 19,2 GTx/s 24 GTx/s
FLOPS 691 GFLOPS 907 GFLOPS  1088 GFLOPS 768 GFLOPS 614 GFLOPS 768 GFLOPS
TDP 65 W 160 W 150 W >66 W ? W >65 W
Délka karty 15 cm 21 cm 21 cm 15 cm 15 cm 15 cm
DirectX 5.0 11.0 11.0 11.0 11.2 11.2
  A6-5400K A8-5800K A10-6800K A10-7850K Pentium G3420 Core i5-4670K
  HD 7540D HD 7660D HD 8670D R7 HD Graphics HD Graph. 4600
Jádro Devastator Devastator Devastator Spectre Haswell GT1 Haswell GT2
Výrobní proces 32 nm 32 nm 32 nm 28 nm 22 nm 22 nm
Velikost jádra 246 mm² 246 mm² 246 mm² 245 mm² 118 mm² 177 mm²
Tranzistorů 1,3 mld. 1,3 mld. 1,3 mld. 2,41 mld. ? mld. 1,4 mld.
Stream procesorů 48 (192) 96 (384) 96 (384) 512 10 20
Takt jádra 760 MHz 800 MHz 844 MHz 720 MHz 1100 MHz 1200 MHz
Takt SP 760 MHz 800 MHz 844 MHz 720 MHz 1100 MHz 1200 MHz
ROP/RBE 4 8 8 8 2 2
Texturovacích jedn. 24 24 24 32 2 4
Paměť sdílená sdílená sdílená sdílená sdílená sdílená
Takt pamětí 1866 MHz 1866 MHz 2133 MHz 2400 MHz 1600 MHz 1600 MHz
Šířka sběrnice 128-bit 128-bit 128-bit 128-bit 128-bit 128-bit
Propustnost pamětí 29,9 GB/s 29,9 GB/s 34,1 GB/s 38,4 GB/s 25,6 GB/s 25,6 GB/s
Fillrate (pixely) 3 GPx/s 6,4 GPx/s 6,75 GPx/s 5,8 GPx/s 2,2 Gpx/s 2,4 Gpx/s
Fillrate (textury) 18,2 GTx/s 19,2 GTx/s 20,3 GTx/s 23 GTx/s 2,2 GTx/s 4,8 GTx/s
FLOPS 292 GFLOPS ~700 GFLOPS 779 GFLOPS 737 GFLOPS
TDP 65 W (s CPU) 100 W (s CPU) 100 W (s CPU) 95 W (s CPU) 53 W (s CPU) 84 W (s CPU)
Délka karty
DirectX 11.0 11.0 11.0 11.2 11.1 11.1

 

Testovací sestavy a návod na interaktivní grafy

Testovací sestavy

Společným bodem testovacích sestav byly tyto komponenty:

  • procesor: AMD A10-5800K (v případě testování diskrétních grafických karet)
  • chladič: Noctua NH-C12P
  • paměti: 2× 2 GB DDR3-2000 Kingston HyperX T1
    (nastaveny na 1600-8-8-24-1T v případě Intel Core i3/i5 a na 1866-9-10-9-27-1T v případě AMD A10-5800K, na 2133-11-12-11-30-2T s 1,6 V u A10-6800K a konečně 2400-11-13-13-30-2T@1,65V s A10-7850K)
  • zdroj: Seasonic EnergyKnight (T3), 400 W
  • pevný disk: WD Caviar (WD3200AAKS), 320 GB
  • operační systém: Windows 7 Enterprise SP1, 64-bit

Není-li řečeno jinak, je testováno v rozlišení 1920 × 1080 px.

Kingston Za zapůjčení pamětí DDR3 děkujeme společnosti Kingston

 

Za poskytnutí chladiče Noctua NH-C12P a teplovodivé pasty Noctua NT-H1 děkujeme společnosti RASCOM Computerdistribution

 

Monitor

FS2333

K testování grafických karet nám poskytla herní monitor Foris FS2333 společnost EIZO.

EIZO

Platforma FM2+

Při sledování příkon celého PC (platformy) je důležité mít na paměti, že i při stejném nastavení je A88X-Pro trochu „žravější“ než Gigabyte F2A85X-UP4. Tak například v kombinaci s procesorem A10-5800K a zmíněnou GTX 460 (kterou se mi nakonec povedlo v F2A85X-UP4 rozjet) činil rozdíl příkonu celé sestavy v idle 6 W (52 na F2A85X a 58 s A88X-Pro), ve hře World in Conflict, kde je zatíženo poměrno dost CPU i GPU činil rozdíl 5 W (231 vs. 236 W). S GTX 660 ve slotu byl rozdíl kupodivu menší (46 vs. 48 W) a s Radeonem R9 270 jsem se opět dostal na zřetelně více wattů u A88X-Pro (52 vs. 59 W v idle, 210 vs. 220 W ve World in Conflict).

Platforma FM2

APU Trinity a Richland byla osazena do desky Gigabyte A85X-UP4. Ta patří v dané platformě spíše k těm dražším a dá se tedy očekávat, že v případě testů přetaktování lze snadno najít možnosti daného řešení (či alespoň kusu).

AMD A10-5800K s Gigabyte GA-F2A85X-UP4

Platforma LGA 1150

Integrované grafiky CPU Haswell byly otestovány v základní desce Gigabyte Z87X-UD3H.

Platforma LGA 1155

Core i5-3225 jsem testoval v základní desce Gigabyte Z77X-UD5H. Jedná se určitě o vyšší střední třídu desek se silnou napájecí kaskádou pro stabilitu při přetaktování, takže to se mohlo podepsat i na příkonu.

 

Za zapůjčení základních desek děkujeme společnosti Gigabyte

 

Interaktivní grafy 2.0

  1. Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace. 
  2. Pořadí testovaných produktů můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, podle různých skupin apod.
  3. Po najetí myší na některou z položek se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek.
  4. Budete-li chtít nějakou položku v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
  5. Cenu a další základní parametry můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
  6. Zámek základu (produkt, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad produktem (či jeho pruhem v grafu), který chcete uzamknout.
  7. Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problému smažte i příslušné cookies.
  8. Interaktivní grafy 2.0 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 11.x), Internet Explorer 8 a 9 (verze 7 a starší už nejsou podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
  9. V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.

 

 

Aliens vs. Predator, Battlefield 3

Aliens vs. Predator

 

Scénu z úvodu hry jsme nově nahradili samostatným benchmarkem, který je na internetu k dispozici ke stažení zdarma. Běží v režimu DirectX 11 a je o poznání náročnější než náš původní test. Používáme výchozí nastavení benchmarku zahrnující zapnutou teselaci.

     

 

Battlefield 3

V Battlefield 3 je využit předvolený profil nastavení kvality Vysoký. Benchmarkujeme tradičně scénu ze začátku druhého dějství kampaně (výstup z transportéru a briefing na orientálnímu trhu).


 

 

Battlefield 4, BioShock Infinite

Battlefield 4

V Battlefield 4 testuji jednu z nejnáročnějších cutscén kampaně. U multiplayeru budou zejména nároky na CPU vyšší, ale co se náročnosti GPU týče, tak tento průchod lodí s všemožnými efekty patří k těm nejlépe škálujícím.

    

Do celkového výsledku počítám jen předvolený profil nastavení kvality Vysoký. Testuji ale i tři další profily celkového nastavení detailů:

 

BioShock Infinite

Stejně jako další nové hry z AMD Game Evolved (či přímo Never Settle) i BioShock Infinite obsahuje docela hezký zabudovaný benchmark, který odzkouší několik lokací. Nastavení Ultra (DX11) zajistí využití všech moderních ve hře využitých technologií kromě DDOF (Diffusion Depth Of Field). Výsledkem v grafu jsou průměrná fps napříč všemi lokacemi (průměr průměrných fps).

     

Call of Duty 4, Crysis 3

Call of Duty 4: Modern Warfare

Ačkoli se asi nejvíce zapsal druhý díl této série, tak i čtvrtý byl v multiplayeru hodně rozšířen. Nijak zvlášť náročnou hru jsem testoval se všemi detaily na maximu a také s 4× MSAA a 8× AF.

 

Crysis 3

V Crysis 3 jsem nakonec musel zvolit předvolbu Nízký, aby hra byla plynulá alespoň na Radeonu HD 7750. Testuji scénu ze začátku příběhu, kdy se v dešti objevíte v přístavu a máte běžet za Psychem. Po vyběhnutí schodů FRAPS vypínám v první místnosti.

 

Enemy Territory: Quake Wars, F1 2012

Enemy Territory: Quake Wars

Enemy Territory představuje jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám nejvyšší detaily s 4× MSAA a 8× AF, přes konzoli vypínám limit 30 (com_unlockFPS 1) i 60 fps (com_unlock_maxFPS 0, je vhodné nastavit do autoexec.cfg).

    

Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.

 

F1 2012

Formule od Codemasters mají také zabudovaný benchmark a tím testuji celkové nastavení určené profilem Ultra.

   

IL-2 Sturmovik: Cliffs of Dover, Mafia II

IL-2 Sturmovik: Cliffs of Dover

 

V IL-2 Sturmovik: Cliffs of Dover používám replay BlackDeath.trk. 210sekundový průběh záznamu zachytím FRAPSem, předtím v nastavení vyberu profil detailů Vysoké. Anti-aliasing nezapínám, vypnuté zůstává i SSAO.

 

Mafia II

     

Druhou Mafii už i na levných grafikách testuji s celkovým nastavením High, APEX PhysX zůstává vypnuta.

    

Metro Last Light, Resident Evil 6

Metro Last Light

Metro: Last Light - galerie

Metro: Last Light navazuje na postapokalyptické Metro 2033. Hru pohání 4A Engine, který je dílem vývojářů z 4A Games. Stojí za ním spoluautoři X-Ray Engine použitého v herní sérii S.T.A.L.K.E.R. Engine, poprvé použitý v Metro 2033, vznikl pro herní konzole a PC. Podporoval rozhraní DirectX 9, DirectX 10 a DirectX 11 a řadu pokročilých efektů a technik včetně volumetrické mlhy, rozostření (pohybové) objektů, sub-surface scattering (simulace částečné průsvitnosti objektů, což je důležité třeba pro napodobení kůže) nebo parallax mapping (simulace nerovností povrchů). Pro vykreslování obrazu s využitím velkého množství světelných zdrojů se využívá deferred lighting (či deferred shadding nebo rendering).

V novém Metro: Last Light přibyla řada efektů a technologií. Vývojáři ale pořádně zapracovali i na optimalizaci. Hra se i přes lepší grafiku chová při maximálních detailech o poznání lépe než její předchůdce. 

  Very High High Medium Low
Ambient Occlusion Precomputed + SSAO Precomputed + SSAO Approximate Approximate
Analytical Anti-Aliasing Enabled Enabled Enabled Enabled
Bump Mapping Precise Precise Coarse Coarse
Detail Texturing Enabled Enabled Enabled Disabled
Geometric Detail Very High High Normal Low
Image Post-Processing Full Full Normal Normal
Light-Material Interaction Full Normal Normal Normal
Motion Blur Camera + Objects Camera Disabled Disabled
Parallax Mapping Enabled + POM Enabled Disabled Disabled
Shadow Filtering Hi-Quality Hi-Quality Normal Fast
Shadow Resolution 9,43 Mpx 6,55 Mpx 4,19 Mpx 2,35 Mpx
Skin Shading Subsurface Scattering Simple Disabled Disabled
Soft Particles Enabled Enabled Disabled Disabled
Volumetric Texturing Full Quality + Sun Shafts Low Precision Disabled Disabled

Nastavení grafiky přímo ve hře je oproti předchůdci výrazně zjednodušené. Podrobnější nastavení detailů zmizelo a nahradilo je jen globální nastavení. Jak ovlivňuje jednotlivé efekty je shrnuto v tabulce z GeForce.com. Pro podrobnější popis toho, co které nastavení znamená, vás odkáži tamtéž, s příklady by to vydalo na další článek.

 

Resident Evil 6

Pro test RE6 používám samostatný benchmark s výchozím nastavením (FXAA3HQ, Motion Blur: On, Shadow/Texture/Screen Quality: High).


 

     

Sleeping Dogs, Stalker: Call of Pripyat

Sleeping Dogs

 

 Také Sleeping Dogs nemohli být oproštěni od zabudovaného benchmarku. Profil High jsem upravil jen na místě anti-aliasingu (volba Normal znamená pouze FXAA).

 

    

 

Stalker: Call of Pripyat

Ke třetímu dílu Stalkera naštěstí existuje volně šiřitelný benchmark, v něm používám k testům pouze čtvrtou, nejnáročnější část (nastavení se slunečními paprsky – SunShafts). Vše je nastaveno na naprosté maximum (DX11 funkce jako teselace nebo CHS), MSAA pak na stupeň 4×.

  

The Elder Scrolls V: Skyrim, The Witcher 2 (Zaklínač 2)

The Elder Scrolls V: Skyrim

TES V: Skyrim-0018

Problémy nastíněné v článku Skyrim a HiRes Texture Pack: porovnání grafik mě přivedly na následující metodiku testování: po projití několika uložených pozic a zjištění, že Markarth už nedělá problémy ani Radeonům, ani GeForce, jsem vybral tři uložené pozice v lokacích Whiterun (pohled na velkou část měst a ještě i za hradby), Riverwood (stromy, voda, vesnice) a Ragged Flagon (podzemí Riftenu). Po nahrání uložené pozice počkám, až se uklidní ukazatel se snímky za sekundu (načítání z disku, obyčejně je to ale tak dvě až tři sekundy po zmizení nahrávací obrazovky) a poté měřím dvacet sekund (nastaveno ve FRAPSu). Nahraji další pozici a postup opakuji. V grafu je hodnota průměrných fps spočtena jako průměr tří dvacetisekundových měření. Více o testování v článku Skyrim a HiRes Texture Pack: porovnání grafik.

   

    

První graf je pro méně náročné nastavení, při němž je nejdříve předvolen profil High a poté jen vypnut anti-aliasing. Druhý graf obsahuje výsledky s předvolbou Ultra High a zahrnuje tak právě třeba i 8× MSAA.

 

The Witcher 2

Testováno bylo ve verzi hry 3.3 a měřeno bylo v rozlišení 1920 × 1080 px s upraveným profilem detailů Nízký. Jen limit paměti textur byl navýšen na Vyšší a také vzdálenost zobrazování jsem změnil na Normální.

Po seznámení se hrou jsme vybrali dvě lokace, jež patří určitě mezi nejnáročnější: poslední část kapitoly zvané Vedení útoku, kdy drak proboří hradby a útočí na vaši družinu i nepřátelské vojáky, a z pokročilejší fáze hry potom v lese se odehrávající misi Hnízda Nekkerů. První souhrnný graf prezentuje průměr z těchto dvou lokací.

Více o testování v článku Witcher 2 v2.1 – rychlotest 19 grafických karet

Tomb Raider (2013), Total War: Shogun 2

Tomb Raider (2013)

Tomb Raider screenshots

S novým Tomb Raiderem jste se mohli setkat už ve dvou testech podrobných měření s nástrojem FCAT (viz např. FCAT a testy (ne)plynulosti: když se nehraje jen na průměry), takže jste s teselovanou Larou jistě obeznámeni. V nastavení Normal není měřeno s teselací, v nastavení High je naopak teselaci zkoušena.

   

 

Total War: Shogun 2

 

Plná verze Shoguna 2 nabízí nejen DirectX 11, ale také vestavěný benchmark. Testuji jednak s přednastaveným profilem 1080p High a poté ještě s vlastním nastavením vycházející z celkových detailů „Medium“ s pár úpravami.

World in Conflict, World of Tanks

World in Conflict

Testuji s profilem Nejvyšším (zahrnuje DX10 rendering a 4× MSAA), detailně je použité nastavení vidět na screenshotech:

    

 

World of Tanks 8.5

 

Co se týče využití GPU, jsou nejnáročnější záležitostí World of Tanks určitě křoví nejlépe v kombinaci s pohledem skrze optiku režimu snipera. Takový záznam bitvy s delším střílením skrze křoví na malebné mapě Fjords jsme pořídili a zatím grafiky mučíme s takovýmto nastavením Graphics: Improved, vše na Low, jen Textures a Visibility: Maximum a samozřejmě Extra Effects in Sniper mode: Off.

Instrukce pro srovnatelné testování:

  • uložte replay na pevný disk
  • spusťte FRAPS a na kartě FPS nastavte Stop benchmark after 300 s
  • pokud máte příponu .wotreplay asociovánu s WorldOfTanks.exe, potom na ni stačí poklepat. V opačném případě si vytvořte zástupce WorldOfTanks.exe a .wotreplay na ni přetáhněte
  • počkejte, až na odpočtu bude 00:28 do startu zápasu (vpravo nahoře), pak spusťte logování (implicitně F11)
  • výsledek najdete ve složce Frapsu jako FRAPSLOG.TXT

Více o testování a technické stránce hry v článku World of Tanks: průvodce hardwarem a nastavením pro ty, co spěchají.

Unigine Heaven 4.0 a Valley 1.0

Unigine Heaven 4.0

Jakých změn doznal Heaven, jehož první inkarnace vyšla už v roce 2009? Vývojáři údajně „drasticky“ vylepšili efekt SSDO (scene-space dimensional occlusion), vylepšili refrakci světla na čočkách (lens flare) a do části sekvence, která se odehrává v noci, zapracovali hvězdnou oblohu. Při testech nechávám teselaci na normal, anizotropní filtr nastavuji na 8:1 a multi-sampling raději vypnutý.

  

 

Unigine Valley 1.0

Poslední benchmark od Unigine vaši grafickou kartu potrápí rozlehlou krajinou a hustou, detailně renderovanou vegetací. Nastavení benchmarku vidíte na screenshotu a bude asi ještě chvíli trvat, než jej takto třída grafik zvládne.

3DMark

3DMark

Po rozličných experimentech s názvy jako 3DMark 99, 3DMark 2000 nebo 3DMark Vantage pojmenoval Futuremark nový benchmark nejjednodušeji, jak to šlo – 3DMark. Důvodem je to, že se pod tímto označením nově rozumí celý balík testů.

Verze pro Windows obsahuje tři testy – pro DirectX 11, 10 a 9. Všechny tři testy běží na enginu pro DirectX 11, takže je pro běh 3DMarku vyžadovaný operační systém s podporou DX11 (Windows Vista, Windows 7 a Windows 8), u testů pro nižší verze DirectX se ale využívají jen instrukce příslušené dané verzi, takže k jejich spuštění pak stačí grafická karta s podporou DirectX 10, případně DirectX 9.

Fire Strike

Fire Strike je určený pro výkonná PC, ze tří testů je nejnáročnější, běží pod DirectX 11 a využívá více vláken. Skládá se ze dvou testů grafiky, testu fyziky a kombinovaného testu, který zatěžuje zároveň procesor i grafickou kartu.

V enginu pro tento test se využívá multithreading, teselace (PN triangles, phong a displacement mapping s podporou triangle i quad teselace), deferred lighting, ambient occlusion, pro výpočty osvětlení povrchů může mimo jiné využívat i horizon based screen space ambient occlusion (HBAO), dále volumetrické osvětlení a osvětlení částic. Post processing zahrnuje efekty jako particle based distortion (pod tím si můžete představit třeba vlnění teplého vzduchu), depth of field (hloubka ostrosti), odrazy od čoček, bloom (počítaný Rychlou Fourierovou transformací), antialiasing (MSAA a po tone mappingu FXAA) či simulace dýmu.

Podrobnější popis použitých technologií a způsobu využití najdete opět v původní dokumentaci v angličtině, jejich přepis by vydal na další čtyři strany (kvůli používané terminologii beztak napůl anglického textu). Pokud se v daných technologiích orientujete, nemělo by vám to ani v angličtině dělat problémy.

Cloud Gate

Cloud Gate je navržený pro notebooky a domácí PC. Jde o méně náročný test, který využívá pouze rozšíření DirectX 10_0, takže se dá pouštět i na starších kartách nebo integrovaných grafikách, které DirectX 11 nepodporují. Samotný engine, na kterém běží, ale DirectX 11 vyžaduje, takže je pro spuštění zapotřebí, aby vše bylo nainstalované na operačním systému, který DirectX 11 podporuje.

Test je složený ze dvou test grafické karty a jednoho testu fyziky a je ekvivalentem pro 3DMark Vantage (v tom, že oba běží na DirectX 10). Použitý engine se ale samozřejmě liší a ani výsledné skóre není vzájemně porovnatelné. Pro test se využívá stejný engine jako u Fire Strike, pochopitelně bez rozšíření DX11.

Standardně se testuje v rozlišení 1280 × 720 bodů, test je stavěný na 256 MB videopaměti.

Ice Storm

Ice Storm je určen pro měření výkonu tabletů, ultrapřenosných notebooků a levných PC. Na měření výkonu GPU slouží první dva testy, ve třetím se testuje fyzika.

 

Jde o (pro PC) hodně nenáročný test, který na GeForce GTX 660 Ti někde pod dvěma tisíci fps. Má být jakýmsi ekvivalentem pro 3DMark06 pro DirectX 9, byť už není jako 3DMark06 svého času postavený na testování výkonných PC, ale na rozdíl od něj už je určený pro test výkonných mobilních zařízení.

Standardní rozlišení pro test je 1280 × 720 bodů a počítá se se 128 MB grafické paměti. S rozličnými rozměry displejů mobilních zařízení se Futuremark vyrovnal tím, že obraz v daném rozlišení renderuje napevno a následně jej zvětšuje nebo zmenšuje podle rozměrů obrazovky.

Výsledky v detailech

GeForce GTX 750 Ti

   

    

Radeon R7 (A10-7850K)

   

    

Radeon HD 5770

  

   

Radeon R9 270 OC

   

   

GeForce GTX 660 OC

    

    

Radeon HD 6950

   

  

GeForce GTX 560

   

  

GeForce GTX 460

  

   

Radeon R7 260X

 

 

Radeon HD 5850

 

Radeon HD 7850 OC 1 GB

   

   

GeForce GTX 650 Ti OC

  

    

GeForce GTX 650 Ti Boost OC

   

    

GeForce GT 640 GDDR5

  

   

Radeon HD 7770 GHz Ed.

   

    

Radeon HD 7790

  

    

Radeon HD 7730

  

   

Radeon HD 6670

   

    

GeForce GTX 650

  

   

GeForce GT 640

 

 

AMD Radeon HD 8670D

  

     

Intel HD 4600

  

   

Intel HD 4000

  

AMD Radeon HD 7660D

   

AMD Radeon HD 7540D

  

   

AMD Radeon HD 7750

    

   

Příkon (spotřeba), shrnutí výkonu a vyhodnocení

Příkon (spotřeba)

wattmetr

Spotřeba (ano příkon) celé sestavy s daným procesorem je měřena pomocí zásuvkového měřiče spotřeby elektrické energie FK Technics. A přestože chladič, zdroj a grafická karta zůstávají neměnné a paměti jsou nastaveny také velmi srovnatelně, pořád se jedná o spotřebu celé platformy dané do jisté míry také základní deskou, osazenou čipovou sadou a dalšími čipy právě na desce.

Při testování příkonu při přehrávání videa je využit program Media Player Classic Home Cinema. To, kde je DXVA (GPU) akcelerace přehrávání videa aktivní, poznáte asi i bez průkazného screenshotu.

 

Provozní vlastnostni a přetaktování

Nad nehlučností Twin Frozra IV se už nesčetněkrát rozplýval Adam Vágner, takže pro absolutní měření hluku TF IV při různých hladinách otáček vás odkáži na jeho článek. Bude stačit, když víte, že u GTX 750 Ti se větráky TF IV drží pořád kolem 960 ot./min.

   

Přetaktování je bohužel omezeno na +135 MHz k jádru – to zvládne testovaná karta bez zvyšování napětí.

 

     

U pamětí jsem vyzkoušel i přetaktování izolovaně, přidání 1 GHz efektivně však nakonec nebylo zcela stabilní pro všechny herní testy.

  GeForce 750 Ti OC + 1000 MHz mem clock + 800 MHz mem clock
+ 135 MHz core clock 
BioShock Infinite – ultra [avg. fps] 58,7 60,6 63,6
Metro Last Light – high [avg. fps] 35,6 DNF 38,7
Total War: Shogun 2 – 1080p high [avg. fps] 47 47,7 51
Příkon PC ve World in Conflict [W] (menší je lepší) 158 166
Příkon PC v Crysis 3 [W] (menší je lepší) 164 168

 

Shrnutí výkonu a verdikt

Shrnující graf je vytvořen tak, že v každé hře tvoří 100 % (základ) nejlepší výkon a od něj jsou odvezeny další relativní výkony. Takto nemá žádná hra větší váhu. V případě her, kde jsou kvůli změně metodiky otestována dvě nastavení (Tomb Raider, Bioshock Infinite, Shogun 2: Total War, World of Tanks, F1 2012 a Aliens vs. Predator), jsem do průměru v tomto případě už započítal méně náročné nastavení. Slabší grafiky tak nejsou penalizovány a naopak spíše méně vynikne odstup karet jako R9 270 či GTX 660.

Jelikož jsem u spousty her jako Battlefield 3, Crysis 3, IL-2: Cliffs of Dover, Skyrim nebo Witcher 2 ještě speciálně kvůli souboji GTX 660 s R9 270 metodiku rozšířil o měření náročnějšího nastavení (vysokých či maximálních detailů). Pokud bych průměroval jen tato náročnější nastavení a vyškrtl z počítání hry, kde obě karty běží v průměru nad 100 fps (ET:QW a Call of Duty 4). Do průměrování je přidána hra Battlefield 4 (v celkovém nastavení vysokých detailů):

Ale jak by to dopadlo, kdybych se soustředil jen na vybrání těch skutečně náročných karet i pro kalibr typu R9 270 OC? Následující graf právě ukazuje průměr z her, kde se i grafiky za 4500 Kč notně zapotí (Battlefield 4, Bioshock Infinite (Ultra), Metro Last Light (High + Teselace), Skyrim (Ultra, 8× MSAA), Tomb Raider (High + Teselace), Total War: Shogun 2, Witcher 2 a World of Tanks s max. detaily):

Jestli se vám to nechce počítat, ale stejně po tom prahnete, tak tady (pro diskrétní grafiky) najdete jednoduché srovnání poměru výkon/cena. Žádný index nenajdete u karet, které se již neprodávají, a také u IGP. 

 Verdikt

Bráno hru po hře je to při srovnání s GTX 750 Ti a loňským cenovým hitem GTX 650 Ti Boost jako na houpačce. V Battlefield 3 se daří lépe novému Maxwellu, v Crysis 3 má zase jasný náskok „mírně okleštěná GTX 660“. Ve většině her to v podstatě plichta.

Překvapivě dobře si GeForce GTX 750 Ti vedla ve hře World of Tanks, kde se její výkon pohybuje na úrovni dražšího a podstatně žravějšího Radeonu R9 270. Je to tím, že ve WoT je (pokud vůbec) používán anti-aliasing FXAA. Ten na rozdíl od MSAA (viz testy Call of Duty 4 nebo Skyrim s nastavením Ultra High) netrápí pouhých 16 ROP a úzkou sběrnici GTX 750 Ti.

Výsledky lepší než GTX 660 ve hrách IL-2 Sturmovik: Cliffs of Dover a Sleeping Dogs jsou pak dílem novějších ovladačů a až se dostanu k přetestování GTX 660 s aktuálními ovladači, určitě se poměr sil opraví. V průměrování z 19 či 20 her to však není tak podstatné.

Sama Nvidia uvádí, že GTX 750 Ti se výkonem přibližně vyrovná někdejší vlajkové lodi – GTX 480 (alias „GrillForce“). V tomto testu jsme zase zjistili, že překoná neméně mohutného Caymana – Radeon HD 6950. Radeon HD 7850 zůstává těsně neporažen, zato HD 7790 OC alias R7 260X už na 750 Ti docela citelně ztrácí. Vzhledem ke grafům v této kapitole asi není třeba zvlášť zdůrazňovat, že GM107 to zvládne při příkonu nesrovnatelně nižším než všechna jmenovaná grafická řešení.

 

Samostatnou kapitolou je provedení od Gaming od MSI. To sází na odsvědčený chladič Twin Frozr IV, který je v současnosti s vcelku pravidelně inteligentním profilem otáček ve firmwaru MSI asi nejlepším chlazením pro střední třídu grafik. S máložravým Maxwellem si poradí naprosto hravě – teploty nepřekračují 50 stupňů Celsia v zátěži a především otáčky nejdou přes hranici 1000 ot./min. A buďte si jistí, že nízkoprofilové větráky s tichými motorky jsou při takové úrovni ze skříně neslyšitelné. Možná pokud máte přímo na stole jinak zcela pasivně chlazené PC ve skříňce typu ementál, velmi nízký hluk okolí, potom možná myšíma ušima něco zaslechnete. To alespoň platí pro nový chladič, jak na tom budou ložiska třeba za dva roky, vám už nepovím.

Daní za vynikající chladič je samozřejmě takřka doslova o pár stovek vyšší cena a potom také rozměry. GTX 750 Ti v provedení Twin Frozr IV si rozměry nezadá s Radeonem R9 270 či GTX 660 v edicích Gaming. Připravte se tak na kartu délky zhruba 25 cm.

Je trochu škoda, že Nvidia od začátku nenasazuje agresivnější cenovou politiku. Přece jen jsme zmlsáni loňskou „truckartou“ GTX 650 Ti Boost a AMD ještě před vydáním GTX 750 (Ti) reagovalo snížením cen výkonnostně odpovídajícím Radeonům. Je na vás, zda připlatíte za skvělé provozní vlastnosti. Můžete také počkat, jestli se Nvidia nepustí do cenové války. Záležet bude asi hodně na prodejích – ty ukáží, zda je v této cenové kategorii a třídě karet podstatný především výkon/cena nebo výkon/příkon (a z nízkého příkonu vyplývající další pozitiva).

GM107 jakožto první zástupce architektury Maxwell vypadá slibně především z pohledu malých herních PC a snad ještě spíše herních notebooků. Sám se těším na test GTX 750 (bez Ti) – ta má přece jen méně odvážný poměr SP:ROP (či SP k šířce sběrnice) a procentuálně výrazně nižší cenu. MSI GTX 750 Ti Gaming si za předvedený výkon a fantastické provozní vlastnostni zatím odnáší ocenění We Want It!

MSI GeForce GTX 750 Ti Gaming (Twin Frozr IV), 2 GB

Plusy / mínusy
  výkon zhruba jako GTX 650 Ti Boost či Radeon HD 7850
  velice nízký příkon a excelentní poměr výkon/příkon
  podpora technologií a bonusů Nvidie (ShadowPlay, G-Sync,  GF Experience…)
  nízké zahřívání
  pokročilý videoprocesor, vyhrazená logika pro kódování
  rezerva pro další přetaktování
  velmi tichý chod chladiče Twin Frozr IV v klidu i zátěži
  vyšší cena
  s anti-aliasingem (MSAA) či vyšším rozlišením se v pořadí karet propadá
  rozměry testované karty (neplatí pro ref. provedení) a videovýstupy
Cena 3950 Kč vč. DPH (k 18. 2. 2014) 
Ohodnoťte tento článek!