Velké srovnání spotřeby karet: PowerTune proti GPU Boost

0

Na co si musíte dát pozor

Mimo jiné jsem se v různých diskuzích na téma spotřeba grafických karet už párkrát dozvěděl, že naše výsledky měření spotřeby jsou špatné, protože vychází jinak než měření na jiných webech, nebo že jsou nedostatečné, protože měříme spotřebu jen v jedné hře. Ve výkladu metodiky měření spotřeby mám v recenzích „drobné rezervy“, protože je to dost komplikované a pořádný popis vydá i na samostatný článek. I metodiku měření a problematiku spotřeby se v tomto článku pokusím osvětlit trochu podrobněji.

Samotné měření spotřeby není komplikované, spustíte zátěž a odečtete hodnotu, kterou udává Wattmetr. Jenže je nutné ošetřit a pohlídat „pár“ věcí (a právě jejich hlídání a důslednější měření může být jedním z důvodů, proč se oproti některým webům lišíme, nedělám si iluze, že to všichni řeší až tak do hloubky).

Teplota

Na spotřebu grafické karty má výrazný vliv teplota grafického jádra. Čím je jeho teplota vyšší, tím má větší spotřebu. A obdobné (i když ve srovnání většinou karet v mnohem menší míře) je to u procesoru a dalších komponent.

Před odečítáním spotřeby je tedy vhodné kartu i samotnou sestavu dostatečně prohřát. To nejde moc dohromady s měřením spotřeby v běžných benchmacích ani s testováním ve hrách. Spousta testů je totiž příliš krátká na to, aby se karta dostatečně zahřála a výsledky odpovídaly delšímu hraní, a u spousty testů se střídají stavy, kdy karta chladne kvůli spouštění hry či pauzám při načítání pozic pro testování.

S teplotou a následně i spotřebou souvisí i teplota okolí – rozdíl může být dost velký. Že se při stávajícím počasí může „spotřeba“ stejné karty změnit i ze dne na den o 10 W jsme se už přesvědčili před pár dny v článku Jak zamává teplé letní odpoledne s výsledky testů grafik?

Chybu způsobenou odlišnou teplotou se snažím eliminovat jednak kontrolou teploty okolí, jednak tím, že spotřebu měřím při nejvyšším možném prohřátí karty. V případě testů s měřením maximální spotřeby v Crysis je to po dlouhodobé zátěži v řádech desítek minut, u herních testů měřím až poslední průběhy, kdy je karta předehřátá alespoň několika minutami testování jiných nastavení a rozlišení.

Podstatné je i to, za jakých podmínek se testuje – jiné rozdíly ve spotřebě naměříte v otevřené sestavě či u komponent nasázených do sebe jen tak volně na stole, jiné v tiché sestavě bez intenzivního proudění vzduchu a jiné v herní skříni, kde na kartu z bočnice  fouká 25cm obluda.

Spotřeba s průběhem času

V následující tabulce jsou výsledky měření spotřeby sestavy s referenční HD 7970 po spuštění zátěže. V posledním sloupečku je rozdíl oproti spotřebě při spuštění zátěže.

čas (s) spotřeba sestavy rozdíl
00:00 343,0 W 0,0 W
00:30 351,5 W 8,5 W
01:00 353,8 W 10,8 W
01:30 359,4 W 16,4 W
02:00 361,8 W 18,8 W
02:30 363,3 W 20,3 W
03:00 363,9 W 20,9 W
03:30 364,4 W 21,4 W
04:00 365,8 W 22,8 W
04:30 366,4 W 23,4 W
05:00 366,5 W 23,5 W

 

Referenční karta má masivní chladič a robustní konstrukci, takže nějaký čas trvá, než se po spuštění zátěže začne zahřívat. Pokud bych spotřebu odečítal po půlminutě, byla by jen o 8,5 W vyšší než při spuštění zátěže. Dvě minuty po spuštění zátěže je spotřeba sestavy o 19 W vyšší a dále roste, růst ze výrazně zpomalí až zhruba po čtyřech minutách od spuštění zátěže.

Na druhou stranu existují chladiče, které sází na rychlý odvod tepla od jádra, mají malou základnu, ale spoustu heatpipe a velké žebrování, na změnu zátěže reagují velmi pružně a na maximální teploty se dostanou během pár desítek sekund. Ty jsou při kratších testech v nevýhodě.

…a s jinou pastou

S teplotou jádra a tím pádem i spotřebou souvisí i to, v jakém stavu je testovaná karta. Před nedávnem se mi povedlo v „podsvětí“ způsobit menší rozruch blogovým zápiskem o tom, co se spotřebou výkonné katy udělá, pokud ji před vámi někdo rozebere a původní pastu nahradí lepším, nebo nedej bože horším médiem.

Možná i díky němu už má většina zástupců jednotlivých společností pochopení pro to, proč toužím testovat nerozebírané karty ve své původní podobě a proč se snažím do recenzí shánět karty, které přede mnou nikdo nerozebíral. Pár karet, o kterých jsem věděl, že jsou přepastované, už jsem odmítl, jen výjimečně, když není vyhnutí (jako u poměrně exkluzivní GTX 690) vezmu zavděk i takto vylepšenou kartou. Má to jeden prozaický důvod, lidi většinou zajímá, jak bude vypadat karta, kterou si pořídí v obchodě, ne jak dopadne karta, kterou si koupí, rozeberou a teplovodivou pastu nahradí lepší.

Co kus, to originál

Grafické procesory mají podobně jako CPU jednu nepříjemnou vlastnost – jejich kvalita se liší kus od kusu, v závislosti na homogenitě materiálu, jeho kvalitě a umístění na wafferu. K tomu, aby čip prošel výběrem, pak stačí, aby splnil nějaké podmínky, v případě spotřeby nesmí překročit stanovenou hranici. Znamená to, že se v jedné skupině mohou potkat čipy se spotřebou na hranici i čipy výrazně lepší. Zejména u poslední generace výrobního procesu jsou rozdíly zřejmě propastné, napovídala by tomu nejen velká výkonnostní rezerva, kterou mají Radeony HD 7000, ale i obrovský rozdíl, jaký může být mezi spotřebou dvou běžných GeForce GTX 680 ve SLI a dvouprocesorovou GeForce GTX 690 s obdobným výkonem.

Jediný způsob, jak se s tím vypořádat, by bylo vzít a změřit reprezentativní vzorek karet, což je prakticky nemožné nejen kvůli tomu, že pět karet na jeden test vám nikdo nepůjčí, ale také kvůli tomu, že by testování jednoho modelu karty zabralo čtrnáct dní a náklady na takovou recenzi by byly neúnosné.

Chladiče, chladiče, chladiče… a BIOS.

Je to samozřejmé, ale musím to zmínit – na spotřebu karet má vliv i použité chlazení. Karty, které udrží jádro při nižší teplotě, mají i nižší spotřebu. Do grafů je prakticky nemožné uvádět přesné označení a specifikace karet, jednak není na popisky zase tolik místa, jednak by tím výrazně ztratily na přehlednosti.

V jednom grafu se tak napříč weby často potkávají referenční i nereferenční karty a nikdo nemá čas na to zkoumat, jaká karta se pod popiskem Radeon HD 7850 vlastně skrývala a jakou teplotu mělo jádro.

Možná vám to bude připadat jako blbost, ale měření může poměrně velkou chybou zatížit i spotřeba samotného chladiče. Důvodem jsou těžké, výkonné a poměrně žravé radiální (odstředivé) ventilátory, které se často používají u referenčních karet. V případě Radeonu HD 7970 je maximální spotřeba ventilátoru až 20,4 W. Axiální ventilátory přitom mají maximální spotřebu typicky kolem 5 W, i když jsou na kartě dva, mohou jen ventilátory na chladiči při vyšších otáčkách udělat rozdíl ve spotřebě 5-15 W.

A konečně je tu ještě nastavení firmwaru karty. I dvě zdánlivě stejné karty v referenčním designu se mohou lišit takty a napájecím napětím jádra. Znamená to, že i když přetaktovaný model podtaktujete, abyste dostali „stejnou“ kartu jako referenční, nemusí mít spotřeba na rozdíl od výkonu srovnatelná, o kartách v nereferenčním provedení a s upraveným plošným spojem nemluvě.

Chcete-li příklad, nemusíme chodit daleko – stačí se podívat na recenzi HD 7850 OC od Gigabyte, kde je i srovnání s obdobnou kartou od Asusu – mají stejný referenční plošný spoj, liší se v podstatě jen použitým chladičem a takty pamětí (4800 proti 5000 MHz efektivně) a přesto je rozdíl ve spotřebě karet na HD 7850 šílených 50 W.

Spotřeba CPU

Procesor je po většině karet druhou nejvýznamější položkou, která má vliv na spotřebu sestavy. Abych zmenšil vliv procesoru na celkovou spotřebu, mám všechny hodnoty, u kterých to lze, v BIOSu nastavené „na tvrdo“.

Procesor se tedy bez zátěže nepodtaktovává (zamčený násobič), nesnižuje napětí (v BIOSu je nastaveno konkrétní napětí) a zakázané jsou i úsporné funkce (C1E, EIST). Všechny tyto věci, které nelze moc ovlivnit (fungují automaticky a nezávisle na OS) mohou mít při rozdílech, které se běžně dají naměřit, významný vliv na spotřebu CPU a spolu s tím i na spotřebu celé sestavy.

Nevím o tom, že by to podobně praktikovala většina webů, soudě dle výsledků měření spotřeby bez zátěže, u kterých bývá procesor evidentně v úsporném režimu, je tomu spíše naopak.

Jen výjimečně lze narazit i na testy, ve kterých se snaží recenzent vliv spotřeby ostatních komponent eliminovat zcela.

Způsob měření

A konečně je tu poslední věc, způsob, jakým odečítání hodnot probíhá. Málokdo se vůbec chlubí tím, jak k dané cifře došel, často je to ale nejvyšší hodnota, která se během nějakého testu objeví na wattmetru. Důvod je prostý, měření většinou probíhá na zásuvkových měřácích, které zvládají zobrazit jen aktuální spotřebu a špičky. V lepším případě recenzent sleduje průběh testu, má vytipované náročné úseky a v daném místě hodnotu zaznamená, v horším případě pak ani wattmetr nesleduje, jen jej před testem vyresetuje a po proběhnutí opíše hodnotu, kterou má wattmetr v paměti uloženou jako nejvyšší.

Že takovou špičku nemusí mít vůbec na svědomí grafická karta, asi netřeba zdůrazňovat.

Abych se problémům vyhnul, sám zaznamenávám spotřebu sestavy z wattmetru v sekundových intervalech během celého testu. Díky tomu vím, jaký je při daném testu průběh spotřeby, jestli během testu spotřeba kvůli zahřívání karty ještě rostla, a v dnešní době z nich lze už poznat i to, jak do testu zasahovaly technologie pro řízení výkonu a spotřeby grafických karet.

Inteligentní řízení spotřeby

A konečně je tu poslední položka – inteligentní řízení spotřeby, kterým jsou v poslední době vybavené Radeony i GeForce. Kvůli nim hodně záleží na tom, v čem přesně spotřebu měříte. Syntetické testy používané pro měření maximální spotřeby se kvůli tomu staly prakticky nepoužitelnými, a i v případě běžných her je podstatné, jestli se karta dostává na hodnotu, při které dochází k zásahům automatiky do taktů jádra.

Při měření špiček na to doplácí karty s horším řízením spotřeby. Nemyslím tím, že by je jedna z technologií byla zaostalejší než jiná, ale jen to, jak blízko se karta umí držet danému TDP.

Pro příklad si vezmu hned extrémní výsledek testů – měření z benchmarku v Metro 2033.

Pokud bychom se zaměřili jen na špičky, byla by spotřeba sestavy se dvěma Radeony téměř dvakrát vyšší než u GTX 690. Důvod je jednoduchý, zatímco GTX 690 automatika po zahřátí škrtí na úrovni TDP, u Radeonů, které mají k hranici TDP daleko (mj. to znamená, že PowerTune nevyužívá dostupné prostředy zdaleka tak dobře), spotřeba kolísá výrazněji.

Výsledek? Při rozdílu průměrů je rozdíl rozdíl necelých 178 W, zatímco při porovnání špiček je rozdíl 260 W.

 

Software a periferie

Možná se to nezdá, ale dost podstatné je i to, jaký software na počítači zrovna běží, jaké periferie jsou k němu připojené, nebo i to, na jakých otáčkách zrovna běží ventilátory. S každou periferií v USB se může spotřeba změnit i o pár wattů. Jenom spuštění GPU-Z pro záznam údajů z monitoring grafické karty znamená minimálně na několik desítek sekund zvýšení spotřeby o 1–3 W, o náročnějších aplikacích nemluvě. V podstatě to znamená před měřením spotřeby počítač restartovat, nechat dochroupat disk, než do paměti dostane vše potřebné a až se spotřeba ustálí na nejnižší hodnotě, teprve potom začít z měřením bez zátěže a následně i v zátěži.

Zdroj… dalších problémů

Další drobností, která ovlivní měření, je zdroj – s rostoucí spotřebou sestavy se mění jeho účinnost. Při měření spotřeby mezi zásuvkou a zdrojem je touto chybou zatížený i výsledek měření. Nedá se s tím dělat nic jiného než volit kvalitní zdroj, který má v používaném rozsahu měření co nejmenšími rozdíly v účinnosti.

Testovací sestava

Pro měření spotřeby grafik, resp. celé sestavy osazené konkrétní grafickou kartou, využívám Voltcraft Energy Logger 4000.

Jako testovací platforma posloužila základní deska Gigabyte X79-UD5 s BIOSem F10. Procesor je šestijádrový Core i7-3960X s TDP 130 W, který je přetaktovaný na 4,2 GHz při 1,36 V. Asistuje mu 16GB kit operačních paměti DDR3 od Kingstonu.

  • základní deska: Gigabyte X79-UD5
  • procesor: Core i7-3960X (deaktivovaný HTT, C1E, EIST), 4,2 GHz na 1,36 V
  • chladič CPU: Noctua NH-D14
  • paměti: 4× 4 GB Kingston DDR3 KHX2133C11D3K4/16GX
  • zdroj: Enermax Revolution 85 ERV920EWT-00, 920 W
  • pevný disk: Intel SSD 510 (250 GB)
  • skříň: Gelid DarkForce
  • operační systém: Windows 7 x64

Gelid Darkforce

V grafech najdete osmero karet, které jsem v poslední době z nějakého důvodu měřil a u kterých jsem během testování zaznamenal i spotřebu:

  • Nvidia GeForce GTX 670 v referenčním provedení
  • Nvidia GeForce GTX 680 v referenčním provedení
  • Nvidia GeForce GTX 690 v referenčním provedení, bohužel rozebíraná a s novou pastou.
  • Radeon HD 7750 Ultimate od Sapphire (referenční takty, výkonné pasivní chlazení)
  • Sapphire HD 7870 FleX (výkonný nereferenční chladič a mírně vyšší takty)
  • Sapphire HD 7970 OC s taktem 950/5700 MHz (mírně přetaktovaná, jde o první ze dvou profilů v BIOSu na kartě v nereferenčním provedením)
  • Sapphire HD 7970 OC s taktem 1000/5800 MHz (stejná karta, druhý BIOS s výraznějším přetaktováním)
  • 2× Radeon HD 7970 OC v CrossFire (stejná karta spolu s referenční HD 7970 přetaktovanou na shodné takty)

U všech karet, která jsem měřil na nové sestavě, už bohužel do jejich spotřeby i výkonu „kecá“ inteligentní řízení spotřeby. Až dootestuji starší karty, které ještě neuměly PowerTune a GPU Boost, budou výsledky ještě pestřejší a minimálně u nejvýkonnějších GeForce s architekturou Fermi rozdíly ještě větší.

Testy probíhaly stejně jako při měření výkonu grafických karet, u běžných her šlo o poslední průběhy z řady měření při rozlišení 1920 × 1080 bodů.

Srovnání spotřeby: Crysis, Battlefield 3

Crysis

Na úvod si dáme jednoduché srovnání spotřeby sestavy (údaje jsou ve Wattech) osazené danou grafickou kartou v Crysis. To je měření, se kterým se běžně setkáváte v testech.

Jde o jednoduchou statickou scénu (tedy není přímo statická, ale kromě různých efektů, jako je dým, hořící světlice nebo svítící baterka, se na ní nic němění a ani postava se nepohybuje).

Je záměrně zvolená tak, aby zatěžovala grafické jádro více než běžné hraní. Zároveň jde ale pořád o běžnou scénu, na kterou se dá ve hře narazit, a nikoliv o nějaký syntetický test stavěný na co nejvyšší vytížení jádra, proti kterým nasazují výrobci GPU rozličné technologie a opatření, která mají chránit GPU před přetížením.

Jistěže je to trochu nadsázka, málokdo se při běžném hraní zastaví na čtvrt hodiny na místě, kde z širokého okolí grafika žere nejvíc. Na druhou stranu ale nemohu říci ani to, že při hraní nemůžete narazit na scénu či dokonce úsek hry, který dá grafice zabrat víc.

Protože scéna nijak dramaticky nemění, je spotřeba poměrně stabilní, mění se v podstatě jen se zahříváním karty (s vyšší teplotou GPU roste). Kvůli tomu nechávám po spuštění kartu i celou sestavu prohřát a zaznamenávám spotřebu karty. Po ustálení teplot i spotřeby vezmu zhruba minutový úsek z měření a spočítám z něj průměrnou spotřebu, nejde tedy o jednu hodnotu v podobě provozní špičky, která během celého testu náhodou naskočila na wattmetru.

 

Battlefield 3

Dále už následují výsledky naměřené při „běžném hraní“, přesněji jde o záznam spotřeby sestavy při testování výkonu. Povětšinou jde o hry, které je třeba měřit ručně a FRAPSem, takže u nich mohu zároveň hlídat a měřit spotřebu.

Battlefield 3 je náročnostní na výkon GPU známý. Ale také je o něm známo, že je dost náročný i na výkon procesoru a dokáže slušně zaměstnat několik procesorových jader.

U CrossFire a SLI už to vypadá, že výkon karet (a spolu s tím i spotřebu) právě procesor výrazně brzdí. Můžeme si to odvodit z měření GTX 690, která se na úroveň maximálního výkonu (přesněji maximálního TDP) dostala jen na krátkém úseku od 17 do 35 s, kde také při měření výrazně roste framerate.

Rozdíly ve spotřebě jsou také menší než u většiny ostatních her.

V pruhovém grafu je pak v kratším světle zeleném pruhu zprůměrovaná hodnota z celého úseku měření, delší tmavě zelený pruh je maximální spotřeba v daném úseku. V tomto i následujících grafech je dobře vidět, že tam, kde karty výrazně nebrzdí procesor, se průměrné a špičkové hodnoty spotřeby u GeForce výrazně neliší, jinak řečeno nové karty velmi efektivně využívá dostupný prostor daný obálkou TDP.

Srovnání spotřeby: Crysis 2, Metro 2033

Crysis 2

Něco podobného se dá říci o spotřebě v Crysis 2. Zatímco slabší GeForce a HD 7750, o které víme, že ji PowerTune škrtí i při běžném hraní, mají průběh spotřeby poměrně rovný, u výkonnější GTX 690 už kolísá.

A u Crysis 2 je ke všemu ještě jiná záludnost – hra má s patchem pro DX11 framerate cap (omezení maximální snímkové frekvence) na 100 fps.

Metro 2033

Tento graf už jste viděli v úvodu. Také v Metro 2033 je při daném nastavení patrné, že výkon karet brzdí procesor (je to zřejmé i z horšího škálování v multi-GPU). Jenom připomínám, že nejde o maximální detaily, kvůli neúměrné náročnosti je vypnutý efekt Depth of Field.

Srovnání spotřeby: Max Payne 3

Max Payne 3

A konečně ještě měření v Max Payne 3. U něj jen jedna věc – průběh spotřeby je nezvykle u Radeonů nezvykle vyrovnaný, zatímco u GeForce (i u slabších modelů) dochází ke kolísání spotřeby. Z toho, a z horšího škálování v CrossFire a SLI (viz třeba poslední testovaná grafická karta), lze opět usuzovat, že karty brzdí procesor a to je i důvodem, proč se spotřeba některých karet jeví podstatně příznivější, než může v náročnějších hrách být.

 

Shrnutí výsledků, přehled podle karet a podle her

Shrnutí výsledků

V následujícím grafu je porovnání průměrné spotřeby sestavy v daných hrách. Jenom připomínám, že spotřeba samotné sestavy bez grafické karty se pohybuje kolem 115 W, při intenzivním vytížení jednoho fyzického jádra (s vypnutým HyperThreadingem) v OCCT u přetaktovaného procesoru roste spotřeba zhruba o 25 W.

V grafu je dobře vidět, že zátěžová scéna v Crysis dává kartám zabrat víc než běžné hraní. Rozdíl je ještě větší, než by to z grafu mohlo vypadat. U ostatních her se totiž na spotřebě sestavy podílí větší měrou procesor – na rozdíl od letitého Crysis vytěžují více jader.

V dalším grafu jsou stejné hodnoty přepočtené vůči jednotnému základu – dvěma přetaktovaným Radeonům HD 7970 OC v CrossFire. Největší rozdíly jsou patrné v zátěžové scéně.

V tomto testu také s výkonem karet spotřeba nejlépe škáluje – dobře je to vidět třeba na rozdílu mezi dvojicí měření, která probíhala se stejnou kartou na dvou různých profilech BIOSu – Radeonu HD 7970 OC od Sapphire s takty 950/5700 MHz a na 1000/5800 MHz.

V dalším grafu jsou tytéž hodnoty, jenom seřazené do skupin podle grafických karet.

Závěrečné shrnutí

Závěrečné shrnutí

Ukázalo se, že PowerTune u běžných (i přetaktovaných) Radeonů HD 7970 prakticky nezasahuje – karta běží daleko pod limitem a tedy svými možnostmi. Zajímavé bude ještě srovnání běžné HD 7970 s GHz edition, které snad budu moci do výsledků doplnit s další várkou karet.

GeForce z řady GTX 600 naopak běží téměř neustále nadoraz na hranici TDP. Také u HD 7750 zasahuje PowerTune prakticky neustále – průběh spotřeby prakticky nekolísá, dokonce je vyrovnanější než u GPU Boost. Zajímavé je to i s ohledem na to, že má karta spotřebu jen odhadovat, zatímco u GeForce se přímo měří. Ale v jejím případě jsou důvodem pro vyrovnanější průběh spotřeba čipu, je výrazně úspornější než u výkonnějších karet a tak jsou i skoky ve spotřebě menší.

Přiškrcení HD 7750 jsme ale řešili už s jejich uvedením. Důvodem je nejspíš omezení ze strany napájení, karta nemá přídavný napájecí konektor a musí si vystačit s napájem přes slot PCIe. Utvrzuje mě v tom velký vliv nastavení PowerTune na výkon, problémy karty s některými zdroji a konečně i zprávy o tom, že by se měly objevit i HD 7750 s přídavným napájením.

Dá se říci, že kdyby PowerTune fungovalo podobně u všech Radeonů, je to ideální. Má to jen drobnou nevýhodu, znamená to také, že karta prakticky nikdy neběží na taktech, které ve specifikacích uvádí výrobce (a nemíním tím hodnotu frekvence GPU, kterou karta či API hlásí diagnostickým utilitám, ale tu reálnou po zásahu PowerTune, která se zjistit nedá, dost možná i proto, že se mění mnohokrát za sekundu). Za těchto okolností by stálo za to, aby výrobci začali v podobných případech uvádět ve specifikacích politicky korektní „up to“, tedy populární marketingové „až“.

Při měření se dále potvrdilo, že výsledky do velké míry závisí i na tom, v čem se měří. Nemyslím si, že by to bylo jen tím, jak která hra využívá které technologie, jak vytěžuje které části grafického čipu a jak sedne konkrétní grafické kartě. 

Z výsledků je zřejmé, že významný vliv na „poměr sil“ má nepřímo i procesor. Pokud brzdí grafické karty, jsou rozdíly ve spotřebě menší a spotřeba karet se jeví podobnější. Jinak řečeno, čím víc hru brzdí procesor, tím lépe se žravější karty jeví lépe ve srovnání s těmi úspornějšími.

A konečně – z výsledků je jasné, že zejména u karet s inteligentním řízením výkonu a spotřeby už je nevhodné porovnávat dosahované špičky, ke kterým došlo během nějakého úseku měření, když je při běžném hraní rozdíl mezi průměrnou spotřebou a maximem u některých karet diametrálně odlišný. Smysl to nebude mít minimálně dokud nebudou průběhy spotřeby u všech karet vyrovnané tak, jak je tomu u stávajících výkonných GeForce z řady GTX 600 a k takovým výkyvům ve spotřebě nepřestane docházet.