Reklama

GTX 690 a 2× HD 7970 do hloubky: proč je řada testů multi-GPU k ničemu

S uvedením GeForce GTX 690 představila nVidia technologii frame rate metering, která má zajistit plynulé vykreslování snímků u řešení z více karet a konečně nás zbavit microstutteringu, kvůli kterému se karty ve SLI a CrossFire v praxi jeví o dost pomalejší než v testech.

GeForce GTX 690 a microstuttering

O microstutteringu (dá se vyložit jako krátkodobé zadrhávání), se v současnosti mluví nejčastěji v souvislosti s konfiguracemi postavenými na dvou a více grafických čipech. Na nich se obraz  renderuje nejčastěji metodou AFR (alternate frame rendering), při které jednotlivé GPU střídavě vykreslují vždy jeden celý snímek. Při použití dvou GPU má tedy jeden na starosti sudé a druhý liché snímky.

Při vykreslování ale z různých důvodů dochází k problémům se synchronizací čipů a načasováním zobrazení jednotlivých snímků. Traduje se, že je to kvůli tomu, že je každý snímek jinak náročný a rendering trvá různě dlouho. Problém bude ale složitější, jen málokdy je další snímek z obdobné scény výrazně náročnější než předchozí. A už vůbec se nestává, že by byl náročnější každý druhý, jak by tomu muselo být v situacích, kdy rozptyl s každým snímkem rychle narůstá.

Microstuttering nejčastěji pozorujeme, když každý druhý snímek zůstává na obrazovce výrazně déle než ten předchozí. Když se první ze snímků zobrazí jen krátce a vystřídá jej druhý a obraz se dlouho nepohne, snímková frekvence se zdá mnohem nižší, i když po zprůměrování časů obou snímků dosahují průměrné fps (snímky za sekundu) hodnot považovaných za plynulé.

Reklama

V testech grafických karet se výkon obvykle hodnotí na základě průměrných fps. Víceprocesorová řešení z toho bohužel hodně profitují – při zprůměrování „pomalých“ a „rychlých“ snímků dosahují fantastických výsledků a někdy až dvojnásobných výkonů oproti svým jednoprocesorovým obdobám, přestože výsledný dojem při hraní je podstatně horší

Jednou z možností, jak microstuttering potlačit, je zapnutí vertikální synchronizace, která (v ideálním případě) zajistí pravidelné střídání snímků. Aby to fungovalo, musí grafika snímky zvládat připravit ještě před překreslením obrazu. Pokud to nestihne, musí se překreslení vynechat a čeká se na další, kvůli čemuž klesá výkon. Se zapnutou vertikální synchronizací také nelze porovnávat výkon, protože monitor karty často brzdí a ty nerenderují více snímků, než dokáže zobrazit.

S příchodem GeForce GTX 690 Nvidia představila ještě další technologii – frame rate metering – která by měla microstuttering potlačit. GeForce GTX 690 má mít „měřící mechanismus“, který řídí plynulost toku jednotlivých snímků.  V případě, že by hrozilo střídání krátkých a dlouhých snímků, prodlouží dobu zobrazení krátkého snímku tím, že pozdrží vykreslení toho následujícího. Jak se to povedlo, se dozvíte z grafů.

Eyefinity a Surround: extrémní grafiky pro extrémní rozlišení

Vyšší rozlišení je u výkonných karet zajímavější, protože se dá předpokládat, že se po výkonné kartě budou ohlížet především ti, kteří se nespokojí jen s jedním monitorem v plném HD rozlišení. Jen málokdo bude pořizivat grafiky za dvacet tisíc, aby na ně připojil starou devatenáctku s rozlišením 1680 × 1050 bodů.

I na panelech s rozlišením 1920 × 1080 bodů se většina hráčů spokojí i s kartami střední a nižší střední třídy; ostatně jejich výkon je dostatečný pro hratelné snímkové frekvence u většiny her, které vycházejí, a i u těch nejnáročnějších stačí snížit detaily.

Testovací sestava

Jako testovací platforma posloužila základní deska Gigabyte X79-UD5 s BIOSem F10. Procesor je šestijádrový Core i7-3960X s TDP 130 W, který je přetaktovaný na 4,2 GHz při 1,36 V. Asistuje mu 16GB kit operačních paměti DDR3 od Kingstonu.

  • základní deska: Gigabyte X79-UD5
  • procesor: Core i7-3960X (deaktivovaný HTT, C1E, EIST), 4,2 GHz na 1,36 V
  • chladič CPU: Noctua NH-D14
  • paměti: 4× 4 GB Kingston DDR3 KHX2133C11D3K4/16GX
  • zdroj: Enermax Revolution 85 ERV920EWT-00, 920 W
  • pevný disk: Intel SSD 510 (250 GB)
  • skříň: Gelid DarkForce
  • operační systém: Windows 7 x64

Gelid Darkforce

Karty ve srovnání

U Radeonu šlo o nedávno testovanou HD 7970 OC do Sapphire s dvojicí ventilátorů na výkonnějším 1000MHz  profilu kombinovanou s referenční HD 7970 přetaktovanou na stejné takty, a ve srovnání je ještě referenční GeForce GTX 680 na ovladačích 304.48.

Pokud máte pocit, že by se mělo srovnávat spíš s referenční HD 7970, vězte, že dvě přetaktované HD 7970 OC jsou v tomto případě pro sronvání adekvátní, cenou mají ke GTX 690 mnohem blíže. Šlo by to řešit i referenční HD 7970 GHZ Edition, tu jsem ale ve dvou kusech k dispozici neměl.

Radeony jsou testované na ovladačích Catalyst 12.7 beta . GeForce GTX 690 je testovaná na betaverzi ovladačů označené 304.79.

Co v grafech najdete?

Pro grafy jsem povětšinou použil logy z měření pomocí aplikace FRAPS – záznam průměrných snímkových frekvencí po sekundě a podrobnější log s frametimes, neboli časy, potřebné k vykreslení jednoho snímku.

Hodnoty pro jednotlivé snímky pak z podstatně podrobnějšího souboru, do kterého FRAPS zaznamenává časy vyrenderování jednotlivých snímků (názvy končící na frametimes.csv).

Tyto hodnoty (udávané v milisekundách) jsem přepočítal do podoby snímků za sekundu, na něž jsme z grafů s průběhem snímkové frekvence zvyklí. V grafech tedy hodnota na ose Y v daném bodě odpovídá snímkové frekvenci ve fps (snímcích za sekundu).

 

Grafy vypadají zdánlivě jako klasické spojnicové, ve skutečnosti jde o parametrické grafy (v Excelu nazvané „bodový XY se spojnicemi“). Každý bod má zadané souřadnice X a Y a jimi určenu polohu na vodorovné i svislé ose – na ose X je to čas, ve kterém se snímek zobrazil, na ose Y aktuální snímková frekvence.

V grafech jsou většinou tři datové řady – modrá, což je snímková frekvence ve fps na každý vyrenderovaný snímek, dále červená, což je průměrná snímková frekvence uváděná v logu z FRAPSu s průměrnými fps po sekundách (obvykle se používá pro grafy s průběhem snímkové frekvence) a konečně zelená křivka, která přibližně odpovídá podobnému řešení s jedním GPU. Pro dvouprocesorovou GeForce GTX 690 je to GeForce GTX 680, pro dva Radeony HD 7970 v CrossFire je tou alternativou jedna karta. Výsledky jednoprocesorových karet chybí u testů v Eyefinity a Surroundu, protože je při rozlišení 5760 × 1080 bodů na nové sestavě ještě nemám otestované.

Oblíbené Tisk E-mail
Reklama

Komentáře

Dik za test Adame ale mam na teba zopár otázok aj pripomienok.
Používaš na testy dost výkonnú zostavu, ktorú má málokto doma, tak by to chcelo aspon malý test zo slabšov zostavou ako to rozhodí priebehy FPS,prípadne z AMD či to bude podobné. Viem že testuješ 2čipovky a tam toho výkonu nieje nikdy dost ale chcelo by to urobit aj takéto testy + čo spraví zapnutá vsynch., OC systému a na default.
Ďalej si spomínal 3 monitory tak sa chcem spítat na GTX či im ide vsynch. na nich, dalej vyriešila Nvidia stutering zo zapnutou vsynch ? 
Mám doma HD 7970 a na jednom monitore nieje BF3 najplynulejší pri 4MSAA aj adaptívne vyhladzovanie + vsynch , dokial nemám pretaktované pamete na 6400-6800 Mhz  a to aj ked není GPU vytažené naplno. Trochu majú na to vplyv aj pamete v systéme čo sa týka plynulosti ( nie FPS, to sa zvýšilo tak max o 1 FPS ! ) , mám 1600 Mhz 9-9-9-24 CR2 askúšal som aj iné nastavenia ale nebolo to take plynulé ( ale na test boly stabilné )
Inak som rád, že sa tomuto problému aj niekto podrobnejšie venuje, už trochu dávnejšie som mal aj ja SLI a bol som s nim celkom spokojný, hra boly plynulejšie až na tie najnaročnejšie, tam kde to bolo najviac treba tam to nefungovalo ako by to malo ( úzka zbernica a malá pamet )

Pokud testuješ nějakou grafiku, snažíš se eliminovat nežádoucí vlivy. Pokud vemeš top dualčip/CF/SLI top a testuješ to na nějakym Sempronu/Athlonu, má to stejnou vypovídací hodnotu jako, když zapneš vsync. Výkon/FPS je prostě zezhora omezen. Samozřejmě to je titul od titulu. Mnohem lepší je extra graf kde jsou 3-4 procesory a test se soustředí na právě tento faktor.

 Děkuji za test, kde jste doplňili vyšší rozlišní :)
Teďko jednu takovou rýpavou poznámku....:"Zajímavé je i to, že kvalita vyhlazování snímkové frekvence se u GTX 690 liší titul od titulu a dokonce i lokaci od lokace"
Toto tvrzení, které jste napsal by zasloužilo větší kritiku než jenom takový přelet. Několik měsíců zpět se tady řešilo jak u RADEONU je pomocí "optimalizací" snížená uroveň kvality ve vzdálených předmětech více než u nVidie. Jak si pomáhají ke zvýšení FPS. Takže se dá předpokládat, jako se přepokládalo předtím, že až to poběží na stejné urovní bude to mít nižší výkon.
Příjde mi to jako humáč, když si to dělá co chce:)

Tady ale není řeč o kvalitě obrazu, ale o účinnosti framerate meteringu, tedy té technologie, která má upravovat frametimes mezi jednotlivými snímky.

Tak to se omlouvam! Videl jsem kvalitu vyhlazovani a prirovnal jsem si to k AA....Chtelo by to doplnit neco v tom smyslu co jste napsal vy do clanku:) Aby se neobjevil nejaky dalsi hnup jako ja :)

zkus si příště větu dočíst do konce :D

Ja jsem si to vylozil jako : 
AA nefunguje vsude. Metetering funguje i na 3 monitorech.
 
Nevadi nebudeme to resit dale :D

Ještě by bylo fajn, kdyby ses naučil používat tlačítko Odpověděť (místo přidávání nového komentáře a zakládání nového stromu diskuze pro už rozjeté téma).

Ako je to s microstutteringom? Kde je vidiet viac? na AMD alebo nVidia rieseni? Ako velmi je viditelny tearing a na akom rieseni? Co Vsync? Viem ze na AMD kartach neslo zapnut pokial sa pouzivalo Eyefinity. Nvidia bola ako na tom? Dakujem za zodpovedanie otazok. 

Zdravím. Chápem že tento test bol dosť náročný a vďaka zaň. :) Ale nedalo by sa otestovať aj iné módy ako AFR? Teda pamätám sa, že v minulosti bolo na výber viac módov ako SLI, tak aj CrossfireX, neviem aký je momentálny stav.

Existuji nejake zpravy o zprovozneni FRM i na standartnim SLI, pripadne i pro GF1xx-based karty? Neumim si predstavit technicky duvod, proc by to nemelo fungovat (vykreslovani snimku/frame buffer obsluhuje vzdy primary karta.. pokud se nebavime o Surroundu, tam to musi byt jeste o MOC zajimavejsi :) )BTW, pekne se do microstutteringu  "oprel" i TR a zatahl do toho i NV/AMD : http://techreport.com/articles.x/21516/11

Jeden důvod proč to na normálním SLI zatím není, by mohla být specifikace samotného SLI. SLI umožňujě zapojit více karet, pokud mají stejný čip a tuším stejnou velikost paměti. Ale můžou mít na obojím jiné frekvence. Kdežto GTX690 má u obou čipů a pamětí frekvenci stejnou (pokud mi něco neuniklo). Synchronizovat karty, které mají de facto jiný výkon, asi už nebude tak triviální. Samozřejmě většina lidí má v SLI zapojené totožné karty, ale obecně to tak být nemusí a zvlášť tady v testech se často sejdou pro test CF/SLI i karty, které nejsou úplně stejné.

A když jsou ve SLI různě rychlé karty, skutečně běží na svých různých taktech, nebo se ta rychlejší podtaktuje? Kdysi to tak fungovalo.

Zajímavá teorie, ale zřejmě je úplně mimo. Z jednoho prostého důvodu, kterým je GPU Boost. Paradoxní je, že s ním to funguje líp než GTX 590, která jej kdysi neměla. Nebo že by to naopak byl právě ten důvod, proč je na tom 690 líp? 

Aby bylo jasné, o čem mluvím, je to tenhle graf z recenze GTX 690:
 Každé z jader poskakovalo zřejmě zásluhou GPU Boostu během testování na jiných taktech, a rozdíly jsou dost velké (po většinu času jedno o 65 MHz níž než druhé). Podrobněji je to popsané v příslušné kapitole testu.

Paradoxní je, že s ním to funguje líp než GTX 590, která jej kdysi neměla.
To by mohlo být i ono. Možná si GPU Boostem jádra pomáhají k tomu, aby se v nějakém úkolu dohnala. Težko říct. A asi bude snažší synchronizovat boostování u dvou čipů na jedné desce, než u dvou karet od různých výrobců s ruznými schopnostmi boostu. Věřil bych, že časem se to dozvíme, ale jádro pudla ležící v různorodosti jednotlivých karet bych uplně nezavrhnul. A nezapomeňte, že jen odhaduju. Netvrdím, že to tak je.

Podtaktovavani/GPU boost jako mechanismus slouzici k "vyrovnani"vykonu pri vykreslovani mi prijde jako prestrelena uvaha - vzhledem k rozptylum fps (resp. delky zobrazeni snimku) ke kterym pri microstutteringu dochazi, je +- ~5-10% na taktech jadra prilis malo na nejake extra korekce.Domnivam se, ze hlavni cast optimalizaci, ktere FRM provadi, se deji na urovni driveru/NV API - proto zjistuji, jak to tedy FRM pri diskretnim SLI je. Pokud je to ciste SW feature.... Tak by nemusel byt problem toto zpristupnit i pro starsi karty. Pokud tedy odstranime z cesty marketingove oddeleni...

Tak přesně toto... jsem vysvětlil včera Stachovy "DD", slušně, spisovně a bez chyb do detailu... a dal mi ban na tom jeho webu. Holt co nadělám :D
Hloupý lidi si pojedou vždy to svý...

Tomu se rika zivotni lekce :) - nesdeluj sve nazory, byt logicky/technicky podlozene, nekomu, kdo o ne nestoji,koledujes si o hadku. Radeji ten cas venuj nekomu jinemu, treba o nej bude stat vic ;)

To máš pravdu :) momentálně trávím čas v práci, a když si člověk tak pročítá absurdní věci... tak mu to nedá... vytknout pár věcí. Ten ban mu udělal určitě radost... když už nic jiného ;)

moc hezká reklama na ten jeho web, vážně, může ti poděkovat za několik dalších návštěv díky tvému komentáři tady