SLI vs. CrossFire (nejen) v DirectX 10 hrách

0

Motivace pro souboj

Je to smutné, ale je to tak. Kombinace velkých LCD panelů s vysokými rozlišeními a vlna nových her jako World in Conflict nebo Bioshock začíná způsobovat, že ani majitelé GeForce 8800 GTX, Ultra či Radeonu HD 2900 XT mohou pociťovat nedostatek výkonu a musí si vybrat: buď plynulá snímková frekvence anebo maximální detaily. Jak, AMD, tak Nvidia nabízí, řešení: zapojení druhé grafiky a teoreticky až zdvojnásobení výkonu. AMD technologii nazývá CrossFire, Nvidia SLI.

Každý šestý z vás o zapojení dvou grafik přemýšlí anebo SLI/CrossFire už provozuje

Už od minulého týdne na ExtraHardware.cz probíhá anketa, zda máte o Multi-GPU vůbec zájem. Toto, většinou nikterak levné řešení, zajímá překvapivě každého šestého člověka. Navíc AMD vydala novou verzi ovladačů Catalyst, jež mají právě významně zvyšovat výkon CrossFire v nových hrách. Nvidia tak učinila již před delší dobou prostřednictvím ovladače ForceWare 163.69, který přinesl významné vyladění výkonu SLI pod Windows Vista.

U GeForce 8800 GTX/Ultra si můžete vybrat jeden z SLI konektorů pro zapojení můstku. Hlavně na něj nezapomeňte úplně, o velkou část výkonu byste přišli

Dvě BFG GeForce 8800 GTX OC zastoupili highend Nvidie. Levnější konfiguraci představovaly dvě karty Zotac GeForce 8800 GTS 320 MB. Klepněte pro zvětšení

Původně jsem chtěl využít počítače HAL 3000 aAlien XT eSuba a srovnat CrossFire nejen na plnohodnotné platformě s dvakrát PCIe ×16, ale také pojmout jako souboj platforem: Intel Core 2 Duo E6750 + Nvidia nForce 680i SLI + Nvidia GeForce 8800 SLI vs. AMD Athlon 64 X2 6400+ Black Edition + AMD 580X + Radeon HD 2900 CrossFire. Jenže ovladače Catalyst 7.10 počítač eSuba naprosto rozhodily (a pro rozumné výsledky ve hrách nepomáhaly jakékoliv reinstalace a odinstalace) a navíc se pole RAID 0 zřejmě v kombinaci s jižním můstkem a jeho ovladačem ukázalo být velkým zdrojem problémů.

Nakonec jsem tedy CrossFire zapojil na platformě, kterou jsem měl k dispozici: Intel P35. Výhodou je velmi podobná konfigurace, jakou mělo řešení Nvidia SLI, nevýhodou fakt, že druhý PEG konektor má k dispozici jen 4 PCIe linky (což se podle mě dle výsledků neukázalo jako nějaký extrémní handicap). Až AMD přijde s novým CrossFire čipsetem, snad bude celá platforma stabilnější a budeme moci učinit takové porovnání.

CrossFire jsme nakonec nemohli otestovat v počítači eSuba, na řadu přišlo zapojení „na stole“ v osvědčené desce s P35 čipsetem

Jak pracuje řešení Nvidie?

„Většina z vás má asi zkratku SLI spojenou s kartami 3Dfx Voodoo 2. Tyto karty byly poprvé vybaveny technologií Scan-Line Interleaving, která umožňovala spolupráci dvou Voodoo 2 spojených speciálním kabelem, který se podobal uprostřed rozstřiženému FDD kabelu. Čipy obou karet se střídaly ve vykreslování sudých a lichých řádků, a tak bylo možné teoreticky zajistit dvojnásobný fill-rate.

Dvě karty 3Dfx Voodoo 2 propojené kabelem SLI. Zdroj: Tom`s Hardware Guide

S návrhem čipu VSA-100 (použitým ve Voodoo 4 a Voodoo 5) bylo SLI dále vylepšeno a stalo se hlavně pro karty Voodoo 5 životně důležitým. Při zapojení více čipů VSA-100 (Voodoo 5 5500 mělo dva VSA-100 a Voodoo 5 6000 hned čtyři) rostla nejen rychlost, ale také maximální možný režim anti-aliasingu a navíc bylo možné dělit vykreslování mezi karty i po skupinách řádků. Více se o schopnostech karet Voodoo 5 (případně ještě víceprocesorových monster od Quantum 3D) dočtete na www.3dfx.cz.

Firmu 3Dfx však při krachu odkoupila Nvidia, a tak se pojem SLI objevil znovu u třídního nepřítele většiny přívrženců bývalého krále herních 3D karet. Tentokrát už zkratka znamená Scalable Link Interface a hodně těží z rychlosti sběrnice PCI Express (×16 = 8 GB/s). Ke zprovoznění dvou karet v režimu SLI musíte splnit následující podmínky:

  • mít základní desku s čipovou sadou Nvidia nForce 4 SLI a k ní dodávaný SLI můstek
  • mít dvě stejné grafické karty GeForce 6600 GT (nebo 6800, 6800 GT či Ultra) od jediného výrobce, které se navíc neliší ani verzí BIOSu
  • dostatečně silný zdroj a dostatek napájecích konektorů. zejména v případě dvou karet GeForce 6800 (dvakrát 6-pin nebo čtyři 4-pin Molex)

Především fakt, že musíte mít dvě identické karty, může být velkým problémem a jde i trochu proti myšlence: „Dnes koupíte jednu GeForce 6800 pro SLI a až vám nebude stačit, přikoupíte druhou a zapojíte do SLI“. Za pár měsíců už nemusí být identická karta dostupná, revize se mění třeba i 4× za čtvrt roku. Jediné čím se mohou karty lišit, je pracovní frekvence – potom ovladač automaticky nastaví takt obou karet na hodnoty pomalejší z nich.

Pokud použijete režim SLI, rozdělí se původních 16 PCIe linek pro jediný slot mezi sloty dva, jež mají tedy k dispozici rychlost PCIe 8× (4 GB/s). Fyzicky zůstávají sloty samozřejmě stejné, mění se pouze komunikace v nich. Aby procesor nemusel posílat data ke zpracování na grafické kartě dvakrát pro každé GPU ve SLI, tak se o rozdělovaní dat stará můstek nForce 4 SLI MCP, který by měl údajně pracovat s přenosovou rychlostí až 10 GB/s.

Samotné vykreslování pak řídí přímo ovladač grafické karty. Narozdíl od přístupu 3Dfx se už jednotlivé karty nestřídají ve vykreslování jednotlivých či několika řádků, ale ovladač horizontálně rozdělí obrazovku na dva pokud možno stejně výpočetně náročné úseky. Rozdělují se tedy opět řádky, ale každá karta obdrží jedinou souvislou skupinu. Tomuto postupu se říká SFR (Split Frame Rendering). Když ovladač špatně odhadne náročnost jednotlivých částí a jedno GPU dokončí svou práci dříve, musí pak čekat, než práci dokončí i druhé GPU. Efektivita pak samozřejmě klesá. Mechanismus, který má na starosti právě odhad náročnosti je podobný jednotce předvídání větvení kódu (branch prediction), kterou už dlouhá léta používají výrobci procesorů.

SFR však není implicitní metodou práce GeForce 6 v SLI. Tou je většinou rychlejší Alternate Frame Rendering (AFR), který poprvé realizovala konkurenční společnost ATI u Rage Fury MAXX. Jak už anglický název napovídá, při tomto režimu se obě dvě karty střídají ve vykreslování jednotlivých celých snímků. AFR však nelze použít u některých aplikací (například u těch, co používají postprocessing, kdy se frame buffer hned nevymaže, ale jeho obsah se ještě dále využívá).

Nvidia GeForce 8800 Ultra SLI nabízí chvílemi opravdu brutální výkon, vaší peněžence ale také odlehčí o více než 32 000 Kč. Zdroj: Nvidia

Ovladač však nedělá to, že by používal AFR a když by usoudil, že je třeba SFR kvůli některým efektům, tak by na něj za běhu přepnul, ale řešení je méně elegantní. Ovladač se jednoduše řídí seznamem her, u kterých má uvedeno, jaký režim SLI lze použít.“

V uvozovkách cituji sám sebe z článku Nvidia GeForce SLI: Zařaďte dvojku zveřejněném 21. 12. 2004 na serveru Živě.cz. Od té doby se ohledně SLI pár věcí změnilo:

  • nemusíte mít dvě naprosto identické karty: od ovladače ForceWare verze 80 lze kombinovat kartu různých výrobců, s různým BIOSem, jen musíte stále zachovat, že se jedná o dva stejné modely (tedy například dvě GeForce 8600 GTS). Můžete dokonce spárovat jednu výrobcem přetaktovanou a jednu nepřetaktovanou kartu (v SLI poběží obě na taktech té pomalejší). Pomocí jednoho triku s Coolbits (hodnota nastavena na 18, nebo 1A, chcete-li ještě přetaktovat) můžete spřáhnout i dvě karty s různou velikostí grafické paměti (např. GeForce 8800 GTS 640 MB a 8800 GTS 320 MB).
  • Přibyl nový SLI anti-aliasing, jež u dvou GPU ve SLI umožňuje zdvojnásobit maximální počet vzorků pro anti-aliasing. Se dvěmi GeForce 7900 v SLI tak můžete mít až 16× AA, u Quad-SLI (dvě dvoučipové GeForce 7950 GX2, celkem čtyři GPU) dokonce až 32× AA. Ovladače ForceWare pro GeForce 8800 zatím SLI AA neumožňují (a zřejmě ani umožňovat nebudou), musíte se spokojit s 16× AA, jež umí jediná G80.
  • SLI funguje i se silnějšími kartami jako jsou GeForce 8800 bez spojovacího můstku (přes sběrnici PCI Express). Nárůst výkonu je pak samozřejmě nižší (a spotřeba naopak maximální), ale funguje to (vyzkoušel jsem na čipové sadě nForce 680i a dvou GeForce 8800 GTX).
  • SLI by mělo fungovat i ve hrách, pro něž zatím v ovladačích ForceWare není vytvořen profil. Pokud v ovladačích ponecháte položku SLI performance mode na hodně nesmyslně nazvanou hodnotu Single-GPU, ovladač sám vybere nejvhodnější režim SLI. Můžete ale sami vynutit SFR nebo jeden z režimů AFR:
  • Základní desky se třemi PCIe ×16 sloty a čipovými sadami nForce 680i a 780i brzy nabídnou podporu Triple SLI. Pro Triple SLI budete potřebovat tři karty GeForce 8800 GTX/Ultra (každá má dva SLI konektory).
  • I bez restartu už SLI podporuje buď výkonný režim pro jeden monitor, nebo nespřažený mód s podporou výstupu až na čtyři monitory. V ovladačích stačí přepnout Enable SLI/Do not use SLI:
  • Nvidia připravuje Hybrid SLI. To umožní přidat k integrované grafice série GeForce 8 (čipset se teprve chystá) přidat jakoukoli samostatnou kartu ze stejné generace a využívat SLI. Řešení bude mít význam hlavně při přidání druhé levné grafiky, kde by nárůst výkonu mohl činit i několik desítek procent (k nějaké výkonné diskrétní grafice bude zbytečné přidávat slabou integrovanou do SLI).

Historie CrossFire

S termínem CrossFire jste se poprvé setkali před dvěma lety (a několika měsíci), kdy ATI uvedla samotnou technologii a zanedlouho nato i první produkt – Radeon X850 XT CrossFire. Rok 2005 ale zdaleka nebyl začátkem:

  • Listopad 1999 – vydání Rage Fury MAXX – první grafické karty pro hráčský segment se dvěma akcelerátory na jednom PCB. Karta využívá režimu AFR (liché snímky počítá první čip, sudé druhý), konkuruje GeForce 256 a nepodporuje nové Windows 2000, neboť by návrh karty vyžadoval více IRQ. Rage Fury MAXX jsou ve své podstatě dvě karty na jednom PCB, oba čipy by teoreticky mohl pracovat nezávisle a mít vlastní výstup, ale z důvodů úspory výrobních nákladů je nakonec na kartu osazen pouze jeden konektor pro monitor.
  • Duben 2000 – ATI vydává Radeon 256 (R100), první čip řady Radeon (DX7+). Navržen je i vzorek MAXX verze se dvěma čipy; sériová výroba ale nikdy nebyla spuštěna
  • Září 2001 – Uveden Radeon 8500 (R200, DX8.1), opět připravena MAXX verze, opět končí ve fázi prototypu.
  • Březen 2002 – ATI na Cebitu potvrzuje, že grafické systémy postavené na více identických čipech nejsou pasé, což potvrdila společnost CAE (výrobce profesionálních simulátorů), která uvedla produkt Tropos – grafický akcelerátor se čtyřmi procesory R200, na které byly prezentovány real-time renderované scény z Lord of the Rings.
  • Červenec 2002 – ATI ohlašuje Radeon 9700 (R300, DX9.0); bez zmínky o multiprocesingu, ale rozlišení mřížky pro anti-aliasing (12 × 12) dává vědět, že výroba neskončí u karet osazených jedním čipem, neboť jeden čip schopný vykreslit maximálně šest vzorků na pixel nemůže tuto mřížku efektivně zaplnit.
  • 2003 – Evans & Sutherland, jeden z největších výrobců profesionálních simulátorů (trenažéry, armádní účely atp.), přichází s produktem simFusion 6000q – grafickou kartou složenou ze dvou PCB a čtyř čipů R300. Tento produkt byl schopen s FSAA 24× dosáhnout skóre 2 500 bodů v 3DMarku 2003, což odpovídalo (tehdy) o rok starším high-end kartám s vypnutým vyhlazováním… Kompletní systémy simulátorů obsahovaly desítky těchto karet. Po vydání dalších Radeonů následovalo E&S s analogickými produkty.

Novodobá historie

  • Květen 2005 – ATI uvádí technologii CrossFire, ale pouze jako myšlenku – konkrétní produkt prozatím uveden není.
  • Září 2005 – uveden první produkt – Radeon X850 XT CrossFire Master, který jste mohli propojit s libovolnou kartou generace X8x0. Produkt má dvě zásadní nevýhody: přišel velmi pozdě (krátce před uvedením nové generace) a omezuje kombinaci maximálního rozlišení a obnovovací frekvence na 1 600 × 1 200 px při 60 Hz.
  • Říjen 2005 – oficiálně uvedena nová generace produktů včetně Radeonu X1800 XT (R520, DX9.0c) s ohlášenou dostupností od listopadu. O další měsíc později je dostupná CrossFire verze karty, která netrpí omezením v podobě nízké obnovovací frekvence u vysokých rozlišení.
  • Listopad 2005 – Catalyst 5.11: Povoleno CrossFire na Radeonech X1300/X1600 (bez master karty, komunikace probíhá čistě po sběrnici). CrossFire bez master karty a propojky také bývá označováno jako software-CrossFire.
  • Leden 2006 – vydán Radeon X1900 včetně CrossFire master karty. Ta ovšem byla taktována o 25 MHz níže než vlajková loď Radeon X1900 XTX, což nebylo přijato zrovna s nadšením, ale vzhledem k výslednému výkonu tohoto řešení byl celek považován za úspěšný. Koncept nebyl oproti X1800 XT změněn.
  • Březen 2006 – čipset Xpress 3200: První čipset s podporou 2× 16 PCIe linek přes north-bridge s interním loop-back propojením pro efektivnější software-CrossFire
  • Duben 2006 – Catalyst 6.4beta – experimentální podpora software-CrossFire pro Radeon X1900 GT – rozdíly výkonu se liší v závislosti na aplikaci, v průměru do 10 % oproti použití master karty s propojkou.
  • Květen 2006 – Catalyst 6.5 – podpora software-CrossFire pro mainstreamový Radeon X1800 GTO.
  • Červenec 2006 – Catalyst 6.7 – oficiální software CrossFire pro Radeon X1900 GT, nově implementována možnost použití kompatibilní verze AFR režimu nastavením Catalyst AI na „advanced“ = možnost uživatelské aktivace profilu přinášejícího nejvyšší nárůst výkonu.
  • Říjen 2006 – uvedeny Radeon X1650 XT a X1950 Pro (RV570); první čipy s integrovaným rozhraním pro (interní duální propojka), vyšší nárůsty výkonu. Dále Radeon X1950 XTX (R580+) včetně CrossFire master karty, která je již taktována na plné frekvence a díky slušně odladěným ovladačům poprvé jednoznačně poráží konkurenci.
  • Listopad 2006 – Catalyst 6.11 – software-CrossFire pro všechny karty řady X1900

Současnost

  • Leden 2007 – Catalyst 7.1 – kompatibilní verze AFR režimu byla nastavena jako standardní režim pro Windows XP, uvedena podpora pro Vistu (Direct 3D). V souvislosti s tím ATI uvádí limitovanou řadu „Radeon X1950 XTX Uber Edition“ dodávanou v páru a s podpisem D. Ortona (takty 670/2 100 MHz).
  • Březen 2007 – Catalyst 7.3 – uvedena podpora CrossFire pro Vistu, zároveň je pro DX9 ovladač Visty nastaveno AFR jako základní režim.
  • Květen 2007 – vydán Radeon HD2900XT (R600, DX10) – první high-end čip s integrovaným CrossFire rozhraním (tzn. interní propojovací systém)
  • Říjen 2007 – Catalyst 7.10 – implicitně nastaven kompatibilní AFR režim pro DirectX 10 (výrazné nárůsty výkonu ve hrách, které nemají profil)

Technologie CrossFire

1. Generace CrossFire – Radeon X850 XT

Scissors/Split-Frame Rendering (SFR)

SFR jako první do hráčského světa přinesla společnost Metabyte pod názvem PGC (Parallel Graphics Configuration). Její vývoj ale trval dlouho, a když byla hotová, byla již nezajímavá, neboť trh nabízel grafické karty s vyšším výkonem, než duo Voodoo 3, pro které byl PGC systém postaven.

Princip SFR spočívá v rozdělení snímku na poloviny, z nichž každou počítá jedna karta. Protože je scény rozdělena, musí každá karta počítat kompletně geometrickou část a tento režim tedy akceleruje jen operace s pixely. Rozdělení scény bylo v případě první generace CrossFire (stejně jako u PGC) vodorovné s fixně danou hranicí uprostřed scény. Hranice není adaptivně posouvána podle náročnosti jednotlivých partií scény – analýza náročnosti vykreslení předchozího snímku, podle něhož by byla hranice posouvána pro rendering dalšího snímku, by dle vyjádření ATI byla příliš náročná na CPU a spíše výkonu škodila. Také by škodila v případě rychlého pohybu, kdy ve snímku „A“ (podle kterého by byla hranice určena pro výpočet snímku „B“) bude reálná situace zcela jiná, než pro snímek „B“.

Polovina obrazu vypočtená sekundární kartou je přenesena přes DVI propojovacím kabelem do master karty, kde programovatelný procesor od společnosti Xillinx obrazy spojí a přes RAMDAC či TMDS transmitter odešle na monitor. Problém Radeonu X850 byla absence nativní podpory pro rychlé dual-link DVI rozhraní, vlivem čehož byl přenos omezen na rozlišení 1 600 × 1 200 při 60 snímcích za vteřinu – tedy 60 Hz.

Alternate Frame Rendering – AFR

AFR měla ATI patentovaný již v době Rage Fury MAXX (ta jej z 3D akcelerátorů používala jako první). Funguje na jednoduchém systému: první grafický čip vykresluje liché snímky, druhý sudé snímky. Výhodou je, že škáluje nejen fillrate, ale i geometrický výkon (a krom transportů textur i šířku sběrnice).

Super Tiling

Unikátní režim ATI CrossFire, který byl používán na profesionálních simulátorech. Spočívá v rozdělení obrazu na šachovnici, kdy „světlá“ políčka šachovnice vykresluje první čip, „tmavá“ druhý (samotná políčka jsou rozdělena mezi jednotlivé pipelines). Nevýhoda – neškáluje geometrii. Výhody: ideální rozdělení zátěže mezi oba čipy, snadno může podporovat více čipů. Super Tiling byl po dlouhou dobu implicitním režimem CrossFire. Ačkoli byl teoreticky velmi zajímavý, nepřinášel v praxi valné výsledky, neboť nefungoval na tomtéž principu jako u simulátorů, kde měl každé políčko šachovnice na starost jeden čip (efektivnější využití texture cache, přístupů k paměti atp.)

Super AA

Super AA taktéž vycházel ze spolupráce s Evans & Sutherland. Díky programovatelné FSAA mřížce architektury R3xx (a vyšších) umožňuje, aby každá karta vykreslovala stejný obraz, ale pozice AA vzorků jsou pro každý čip rozloženy jinak a tudíž po prolnutí obou obrazů dojde k efektivnímu zdvojnásobení účinnosti FSAA. Na obrázku si můžete všimnout, že rozložení vzorků je oproti režimu jedné karty upraveno tak, aby bylo co možná nejefektivnější a vykrývalo „plochu“ celého pixelu.

Radeon X850 pro režimy SuperAA nevyužíval externího kompozitoru, ale data byla odesílána po sběrnici PCIe a zpracována grafickým čipem (kompozitor nebyl dostatečně rychlý na to, aby zvládal real-time blending takového množství pixelů

2. Generace CrossFire – Radeon X1800/X1900

Ačkoli „druhý CrossFire“ na první pohled nelišil od původního, došlo ke změnám prakticky u všech režimů:

  • Integrovaná podpora pro dvě dual-link DVI rozhraní zajistila, že CrossFire nebylo limitováno rozlišením 1 600 × 1 200 při 60 Hz. Nový systém zvládal 30“ displeje při HD rozlišení.
  • SFR/scissors: Rozdělení obrazu již nebylo dáno pevně 50:50, ale v rámci profilu může mít každá aplikace stanoven lépe vyhovující poměr (např. 65:35 atp.). Krom toho už není rozdělení limitováno jen na horizontální, ale je možné dělit i vertikálně (svisle). Domnívám se, že šlo o softwarovou záležitost a že tato zlepšení ovlivnila i předchozí generaci.
  • Super Tiling: viz níže.
  • AFR: S pozdějšími ovladači je režim AFR nastaven jako primární (na úkor Super Tiling). Jak jsem již nakousnul, bylo implementováno několik AFR režimů, z nichž byl pro tyto účely vybrán tzv. kompatibilní režim, který funguje s největším množstvím aplikací, ale přináší o několik (výjimečně o několik desítek) procent nižší výkon, než „výkonný“ (performace) AFR režim. Ten je pak použit až na základě testů v rámci profilů pro jednotlivé hry.
  • Super AA: Nový rychlejší kompozitor už zvládá real-timově prolínat desítky několikamegapixelových snímků za vteřinu, takže i při SuperAA může být použita rychlejší externí propojka, což vede k vyššímu výkonu.

CrossFire 2+, software-CrossFire

Lowendové a mainstreamové produkty, pro které by master karta neměla smysl (případně by byla příliš drahá), neskončily zapomenuty. Stejně jako první generace využívala PCIe pro přenos dat při Super AA, tak mohly levnější karty sběrnici využívat pro všechny režimy. Vzhledem k jejich nižšímu výpočetnímu výkonu pro ně nepředstavovala výrazný limit. Uvedena byla nejprve pro Radeon X1300, X1600 a později X1800 GT, X1900 GT a nakonec pro všechny modely řady X1900.

CrossFire 3. generace

S uvedení čipu RV570 (Radeon X1950 Pro/GT) koncem léta 2006 přišel i výrazný krok vpřed. Duální dvanáctibitové rozhraní integrované v čipu a vyvedené na hranu PCB v podobě dvou konektorů znamenalo jeden z největších kroků vpřed.

Nové zapojení nese i technologický potenciál, protože pro komunikaci mezi čipy totiž stačí jeden konektor (ačkoli je nutné pro aktivaci CrossFire mít zapojeny oba konektory, jde o záměrný limit v ovladačích). Použití druhého je tedy jakousi rezervou a ponechává další možnosti (propojení více karet). Podobně je tomu i u duálního rozhraní konkurenční GeForce 8800 GTX/Ultra, ale tam je druhé rozhraní softwarově vypnuté.

CrossFire 4. generace

Level 4 aneb blízká budoucnost. Částečně. Ačkoli můžeme R600 a celou jeho generaci zařadit do předchozí podkapitoly, nebylo by to úplně přesné. Stejně jako na G80 Nvidia upustila od SLI AA, tak R600 nepodporuje SuperAA. Vždy je třeba najít určitý kompromis a jak G80, tak R600 podporují velmi kvalitní FSAA s vysokým počtem vzorků, takže není třeba jejich kvantitu násobit použitím více čipů. To souvisí i s rozložením vzorků (problém především pro Nvidii), programovatelnými down-sampling filtry (problém především pro ATI) a vydatnou softwarovou podporou (problém pro oba výrobce). CrossFire i SLI tím ztrácí onen punc vyšší obrazové kvality a zůstává jen výkon (nelze opomenout ani pozitivní vliv, který měl super-sampling na textury).

Každá mince má dvě strany a té lepší se teprve dočkáme. Bude to třícestné (+160%) a čtyřcestné (+240%) CrossFire, aktivace softwarového CF pro další produkty (přenosová rychlost PCIe 2.0 čipsetu RD790 by měla pro tyto účely bohatě stačit), single-connector CrossFire a v neposlední řadě sem spadá i CrossFire OverDrive, který již byl představen.

Valná část těchto technologií bude uvedena zároveň s čipem RV670 (Radeon HD 2950), čipsetem RV790 a procesorem Phenom zhruba za měsíc.

Více se o CrossFire dozvíte na stránkách AMD

Testovací sestavy a testy

Testovací sestava pro Nvidia GeForce (SLI)

Procesor Intel Core 2 Duo E6750, 2,66 GHz
Základní deska BFG nForce 680i SLI
Čipová sada Nvidia nForce 680i SLI
Skříň SilverStone Temjin TJ07
Pevné disky WD Raptor X 150 GB
WD Caviar RE2 500 GB
Paměť 2× 1 GB A-Data Vitesta Extreme DDR2-800, 4-4-4-15
Zdroj BFG 1 000 W PSU
Grafické karty 2× BFG GeForce 8800 GTX OC 768 MB (600/1 800 MHz)
2× Zotac GeForce 8800 GTS 320 MB (513/1 585 MHz)
Operační systém Windows Vista Ultimate, 32-bit
Ovladače Nvidia ForceWare 163.69 a 163.75
(brán vyšší z výsledků)

Testovací sestava pro ATI Radeon (CrossFire)

Procesor Intel Core 2 Duo E6750, 2,66 GHz
Základní deska Asus P5K-E WiFi AP
Čipová sada Intel P35
Skříň
Pevný disk WD Caviar SE16 250 GB
Paměť 2× 1 GB A-Data Vitesta Extreme DDR2-800, 4-4-4-15
Zdroj Silverstone Decathlon DA750
Grafické karty 2× ATI Radeon HD 2900 XT 512 MB (742/1 625 MHz)
Operační systém Windows Vista Ultimate, 32-bit
Ovladače Catalyst 7.9 a 7.10
(brán vyšší z výsledků)

Verze herních testů, nastavení

Operační systém byl aktualizován pomocí všech záplat týkajících se grafického výkonu. Vertikální synchronizace (Vsync) byla vypnuta, v ovladačích ForceWare byly vypnuty trilineární optimalizace (filtrování textur nastaveno na High Quality).

Testováno bylo v těchto hrách:

  • Bioshock (DirectX 10)
  • Company of Heroes 1.71 (DirectX 10)
  • Lost Planet 1.004 (DirectX 10)
  • World in Conflict 1.001 (DirectX 10)
  • F.E.A.R. 1.08 (DirectX 9, soft shadows)
  • Gothic 3 (DirectX 9, HDR)
  • Medal of Honor: Airborne (DirectX 9, HDR)
  • Serious Sam 2 (DirectX 9, HDR)
  • Enemy Territory: Quake Wars 1.1 demo (OpenGL)

Ve všech hrách bylo testováno s maximálními možnými detaily, v Bioshocku byla vypnuta volba Force Global Lighting a ve World in Conflict volba Transparency Anti-Aliasing. U her, kde nebylo možno spolehlivě vynutit anti-aliasing, jsem místo 1 920 × 1 200 px se 4× AA a 16× AF zvýšil rozlišení a testoval jen s AF – tedy ve 2 560 × 1 600 px s 16× AF.

Bioshock

Bioshock staví na Unreal 3 enginu a přidává DirectX 10 povrchy. Testuji s nejvyššími možnými detaily, vypnuté nechávám globálním osvětlení (global lighting). Hra nemá zabudovaný benchmark, a tak testuji pomocí FRAPS. Vybral jsem velmi náročnou část z počátku hry – od vašeho vynoření se na hladině, kolem ohně až do majáku. MSAA se mi nedařilo ani vynutit, a tak v náročnějším nastavení používám vyšší rozlišení (2 560 × 1 600 px) s vynuceným 16× anizotropním filtrováním.

Jeden z mála problémů, který jsem měl s SLI byl právě v Bioshocku. Ať už jsem přeinstalovával ovladač, jak jsem jen mohl, zkoušel 163.69 i .75, zkoušel vynutit ručně AFR1, AFR2, SFR, vynutit je v profilu, pořád nic. Teprve až jsem pomocí DriverSweeperu (odkaz najdete v našem fóru, v sekci Utility) systém ForceWare zcela zbavil a znovu nainstaloval, škálování se dostavilo.

SLI i CrossFire ve hře přidají zhruba 40–60 % výkonu navíc dle lokace a náročnosti nastavení. Radeon HD 2900 XT si vede obstojně, ale celkový dojem degradují minimální fps. GeForce 8800 GTS 320 MB je v náročnějším nastavení limitována velikostí grafické paměti.

Company of Heroes

Company of Heroes s patchem 1.70 přidala podporu DirectX 10, patch 1.71 opravil pár drobností a přidal varování pro nastavení, na něž nestačí paměť. Testuji se všemi detaily na High či Ultra, DX10 texturami a s nejnižší kvalitou zvuku. Důležité je hru spustis s parametrem -novsync. Používám zabudovaný benchmark.

Radeon HD 2900 XT je jako single karta v Company of Heroes pořád docela slabý, v CrossFire se díky Catalyst 7.10 dost zlepšil a v průměrných fps se může zařadil přesně mezi 8800 GTX OC a 8800 GTS 320. Minimální fps jsou u řešení ATI zase slabinou. 320 MB GeForce 8800 GTS na maximální nastavení s 4× AA nestačí a propad je zřetelný.

Lost Planet

Lost Planet byla vůbec první PC hrou, která přímo vyšla s podporou DirectX 10. Pro měření výkonu grafik je důležité nepoužívat demo se zastaralým kódem, naopak updaty plné hry až na 1.004 přinesly několik optimalizací. Všechny detaily nastavuji na high, kvalitu srsti (fur quality) na hodnotu DX10. Podpora Multi-GPU byla v případě CF i SLI nastavena vždy na ON, počet souběžných (concurrent) operací byl pro testovaní s Core 2 Duo nastaven na 2. Používám vestavěný benchmark a výsledky z části snow.

Lost Planet je stejně jako Medal of Honor (a snad tím pádem i Unreal Tournament 3) jednou z parket Multi-GPU. Nárůsty 83 a 92 % u 8800 GTX, resp. 8800 GTS SLI i bez anti-aliasingu a 65 % u 2900 XT CrossFire (po zapnutí AA) stojí za investici do druhé karty. Výkon HD 2900 XT je (v kontrastu s Medal of Honor Airborne) výrazně slabší než u GeForce řady 8800.

World in Conflict

World in Conflict je asi nejlépe vypadající strategie, zástupce nové vlny DirectX 10 a dobrý benchmark procesoru. Testuji s maximálními detaily (i s water reflects clouds, vypnut mám jen transparency AA, protože si nejsem jist jeho stejnou implementací u Nvidie a ATI). Používám vestavěný benchmark.

Patch 1.001, Catalyst 7.10 a výkon Radeonu HD 2900 Xt i jeho CrossFire zapojení stále nikde. Došlo sice k procentně zajímavému navýšení, ale co naplat, když průměrný fps HD 2900 XT se nedá ani srovnávat s minimálním u 8800 GTX. Multi-GPU ve hře limitované procesorem nemá valný přínos. 320MB GTS nestačí velikost paměti.

F.E.A.R.

F.E.A.R. s patchem 1.08 zastupuje velmi slušně optimalizovaný (i vypadající) DirectX 9 engine, se soft shadows (měkké stíny) navíc dobře škáluje i výkonné karty. Používám zabudovaný benchmark.

Ve F.E.A.R., zvlášť pod Windows Vista, funguje SLI i CrossFire skvěle. Radeon HD 2900 XT samostatně i v CrossFire GeForce 8800 GTX (resp. SLI) předčí. Ale to jen, pokud se bavíme o průměrných fps, s CrossFire se totiž hranice minimálních fps nezvedne, naopak nějaká režie tohoto zapojení způsobí, že ještě poklesnou. Plynulost je tedy lepší s SLI.

Gothic 3

Gothic 3 je příkladem DirectX 9 hry s HDR, u níž se engine nedá rozhodně nazvat optimalizovaným a také jej výrobci karet nemají mezi top hrami, pro které by optimalizovali oni (netestuje se jím tolik). I proto je dost zajímavé sledovat, jak si v něm vedou Multi-GPU obou firem. Hra ignoruje i vynucení MSAA v ovladačích, místo toho jsem v druhém grafu použil vyšší rozlišení a vynucený 16× anizotropní filtr. Výkon měřím pomocí FRAPSu.

V Gothic 3 CrossFire bohužel nefunguje, efektivita dvou 8800 GTX také není závratná (limit je jinde), druhá GTS naopak pomůže opravdu dost.

Medal of Honor: Airborne

Medal of Honor: Airborne je jednou z mnoha nových her používajících Unreal 3 engine. Tím pádem přináší solidní kombinaci vzhledu a plynulosti na dostupném hardwaru. Testuji opět s maximálními detaily (včetně nastavení textur). Hra nemá zabudovaný benchmark, používám tedy FRAPS a vždy stejnou scénu letu letadla a seskoku z padáku.

Text

Serious Sam 2

Starší DirectX 9 hra je s maximálními detaily, HDR a ve vyšším rozlišením stále dobrým testem grafických karet. Croteam enginy umí, i v Serious Sam 2 použil několik zajímavých technologií (třeba jako jeden z prvních využil kompresi ATI 3Dc). Pomocí zabudovaného benchmarku, který můžete ovládat skriptem, měřím výkon v demu Greendale.

CrossFire je v hře dost efektivní, za propad při zapnutí 4× MSAA dle mě nemůže druhá PCIe ×4 sběrnice, ale spíše slabý výkon HD 2900 XT s AA jako takový.

Enemy Territory: Quake Wars

Nové Enemy Territory představuje jedinou současnou moderní OpenGL hru pod Windows a zároveň jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohaený především o technologii MegaTexture. Pro testy používám maximální detaily, AA i AF zapínám ve hře, patch 1.1 by měl řešit problémy se soft particles. Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy.

Stejně jako tomu bylo dlouho u hry Doom 3, jsou OpenGL Quake Wars královstvím Nvidie. Fandové této online hry a současně majitelé karet mohou jen doufat, že se vývojářům Catalyst podaří časem stejné zlepšení jako u her Doom 3 a Quake 4. Pokud upgradujete z Catalyst 7.9 na Catalyst 7.10 pdo Windows Vista, nepoužívejte aktualizaci, ale ovladač odinstalujte a poté nainstalujte, jinak se upgrade ovladačů na hře dost negativně projeví (už plynulost nabídky se stane tragickou).

Výsledky trochu jinak, verdikt

V grafech jsme porovnávali absolutní hodnoty. Buď průměrné hodnoty fps, nebo minimální, ale vždy jen absolutní nárůsty. Multi-GPU se spíš posuzuje relativně – tedy jako nárůst snímkové frekvence při zapojení více karet:

Shrnutí výsledků a procentní nárůsty. Klepněte pro zvětšení (~ 100 kB, PNG)

Závěry jsou jasné:

  • Nejefektivnější je SLI zapojení dvou GeForce 8800 GTS 320 MB, ale jen ve hrách, kde stačí malý frame buffer.
  • Absolutním králem je GeForce 8800 GTX SLI, kromě World in Conflict, kde je toto řešení limitováno procesorem, přináší vždy jistý nárůst. Při náročných režimech je to 50–60 % oproti jedné GeForce 8800 GTX OC.
  • CrossFire má až na výjimky v podobě Gothic 3 srovnatelné relativní nárůsty, Radeon HD 2900 XT je však v mnoha DirectX 10 hrách přece jen pomalejší, v absolutních hodnotách se dva HD 2900 XT v CrossFire dají srovnat spíše s úspornými a levnějšími GeForce 8800 GTS 320 MB ve SLI. Připočteme-li nepříjemný výkonnostní dopad anti-aliasingu. vysokou spotřebu a často velmi špatné hodnoty minimálních fps, nejedná se v současnosti o příliš konkurenceschopné řešení.

Ač CrossFire vypadá papírově velmi zajímavě a řekl bych, že i pokročileji než Nvidia SLI, současná herní praxe je jiná a náročný hráč si koupí GeForce 8800 GTX/Ultra SLI. CrossFire momentálně trpí stejnými nemocemi jako v něm zapojená karta – Radeon HD 2900 XT: propady výkonu (nízká minimální fps), propady po zapnutí anti-aliasingu. A hlavně, což je pro hráče, který je ochoten utrácet velké peníze za špičková grafická řešení, asi nejdůležitější, s Nvidií má v posledním době docela velkou jistotu, že výkon v tom či onom novém titulu nebude špatný.

U ATI/AMD trvá většinou měsíc i více, než přijde ovladač, jenž výkon v problémové hře trochu spravuje, „naplno“ se Radeony ždímou ještě o nějakou tu celou verzi Catalystů později. A to je v naprostém highendu hrozně pozdě. A to nemluvím o problémech s Catalyst 7.10, jež jsem pod Windows Vista 32-bit zažil jak na platformě AMD, tak v menší míře (odpadly problémy s RAID 0) na Intelu. Za nemalé peníze prostě žádáme vyladěnost, nejen potenciál a v tomto je Nvidia jednoduše dále. Na prostředcích (program Meant To Be Played, vlastní výkonná čipová sada) už nezáleží, podstatné jsou výsledky.

Provoz dvou Radeonů HD 2900 XT v CrossFire. Klepnutím přehrajete video

Za zapůjčení grafických karet BFG děkuji společnosti:
Nvidia
Za zapůjčení grafických karet ATI děkuji společnosti:
AMD
Za zapůjčení grafických karet Zotac děkuji společnosti:
100Mega
Za poskytnutí testovacích her děkuji společnosti:
CD Projekt

SLI vs. CrossFire (nejen) v DirectX 10 hrách

Ohodnoťte tento článek!