První test Lucidlogix Hydra v ČR: multi-GPU pro masy

0

Proč ne SLI a CrossFireX, proč Hydra?

Zkusme si společně načrtnout, jaká úvaha stála za vznikem Hydry a jaké argumenty přesvědčují nové a nové investory ke vložení své důvěry v Lucid. O tom, že GPU, tedy grafický procesor či dnes již stále obecněji i kompletní grafický akcelerátor, je tou hlavní komponentou určující výkon počítače v 3D scénách (v domácích podmínkách nejčastěji hrách), není pochyb. A o tom, že kdyby výrobci nemuseli brát ohled na velikost jádra, spotřebu, zahřívání anebo cenu, dokážou vyrobit asi s přehledem na vše stačící GPU, také ne.

Právě nutný kompromis mezi posledně zmíněnými atributy a výkonem vede výrobce k použití multi-GPU. V současnosti mají oba většinoví výrobci GPU (Nvidia a AMD) své vlastní řešení spřažení více grafik. AMD a Radeony, to znamená CrossFireX, Nvidia a GeForce, to je zase SLI. Multi-GPU už zkoušela i S3 Graphics, její Multichrome koketovalo i s možností zapojovat právě akcelerátory Nvidia GeForce a ATI Radeon. To už bychom ale zbytečně zabředli do dávnější a s Hydrou jen málo spjaté (byť zajímavé) historie.

Obecné a zjednodušené schéma práce dnešních grafických procesorů. Geometry processor (či shader, chcete-li) pracuje s polygony (pořadí, umístění ve snímku, perspektiva, odstranění skrytých trojúhelníků, pixel procesor následně nanese na polygon (po triangle setupu, rasterizaci) správnou texturu, aplikuje stínování, per-pixel osvětlení a barevné procedury. Toto základní schéma odhaluje možná úzká hrdla:

  • geometry shader má hodně práce, když se mezi snímky děje hodně pohybu a přibývá nových objektů
  • pixel shader bývá zaměstnán per-pixel operacemi zejména při vysokém rozlišení, v našem zjednodušeném schématu také anti-aliasingem
  • kapacita paměti a přístupová doba jsou kritickými faktory např. v situacích, kdy je třeba swapovat velké textury

Jak SLI, tak CrossFireX dnes sází hlavně na metodu Alternate Frame Rendering (AFR). Střídavé vykreslování snímků může přinést až lineární škálování a bylo dosud nejrychlejší z existujících metod multi-GPU. AFR má ale také několik nevýhod: zvýšení latence (input lag plus jeden snímek za každé GPU v multi-GPU zapojení) a horší škálování výkonu s více jak dvěma GPU. AFR také nelze úspěšně použít tam, kde existují mezisnímkové závislosti (například postprocessing, u něhož se frame buffer hned nevymaže, ale jeho obsah se ještě dále využívá) a nesvědčí mu ani scény s velkými rozdíly mezi snímky (nerovnoměrná zátěž).

Výsledkem různých časů dokončení snímků může být tzv. micro-stuttering. Ten je problémem hlavně při (jinak většinou plynule vnímaných) snímkových frekvencí kolem hodnoty 30, při vyšším výkonu není vnímán. Zapojené grafické karty by také měly být co nejpodobnější, pokud možno stejné. AFR nefunguje také při zapojení SLI či CrossFire karet (např. GeForce 9800 GX2, GTX 295, Radeon HD 4870 X2, 5970) do Quad-SLI či Quad-CrossFireX režimů. AFR musí adresovat přímo jednotlivé GPU, což multi-GPU grafické karty se dvěma čipy na jednom PCB (a jedním PCI Express konektorem) neumožňují.

Méně často se už dnes setkáte s metodou Split Frame Rendering (SFR) či Tiling. Každému GPU je dynamicky přidělena ke zpracování nějaká část snímku, typicky třeba horní plus minus polovina prvnímu GPU a dolní zhruba polovina (dle analyzované náročnosti) druhému GPU. Je zřejmé, že SFR distribuuje zátěž zpracování pixelů, ale geometrie musí být uložena v paměti každého GPU kompletní. SFR je typicky pomalejší než fungující AFR a nedá se použít třeba tam, kde je nasazena technika render-to-texture.

Hydra je založena na myšlence daleko noblesnější. Má zařídit skutečnou distribuci zpracování mezi GPU v reálném čase. Vývojáři si kladli cíle, jež zní skoro jako pohádka:

  • umožnit uživatelům výběr GPU pro cenové a výkonnostní hladiny
  • umožnit volbu při příštích upgradech systému (zákazník nemá být fixován na výrobce jednou koupeného produktu, když hledá možnosti navýšení výkonu)
  • eliminace potřeby speciálních a proprietárních konektorů
  • škálování výkonu i když je instalována více jak jedna grafická karta
  • umožnit nestejným GPU pracovat společně a nemuset tak vyměňovat obě grafické karty, když jedna přestane fungovat anebo je zastaralá

Hydra vstupuje do systému jako dedikovaný čip, který komunikuje s northbridge (dnes často integrovaným v procesoru) a na druhé straně potom s grafickými kartami. S northbridge je Hydra spojena skrze PCIe 2.0 ×16 a z Hydry mohou vést dva PCIe 2.0 ×16 výstupy k GPU (LT22102). Nebo také dva PCIe 2.0 ×8 (LT22114) u případných levnějších návrhů základních desek. Každý PCIe 2.0 ×16 může být v případě čipu LT24102 nejen ponížen na PCIe ×8, ale také rozdělen na dva PCIe 2.0 ×8, takže tu máme potenciální podporu čtyř GPU na PCIe 2.0 ×8 spojích.

Čip Hydra 100 proslavený především demonstracemi za zavřenými dveřmi či v lepším případě plexisklem se nakonec mezi uživatele nedostal, první sériové řešení s Hydrou, základní deska MSI Big Bang Fuzion už nese verzi 200. Hydra 200 (celá série, ať už LT22102, LT22114 či LT24102) obsahuje programovatelný procesor Tensilica Diamond 212GP, což je 300MHz RISC se základní instrukční sadou pro DSP. Není to však informace podstatná. Cože? Ano, know-how Hydry tkví totiž v softwarové vrstvě, jako hardware by mohl dost pravděpodobně posloužit jiný procesor podobné kategorie.

Zajímat by vás mohla snad jen spotřeba, ta má být do 6 wattů. Možná se na ní příznivě podepsal 65nm výrobní proces, prototypy Hydra 100 byly vyráběny 130nm. AnandTechu také Lucidlogix naznačil cenu svých čipů: 1,50 USD za PCIe linku, to u 48linkového LT24102 dělá nemalých 72 USD.

Hydra zachycuje a analyzuje všechny snímky, jež by se měly renderovat a s ohledem právě na možná úzká hrdla a mezisnímkové závislosti práci distribuuje mezi připojené GPU. A to v reálném čase, tedy bez navýšení zpoždění (latence). Jak po sobě jsou kroky při práci Hydry, to vidíte na schématu pod dalším odstavcem.

Hydra se nejprve podívá do jakéhosi repozitáře historických dat a konzultuje jej s profilem, následně přejde k analýze aplikace. Další proces v řadě zřejmě říká, co jde a nejde paralelizovat a předává data jednotce starající se o distribuci. Ta obsahuje modul pro dekompozici (rozložení) a distribuci. To už se ke slovo dostávají zapojené GPU (či rovnou grafické karty) a až ty dokončí svou tradiční práci (lépe řečeno už jen přidělenou část práce), přebírá signál zase Hydra a skládá jej.

Veškerá komunikace se děje přes sběrnici PCI Express 2.0 a Hydra tedy nepotřebuje žádné přídavné spojení (můstky) jako SLI či CrossFireX.

Softwarová stránka Hydry, ovladače, podpora her, OS a grafických karet

V minulé kapitole jste už viděli, jak Hydra postupuje. Tedy alespoň rámcově. Do sdílení větších podrobností se Lucidlogix nehrne, zřejmě se o své know-how hodně bojí. Hydra Engine umí pracovat ve třech režimech:

  • A-Mode: spojení grafických karet ATI Radeon
  • N-Mode: spojení grafických karet Nvidia GeForce
  • X-Mode: Radeon + GeForce

První základní deska s Hydra 200 spatřila světlo světa společně s ovladači série 1.3. Lucidlogix si (snad jen zpočátku) předsevzal vydávání větších aktualizací každé čtvrtletí, 1.3 tak odpovídá třetímu kvartálu 2009. Na sklonku Q4/2009 se objevila série 1.4, kterou jsem v sestavení 1.4.109 testoval v půli března 2010 i já. Nejvíce recenzí proběhlo myslím s verzí 1.4.108. Verze .109 měla vylepšit výkon v X-Mode a opravit pár chyb. Zajímavější je ale seznam změn v 1.4.108:

  • nízký výkon X-Mode s highendovými GPU zlepšen o více jak 40 %
  • podporovány tyto (pro ovladače Hydra) nové hry: Call Of Duty Modern Warfare 2, Left 4 Dead 2, Dragon Age: Origins, Race Driver Grid
  • nízký výkon X-Mode a N-Mode v Resident Evil 5 zlepšen

A ještě zajímavější je fakt, že v 1.3 bylo v X-Mode podporováno šest nebo sedm her, kdežto v 1.4 už je to kolem čtyřiceti herní titulů. Mezi hlavními problémy ovladačů, které je třeba vyřešit, řadí výrobce:

  • spouštění benchmarků s FRAPSem může způsobit pád aplikace (i když je Hydra ve stavu vypnutém), platí pro všechny režimy (X-, A-, N-)
  • v X-Mode je silně doporučeno zapojit displej do grafické karty ATI Radeon
  • režim zobrazení v okně není podporován ještě ve všech režimech Hydry
  • je silně doporučeno připojit displej k silnějšímu GPU (grafické kartě)

Hydra oficiálně podporuje 32 i 64bitová Windows 7 a Vista SP2 (nikoli tedy XP) a rozhraní DirectX 9.0c, 10 a 10.1. Podpora DirectX 11 je teprve plánována. Určitá omezení jsou kladena také na verze grafických ovladačů:

  • Nvidia GeForce 185.85, 186.18, 190.38, 190.62, 191.07, 195.62
  • ATI Catalyst 9.7 a novější

Právě u Catalystů je trošku problém v nepřesné dokumentaci. Teprve když projdete všechny dostupné dokumenty k aktuálnímu stavu Hydry, najdete v jednom výčet 9.7, 9.8, 9.9, 9.11 a 9.12. A je to tak. Ačkoli jsem začal testovat s Catalyst 10.2, změřil tak nejprve i CrossFireX, Hydra povětšinou neškálovala anebo hry padaly. Hledal jsem příčinu a teprve návrat ke Catalyst 9.12 zajistil nějaké rozumné chování. Kdybych četl pozorně recenzi kolegů z ComputerBase (do německého textu se mi ale nikdy nehce), zjistili to samé.

Lucidlogix doporučuje uživatelům (a recenzentům):

  • zapínat pokud možno vždy anti-aliasing pro nejlepší nárůsty výkonu s Hydrou
  • používat vysoká rozlišení (1920 × 1200 px a vyšší)
  • náročná herní nastavení (v těchto třech bodech se tedy jedná spíše o zbytečný strach Lucidu, že recenzenti otestují spíše výkon procesoru než grafické karty)
  • pro nestejné grafické karty v A- a N-Mode a pro X-Mode pak:
    • různí výrobci (například MSI a Asus) jsou v pořádku
    • různé velikosti paměti (například 512 MB a 2048 MB) není problém
    • přetaktovaná a nepřetaktovaná grafická karta funguje dohromady
    • poměr sil GPU 1:1,3 či menší je doporučen pro dobrý výkon a škálování

Nejčastějšími chybami je:

  • použití jiného než kvalifikovaného ovladače GeForce či Catalyst
  • použití nekvalifikovaných grafických karet
  • nasazení do her, na které Hydra ještě není připravena (pak čekejte výkon jediného GPU)

Tím se dostáváme k tomu, jaké grafické karty Hydra Engine už podporuje:

  • Nvidia GeForce 9xxx a GT/GTS/GTX 2xx
  • ATI Radeon HD 4xxx a 5xxx

Na podporu GeForce GTX 480 a 470 (GF100) si tedy ještě počkáte (minimálně do dalšího většího balíku ovladačů) a na druhou stranu je trochu divné, že ve výčtu nejsou třeba GeForce 8xxx. Zkusil jsem však GeForce 8800 GT (= 9800 GT, G92) a jak se dalo čekat, N-Mode s nimi pracoval. Problémem by tak mohly být asi jen GeForce 8800 GTS (320, 640 MB), GTX a Ultra s jádrem G80 (neověřil jsem).

Po instalaci ovladačů se vám objeví v systémové liště ikona s logem Lucidlogix (nejdříve druhá zleva, níže zcela vlevo), při aktivaci Hydry (Enable Hydra) se ikonka zvýrazní. Pro A-Mode nezapomeňte v Catalyst Control Center vypnout A-Mode.

Pro zapnutí anti-aliasingu přes ovladače a další funkce používáte stále ovladače Catalyst anebo GeForce, Hydra Control Panel slouží čistě pro ovládání multi-GPU režimů Hydra Engine.

Pro kontrolu fungující Hydry můžete zapnout zobrazení loga ve hrách a benchmarcích. Takto to vypadá v X-Mode:

V druhé záložce jsou všechny aplikace, pro než má Hydra už profily. Je dost komické, že v jedné ze svých prezentací Lucidlogix uvádí jako přednost profile-free, zřejmě se jednalo o produkt nepoučeného markeťáka. Ovladače 1.4 už umožňují přidávat vlastní profily, byť tím zřejmě zcela experimentujete.

Přidávání profilů je vázáno na výběr spustitelného souboru hry a popravdě Lucidlogix moc nepočítá s tím, že byste tuto funkci využili.

Jakmile přidáte profil na stejné EXE, jež už Hydra zná (například xRengine.exe pro Stalker Pripyat i Clear Sky), vyskočí na vás věc dnes už často nevídaná (neošetřená výjimka):

Spouštění některých her s FRAPSem (takřka všech v X-Mode) anebo vynucování Hydry tvorbou profilu pro některé zřejmě značně nepřátelské hry končí pak i obrazovkami modré smrti:

X-Mode si nerozumí opravdu s mnoha hrami a dobrý nápad zatím není ani spouštění her v DirectX 11.

Přehled o tom, které hry jsou podporovány v kterém režimu Hydra Engine s ovladači 1.4.109, si uděláte z následující tabulky (je poslepována z PDF Release Notes). Nejlépe je na tom zatím asi režim A-Mode (dva Radeony), následovaný N-Mode (dvě GeForce). X-Mode už teoreticky pracuje asi na čtyřech desítkách her.

Základní deska MSI Big Bang Fuzion

Základní deska MSI Big Bang Fuzion je podobně jako její sestra Big Bang Trinergy založena na čipové sadě Intel P55 (Ibex Peak) a její patice slouží procesorům v pouzdře LGA 1156. Osadíte do ní tedy procesory s jádry Lynnfield (např. Core i7-870, 860 či i5-750) a Clarkdale (Core i5-6xx, i3-5xx a Pentium G6950).

Jediným rozdílem oproti Trinergy, kterou už před časem recenzoval kolega Radek Bábíček, je právě záměna čipu Nvidia nForce 200 za Lucidlogix Hydra 200. To znamená, že můžete sice spojit dvě grafické karty Nvidia do N-Mode (a navíc grafiku Radeon a GeForce do X-Mode), ale Fuzion neumí SLI. CrossFireX je podporován na Fuzion i Trinergy. Na otázku, proč MSI u Fuzion na rozdíl od jiných desek s Intel P55 nepodporuje SLI, přišla AnandTechu úsměvná odpověď: N-Mode na Hydře je s SLI natolik srovnatelné, že by to bylo zbytečné.

Důležitou informací je to, že MSI na Big Bang Fuzion osadila nejvyšší model z řady Hydra 200, tedy až pěticestný LT24102 (PCIe ×16 na vstupu a až čtyři PCIe ×8 na výstupu). Pro hodnocení rozložení komponent, možností BIOSu, zahřívání anebo přetaktování vás odkáži na zmíněnou recenzi Big Bang Trinergy:

Trinergy

MSI Big Bang Trinergy: Deska bez kompromisů

Pokud hledáte extrémní desku za extrémní cenu pro procesory Intel Core i5/i7, dál již hledat nemusíte. Je zde MSI Big Bang Trinergy, která jako jedna z mála desek obsahuje integrovaný čip NF200 pro zprovoznění 3-Way SLI na této platformě. Vyplatí se ale nad takovou investicí vůbec přemýšlet a co za své peníze vlastně dostanete? Číst dál

 

Nutno podotknout, že přehled o veškerém příslušenství, možnostech BIOSu či podporovaných technologiích vám dá také opravdu skvěle zpracovaný manuál, který najdete na stránce Big Bang Fuzion přímo na webu MSI.

Jelikož jde chladič z Fuzion velmi snadno odšroubovat a MSI nepoužívá ani žádnou pastu nýbrž znovupoužitelné teplovodivé polštářky, rád vám přináším detailní pohled na všechny zajímavé čipy a nadstandardní součástky jako driver mosfety, hi-c caps či solid state chokes.

Testovací sestava, použitý hardware a software

Testovací konfigurace

Hardware

  • monitor: HP LP3065 (30″, 2560 × 1600 px, S-IPS)
  • procesor: Intel Core i5-750 (20× 133 MHz = 2,66 GHz, Turbo Boost zapnut)
  • základní deska: MSi Big Bang Fuzion (Intel P55 + Lucidlogix Hydra 200, BIOS 1.14)
  • paměti: 4× 1 GB Kingston DDR3-1866 (@ 1333 MHz, 8-8-8-24-1T)
  • pevný disk (SSD): OCZ Agility 120GB (Indilinx Barefoot, fw 1.5)
  • zdroj: Corsair CMPSU-650TX
  • chladič CPU: Arctic Cooling Alpine Pro 11 + Noctua NT-H1

Pouze pro testy SLI byla s jinak stejnými dalšími součástmi použita

  • základní deska: Gigabyte GA-P55A-UD4 (Intel P55, BIOS F3)
  • chladič CPU: Noctua NH-U12P

Operační systém, nastavení a ovladače

  • Microsoft Windows 7 Enterprise (64bitová verze)
  • vypnuta automatické defragmentace, aktualizace i swap file na všech jednotkách
  • DirectX redist February 2010
  • Intel INF 9.1.1.1
  • ATI Catalyst 10.2 pro Radeon HD 5770 a CrossFireX
  • ATI Catalyst 9.12 pro A-Mode
  • Nvidia GeForce 195.62 pro GeForce 8800 GT, SLI a N-Mode
  • Lucidlogix Hydra Engine 1.4.109

Grafické karty testujeme na 30″ LCD panelu HP LP3065

Za poskytnutí procesoru Intel Core i5-750 děkujeme společnosti Intel


Core i5-750 v základním nastavení


Turbo Boost +4 v jednojádrové zátěži


Turbo Boost +1 v čtyřjádrové zátěži

Za poskytnutí testovacích pamětí DDR3 děkuji společnosti Kingston

Kingston

Za poskytnutí základní desky GA-P55A-UD4 děkujeme společnosti Gigabyte

Za poskytnutí desítek balení teplovodivé pasty Noctua NT-H1
děkujeme společnosti RASCOM Computerdistribution

Za poskytnutí hry Aliens vs. Predator děkujeme společnosti CD Projekt.

CD Projekt

Testované karty a multi-GPU konfigurace, ovladače Hydra Engine

Celkem bylo potřeba naměřit ve 20 testovacích aplikacích (19 her a jeden benchmark) 7 konfigurací. Pro režim SLI dokonce sáhnout po jiné základní desce s týž čipovou sadou.

Obrázky s Radeonem HD 4770 jsem si udělal jen pro radost, Asus CuCore byl už vrácen
a jeho černé PCB se pro ilustraci X-Mode stejně tolik nehodilo

Radeon HD 5770

Pro naměření výsledků jediného Radeonu HD 5770 jsem použil model Asus CuCore, který se drží referenčních taktů.

Radeon HD 5770 CrossFireX

K Asusu CuCore byl přidán Sapphire Vapor-X. 10 MHz na jádře navíc u Vapor-X nevadí ani CrossFireX, natož Hydra A-Mode. Vše lze navíc rychle srovnat přes OverDrive v CCC.

A-Mode Radeon HD 5770

Stejné dva Radeony byly po vypnutí CrossFireX v ovladačích otestovány také v A-Mode Hydra Engine.

GeForce 8800 GT

GeForce 8800 GT či pro klid duše (Lucidu) 9800 GT byla stará dobrá první referenční G92 z listopadu 2007.

SLI GeForce 8800 GT

Referenční GeForce 8800 GT s 512 MB videopaměti máme dvě, tyto byly spojeny v SLI a pro tento test osazeny do desky Gigabyte P55A-UD4. Windows 7 Enterprise stačilo jen znovu aktivovat a se stejným diskem, instalací OS a dalšími součástmi bylo možné dodat poslední chybějící dílek, který Big Bang Fuzion nepodporuje.

N-Mode GeForce 8800 GT

Obě GeForce 8800 GT bez SLI můstku není problém zprovoznit v Hydra N-Mode.

 

X-Mode Radeon HD 5770 + GeForce GTS 250

Vrcholem zla byla kombinace Radeonu HD 5770 (1 GB, Sapphire Vapor-X) s GeForce GTS 250 (1 GB, Gigabyte OC). Do Radeonu byl zapojen displej, byl jako primární karta a je to také karta z dvojice silnější. Poměr sil se přitom šinou tvejde do poměru 1,3:1, všechny podmínky pro úspěšný běh X-Mode byly tedy splněny.

 

 

Aliens vs. Predator (DX11/9), ArmA II (DX9)

Aliens vs. Predator

Kdybyste potřebovali odemknutou první misi za predátora, můžete si uloženou pozici stáhnout na tomto místě. AvP lze spouštět v DX9 a DX11 režimu (přímo ze Steamu). DX11 režim běží i na DX10 kartách, jen nejsou k dispozici funkce jako teselace nebo multi-sampling. DX11 režim je při stejných detailech jak na Radeonech, tak na GeForce o několik procent (až cca deset) rychlejší než DX9.

Ačkoli jsem věděl, že Hydra Engine není na DirectX 11 ještě připravena, vyzkoušel jsem vynutit její zapnutí pro A-Mode profilem.

Nakonec jsem ale stejně musel vytvořit profil pro AvP_DX9.exe, hra se opravdu v DX11 s Hydrou ani nespustila.

Testovanou sekvencí je předskriptované intro příletu a přistání predátora do džungle (mise Džungle). FRAPS nastavuji na 45 sekund.

DX11 rendering path lze tedy použít i pro DirectX 10 karty, na GeForce GTX 260 a GTS 250 jsem si ověřil, že z toho profitují výkonnostně (samozřejmě lze testovat jen bez teselace, MSAA a vylepšených stínů). Na problémy jsem narazil pouze u SLI, zde mise s predátorem po načtení padá a je nutné použít DX9 rendering path.

Ke grafu je důležité dodat, že výsledky GeForce a Radeonů nejsou srovnatelné. Zatímco Radeony běží v DX11 režimu s 4× MSAA a teselací (viz nastavení pod odstavečkem), GeForce 8800 GT běží bez něj. Vynucený profil pro DX9 AvP pro N-Mode zabral docela hezky a Hydra škáluje podobně jako SLI (AFR).

Za poskytnutí hry Aliens vs. Predator děkujeme společnosti CD Projekt.

CD Projekt

ArmA II

Při testování v velmi náročné hře českého původu jsem využil integrovaného benchmarku. Všechny detaily kromě anti-aliasingu jsem zvolil nanejvyšší hodnotu, dohled nechal na 3600. U ATI bylo vyhlazování nastaveno na normální, u Nvidie na vysoké. Použil jsem demo hry a zabudovaný benchmark (mezi misemi).

Nastavení vyhlazování (ve hře) se totiž liší u ATI (nízké = 2× MSAA, normální = 4× MSAA, vysoké = 8× MSAA) a Nvidie, kde je to vše složitější. Nízké a normální je 2× MSAA, vysoké a velmi vysoké potom 4× MSAA a 8× MSAA odpovídá nastavení 6. Další čísla jsou pak některé z režimů CSAA.

I u ArmA II jsem musel profil vytvořit a v tomto případě to není moc dobrý nápad. Ve hře pak bliká menu a výkon je stejný jako u jediné karty. Tedy s výjimkou X-Mode, kde můj čin navíc zavinil zpomalení.

Batman: Arkham Asylum (DX9) a Colin McRae: DiRT 2 (DX11, DX9)

Batman: Arkham Asylum

Jedna z her na Unreal 3 engine by měla být podporována ve dvou ze tří režimů Hydry. Pokud vás napadá, jestli by snad nějak nešlo využít Hydra X-Mode pro PhysX s Radeonem jakožto primárním GPU, tak odpověď zní ne. Jedinou šanci jsou stále jen triky a mody „Hybrid PhysX“. Ale zpátky k Hydře. Následující screenshot ukazuje nastavení (vypnutý anti-aliasing a HW PhysX):

Bylo zajímavé, že třeba Batman: Arkham Asylum, resp. jeho Steam verze, který měl být mezi jednou ne až tolik her podporujícíh A- i N-Mode, hlásil se zapnutou Hydrou v X-Mode ale i N-Mode problém se SecuROM. Stačilo zvolit Disable Hydra a Batman AA běžel. Samozřejmě na jediném GPU.

Colin McRae: DiRT 2

U DiRT 2 jsem postupoval podobně jako u Aliens vs. Predator a po vytvoření profilu…

…jsem trochu naivně otestoval Radeony HD 5770 v DirectX 11 režimu. S Hydra A-Mode to ale dle očekávání nejde a v DX11 je třeba Hydra Engine vypnout.

Výsledky v grafu nejsou opět srovnatelné mezi GeForce a Radeonem, Radeon HD 5770 měl náročnější úlohu v podobě lepšího postprocessingu a teselace.

Call of Duty 4: Modern Warfare a Call of Duty 5: World at War (DX9)

Call of Duty 4: Modern Warfare

Testoval jsem s téměř všemi detaily na maximu, velikost textur jsem změnil na Extra, anti-aliasing i anizotropní filtrování jsem zapínal přes nabídku hry. Testováno bylo pomocí TPUbench a timedema tpu.

 

Call of Duty 5: World at War

Benchmark probíhá pomocí FRAPSu. Ten nastavte na 35 sekund. V možnostech hry aktivujte konzoli a do ní vepište devmap pel1b. Tím se dostanete na začátek mise Houževnatý (Relentless). Jakmile se tak stane, spusťte FRAPS. Nově už nemusíte pro srovnatelnost výsledků s EHW držet klávesu pro pohyb vpřed, nechte jen doběhnout oněch 35 sekund a nic nedělejte.

Ačkoli to Lucid neuvádí, přece jen i v X-Mode došlo k malému nárůstu výkonu. Škálování v N-Mode a A-Mode je srovnatelné s SLI a CrossFire. Na rozdíl od SLI je ale třeba v menu hry zapínat podporu Dvojice grafických karet (stejně jako u CoD 4).

Crysis (DX10) a Enemy Territory: Quake Wars (OpenGL)

Crysis

Testoval jsem s celkovou úrovní detailů „high“ (ve Warheadu odpovídá nastavení Gamer), multi-sampling zůstal vypnut. Testuji pomocí GPUbenchmark.bat (průlet kolem ostrova), plnou verzí hry s nainstalovanou záplatou 1.2.1.

Kdybych přepínačem -dx9 přidaným za crysis.exe vynutil DirectX 9, zřejmě by Hydra nějak pracovala (alespoň v době prototypu Hydra 100 Lucid právě na Crysis DX9 dělal demonstrace). Implicitně se hra ale pod Windows Vista a 7 spouští v DX10 režimu, takže jsem tak beztak oficiálně nepodporovanou hru nechal (Lucidlogix uvádí jen podporu pro Crysis Warhead a to v N-Mode).

Enemy Territory: Quake Wars

Nové Enemy Territory představuje jedinou současnou moderní OpenGL hru pod Windows a zároveň jediný OpenGL test v testovací sadě. Quake Wars používají značně upravený Doom 3 engine, obohacený především o technologii MegaTexture (více o technologii v článku na Beyond3D). Pro testy používám maximální detaily, přes konzoli vypínám limit 30 (com_unlockFPS 1) i 60 fps (com_unlock_maxFPS 0, je vhodné nastavit do autoexec.cfg), AA i AF zapínám ve hře. První spuštění timedema používám opět jako cacheovací, odečítám výsledek až z druhého.

Pro účely testování jsem si nahrál vlastní timedemo (recordtimenetdemo), které měří výkon v rozsáhlé lokaci se stromy (Valley). Timedemo (pro verzi 2.0) ke stažení: zde.

Nejdříve jsem si myslel, že Hydra ve skutečnosti žádnou OpenGL aplikaci neumí, nakonec jsem ale ve výčtu našel hru Wolfenstein (2009), která by měla používat dokonce stejný id tech 4 engine jako Enemy Territory: Quake Wats. Hydra Engine ale nemá profil a jeho umělé vytvoření v tomto případě nezabírá.

F.E.A.R. (DX9) a Far Cry 2 (DX10.1)

F.E.A.R.

Engine hry F.E.A.R. se díky datadisku stal znovu aktuálním a ukazuje se, že se jedná stále o dobrý test grafik: procesor hraje jen velmi malou roli. Všechny detaily mám nastaveny na maximální hodnoty a všechny obraz vylepšující funkce včetně měkkých stínů zapnuty. Testuji zabudovaným benchmarkem.

   

Ačkoli Hydra podporuje F.E.A.R. 2 (N-Mode a A-Mode), profil pro první F.E.A.R. jsem musel vytvořit.

Bohužel však zbytečně. V A-Mode hra padá, v N-Mode padá až benchmark, s FRAPSem se pak ani pořádně nespustí.

Far Cry 2

Pro testy jsem používal zabudovaný benchmark, test Ranch Medium. Výsledky v grafech jsou z plynulejšího ze dvou opakování. Používám režim DirectX 10 a maximální detaily. Anti-aliasing zapínám přes nabídku hry.

Více v článku Far Cry 2: výkon grafických karet a vliv nastavení.

Ačkoli jsem musel profil pro Far Cry 2 vytvořit (Hydra má podporu pouze pro starý Far Cry, tedy s enginem CryEngine a nikoli Dunia), výsledek snažení byl velice dobrý. Tedy alespoň, co se škálování výkonu týče. Obraz byl v A-Mode a N-Mode také v pořádku, pouze v X-Mode se vyskytovalo blikání.

Left 4 Dead (DX9) a Serious Sam 2 (DX9)

Left 4 Dead

Pro účely testování v Left 4 Dead jsem si vytvořil vlastní timedemo v pěkné a hlavně především na výkonu grafiky závislé lokaci s lesem.

V Left 4 Dead má fungovat jen v N-Mode, ale s A-Mode také nebyl problém a škálování výkonu bylo ještě lepší než u dvou GeForce. Pokus o spuštění v X-Mode s Hydra Enabled dopadl hlášením „failed to create d3d device“.

Serious Sam 2

Starší DirectX 9 hra je s maximálními detaily, HDR a ve vyšším rozlišením stále dobrým testem grafických karet. Croteam enginy umí, i v Serious Sam 2 použil několik zajímavých technologií (třeba jako jeden z prvních využil kompresi ATI 3Dc). Pomocí zabudovaného benchmarku, který můžete ovládat skriptem, měřím výkon v demu Branchester.

Testovací skripty ke stažení: zde.

Starší Serious Sam 2 mezi podporovanými hrami není, a tak jsem musel vytvořir profil. To pomohlo A-Mode, N-Mode a X-Mode je lepší nechat neaktivní.

S.T.A.L.K.E.R.: Call of Pripyat (DX11/DX10) a Shadow of Chernobyl (DX9)

S.T.A.L.K.E.R.: Call of Pripyat

Pro testování této moderními technologiemi nabité hry používám samostatný benchmark. V něm pak celkové nastavení Ultra, Enhan. full dynamic lighting (DX10). Je-li DirectX10.1 podporován, je zatržen i v Advanced Options.

Ačkoli S.T.A.L.K.E.R. Clear Sky v A-Mode podporován je, Pripyat už nikoli

S.T.A.L.K.E.R.: Shadow of Chernobyl

Engine Stalkeru, X-Ray engine, je zajímavý mimojiné tím, že používá deferred shading umožňující velké množství dynamickýh zdrojů světla. Ve hře se setkáte s normálovým a paralaxním mapováním, měkkými stíny, FP HDR, dynamickými efekty počasí a mnoha postprocessingovými efekty.

Soubor s nastavením ke stažení: zde.

Ani vytvoření profilu v prvním Stalkerovi Hydře nepomůže. SLI i CrossFireX přitom škálují příkladně.

The Elder Scrolls IV: Oblivion (DX9), Tom Clancy’s H.A.W.X. (DX10.1)

The Elder Scrolls IV: Oblivion

Čtvrtý díl série Elder Scrolls patří i přes svůj věk stále mezi nejnáročnější hry vůbec. Zvlášť, když stejně jako já v testu, vyberete lokace s množstvím vlnící se trávy, pohupujících se stromů a přesto rozhledem do vzdálené krajiny (The West Weald). Testuji s maximálními detaily a HDR. Soubor s nastavením (vše na maximum) a uložená testovací pozice ke stažení: zde.

Anti-aliasing i anizotropní filtrování vynuťte v ovladačích, v souboru Oblivion.ini se přesvědčte, že máte vypnutou vertikální synchronizaci (iPresentInterval=0). Po spuštění hry si nahrajte mou uloženou pozici číslo 260 a po načtení ihned začnětě logování FRAPSem a pohyb vpřed. Držte stále klávesu pro pohyb vpřed, dokud se neobjeví nápis upozorňující na to, že dále už nemůžete. Když nastavíte automatické vypnutí FRAPSu po 35 vteřinách, nic taky nezkazíte.

Oblivion je oficiálně podporován jen v N-Mode, ale i A-Mode funguje (stejně špatně) jako CrossFireX. X-Mode je pomalejší než jediná karta.

Tom Clancy’s H.A.W.X.

V arkádovém simulátoru bojových letadel lze využít nejen DirectX 10 pro efekty jako SSAO či volumetrické paprsky, ale také DirectX 10.1. Tuto revizi lze použít jak pro zrychlení hry na kartách, které ji podporují (což činím), nebo pro zlepšení obrazu nastavením SSAO na very high (což kvůli porovnatelnosti výsledků s kartami bez podpory DirectX 10.1 nečiním).

V nabídce s grafikými nastaveními je i tlačítko spouštějící zabudovaný benchmark, což v praxi znamená oblet města.

Tom Clancy’s H.A.W.X. má být v DX10 režimu podporován jako v A-Mode, tak N-Mode a dokonce i v X-Mode. Bohužel, škálování v A- a N-Mode je poněkud slabší a v X-Mode hra s FRAPSem padá hned po spuštění, bez FRAPSu jen o chvíli později. Je nutno Hydru vypnout.

Trackmania Nations Forever (DX9), Unreal Tournament 3 (DX9)

Trackmania Nations Forever

Trackmaniu hraje nejen ve světě, ale i v ČR obrovský počet hráčů, hra má navíc zabudovanou možnost benchmarku. Škoda jen zatím nevysvětlitelného chování, kdy ve vyšším rozlišení (dokud nezapnete anti-aliasing) obdržíte vyšší výsledek. Jinak hra na plné detaily zatíží jakoukoli dnešní grafiku a není velkým přítelem Multi-GPU.

Trackmania se nikdy nelíbila CrossFireX, snad poprvé s 10.2 se mi povedlo dosáhnout nárůstu výkonu bez přejmenovávání spouštěcího EXE. V případě 8800 GT není škálování dobré ani s SLI, je zajímavé, že s GTX 260 SLI si pamatuji nárůsty lepší. Je to ale jedno, neboť v TMNF se vytáhla právě Hydra. Kdyby to ve více hrách vypadalo podobně, budou lidé po Hydře asi šílet. Škoda ještě toho X-Mode.

Unreal Tournament 3

Unreal Tournament 3 je příkladem skvěle optimalizovaného enginu, skvěle vypadá a přitom je velmi svižný i na běžném hardwaru. Před testováním musíte v UTEngine.ini vypnout vyhlazování snímkové frekvence (implicitně nastaveno na interval 22 až 62 fps) a to tak, že najdete bSmoothFrameRate=True a nastavíte na False (předtím odstraňte u souboru atribut Jen pro čtení). Pro grafické karty je lepší flyby, pro realističtější výsledky pak botmatch, testoval jsem pomocí flyby a vybral jsem pro změnu mapu Shangri-La. Nastavení hry ke stažení: zde.

Unreal Tournament 3 příjemně překvapil škálováním dokonce u v X-Mode. Nárůsty s přidanou GTS 250 nejsou velké, ale jsou, SLI a CrossFire jsou účinnější bez AA, po vynucení AA nejenže nestačí asi paměť GeForce 8800 GT, ale také výkon Hydry začíná být lepší než u CF a SLI.

World in Conflict (DX10), 3DMark Vantage (DX10) a spotřeba

World in Conflict

Testuji s upraveným profilem very high details (zapnul jsem i water reflects clouds (voda odráží oblaka), anizotropní filtrování navýšil na 16×). Používám vestavěný benchmark.

World in Conflict je hrou podporovanou ve všech režimech Hydry a náš test to potvrzuje. Škálování je slabší jen v A-Mode a Lucidlogix dokonce upozorňuje, že hra v A-Mode pod DX9 padá. Naštěstí je testováno v DX10.

3DMark Vantage

Vantage

Zájemci o v 3DMarku Vantage použité technologie jejich popis najdou v tomto whitepaperu (PDF). V grafech najdete pouze výsledky z GPU testu.

3DMark Vantage měl být podporován i v X-Mode, no, realita je trochu jiná. Alespoň testovaný mix nárůst výkonu nepřinesl. Škálování A-Mode je stejné jako u CrossFireX, N-Mode je dokonce o něco lepší než SLI.

Podívejme se pomocí screenshotů na srovnání single karty, CrossFireX, A-Mode a X-Mode v dílčích testech, fill rate a dalších. Hydra A-Mode nefunguje v posledním feature testu (Perlin Noise = Math-heavy Pixel Shader), X-Mode na jednom z Feature testů padá.

Radeon HD 5770, Extreme:

CrossFire 2× Radeon HD 5770, Extreme:

Hydra A-Mode 2× Radeon HD 5770, Extreme:

Hydra X-Mode Radeon HD 5770 + GeForce GTS 250, Extreme:

Nastavení shrnuje tato tabulka přímo od Futuremarku:

Spotřeba

Spotřeba v idle dokazuje, že se Hydra nijak nestaví do cesty úsporným mechanismům ovladačů a třeba Radeony HD 5770 se nedále ve 2D pěkně přepínají na takty 157/300 MHz a snižují napětí.

Graf spotřeby v Crysis sem dávám jen proto, abych vám ukázal, jak u multi-GPU spotřeba koreluje s efektivitou (a tedy škálováním výkonu). Vytahuji tedy znovu i sem také graf výkonu řešení v Crysis:

Škálování výkonu SLI, CrossFireX a Hydry v přehledových tabulkách

Následující tabulky by vám měly umožnit rychle srovnat škálování multi-GPU řešení Nvidia, ATI/AMD a Lucidlogix ve 20 použitých testech. Poslední sloupec je přírůstkem výkonu po přidání druhé karty, pokud vynucený profil u Hydry nepřinášel výkon (či naopak znamenal pokles fps), započítal jsem výkon jediného (single) GPU.

Budoucnost Hydry, shrnutí, verdikt

Shrnutí výkonu

První český test, nebo přesněji možná první opravdový český test anebo ještě přesněji první test, v němž byly odlepeny z MSI Big Bang Fuzion ochranné igelitky z pasivů, rozbalen proprietární kabel k OC Dashboard a hlavně použity ovladače, s nimiž Hydra Engine 1.4 skutečně funguje, máte skoro za sebou. Ještě během velikonočních svátků přidám jednu kapitolku s tabulkami přehledně shrnujícími škálování A-Mode, N-Mode, X-Mode, ale i SLI nebo CrossFireX, zatím se pusťme po hromadě čísel v grafech do slovního hodnocení.

Nebudu se nějak zvlášť zastavovat u her, u kterých běžela Hydra tak nějak dle předpokladů nebo si prostě s SLI či CrossFireX příliš nezadala. Snad jedinou opravdu vzornou a poslušnou byla World in Conflict, přátelsky se k Hydře chovala také Call of Duty: World at War. Sice jsem na rozdíl od ComputerBase nedosáhl s druhou kartou skrze Hydru výrazně více než 100% přírůstku výkonu, ale přesto si tyto světlé okamžiky Hydry a věřme, že také přísliby do budoucna, připomeňme. První dvě kapitoly článku by vám pak měly vnést trochu světla na to, proč by teoreticky s Hydrou opravdu mohlo být dosaženo třeba oněch 228 % výkonu jediné karty.

Ačkoli Trackmania Forever je jednou z většiny her, kde X-Mode, tedy režim spojení Radeonu s GeForce, nefunguje, přesto tento herní titul vzpomenu v závěru znovu také. Důvodem je jisté potvrzení slov Lucidu o tom, že Hydra by mohla řešit úzká hrdla tam, kde je SLI a CrossFireX se svými AFR/SFR režimi neřeší a fungovat tam, kde tyto nemohou.

Teď ale zase obraťme minci a trošku Hydře vyčiňme. Slabé škálování předvedla bájná příšera 200 v Call of Duty 4 (A-Mode, ale i N-Mode pomalejší než SLI, X-Mode oproti předpokladu nepracoval vůbec). Tom Clancy’s H.A.W.X. se stal úplným zklamáním (slabé škálování A- i N-Mode, nefunkčnost X-Mode), v 3DMark Vantage deklarovaný X-Mode nefungoval také.

Tvorba vlastních profilů je zatím něčím, co Hydra oficiálně nepodporuje, přesto jsem to zkusil. Vytvořený profil zabral pro Aliens vs. Predator (DX9, N-Mode), Colin McRae DiRT 2 (DX9, N-Mode), Far Cry 2 a Serious Sam 2 (A-Mode). Ve Far Cry 2 potom velice hezky pro A-Mode i N-Mode. Dokonce v X-Mode došlo ke škálování výkonu, jen blikání obrazu dojem kazilo. Skoro bych řekl, že Lucid zapomněl profil do ovladačů jen přidat, podporu má skoro vyřešenou.

Vytvoření profilu naopak nepomohlo hrám ArmA II, F.E.A.R. a S.T.A.L.K.E.R.: Shadow of Chernobyl. Potvrdil se také uváděný problém s FRAPSem, pády byly nejčastější hlavně v X-Mode.

Budoucnost Hydry

Je možné, že kdybych test dělal za měsíc či dva (u Lucidlogix zatím pořád ještě nevíte, s termíny jsou na tom Izraelci snad ještě hůře než já a to do mě nikdo miliony dolarů neleje), bude hodnocení Hydry výrazně jiné. Každým dnem by snad totiž měl vyjít další milník v ovladačích. Čvrtletí je pryč, a tak se chystá 1.5.

Jelikož jsem se dostal k informacím z tajné roadmapy Lucidlogix Hydra (svůj zdroj ale hodlám chránit), vím, že 1.5 má přinést podporu zapojení tří GPU, DirectX 11 a 100 her pro všechny tři režimy (100 her pro A/N-Mode bylo dosaženo už někdy v lednu s 1.4.107). To nezní vůbec špatně, jen aby se to opravdu povedlo a ideálně bez odkladů. O podpoře GF100 přeci jen stručnější roadmapa mlčí.

V dubnu by mělo také dojít k demonstraci Eyefinity ve spojení s multi-GPU Hydra (tedy zřejmě A-Mode), někdy v první půli léta potom k demonstraci zapojení čtyř GPU. Oficiálně (vlastně tajně) se quad GPU do ovladačů má dostat až v srpnu, září či říjnu, kdy bude vydána verze 2.1. Předtím asi někdy o prázdninách vyjde 2.0, u níž je štítek: celkové optimalizace výkonu.

Tak tedy uvidíme, o přílivu peněz do Lucidlogix jsme vás už informovali několikrát, třeba to nakonec této firmičce vyjde. Musí se ale dostat do stavu, kdy bude zařazovat podporu nových karet, ovladačů, her či API krátce po jejich vydání a ideální (byť možná sci-fi) by bylo, kdyby se Hydra dokázala sama učit a přidání profilu pro doposud neznámou hru by mohlo vést k nárůstům výkonu.

Verdikt

Své výsledné hodnocení jsem se pokusil shrnout rozsáhlým systémem plusů a minusů, vysvětlení a malé zastavení si zaslouží ještě trochu upozaděná základní deska MSI Big Bang Fuzion.

Tu jsem také jako celek nijak zvlášť neprověřoval, to už totiž udělal Radek na dvojčeti Fuzion, Big Bang Trinergy. Takřka vše dobré (možnosti taktování, rozložení, driver mosfety s aktivním spínáním fází, hi-c caps a kvalitní cívky, kvalitní zvukovka atd.) i špatné (hlavně cena a chybějící USB 3.0, byť klidně přidanou kartou) z Trinergy má i Fuzion, rozdíl je v nForce 200 vs. Hydra 200.

MSI zaslouží pochvalu za odvahu a průkopnickou snahu, Big Bang Fuzion je první vlaštovkou. Asus, Gigabyte a další jakoby čekali, jak Fuzion a Hydra dopadnou v recenzích a zatím zůstávají stranou. Je to ale nejen odvaha, nýbrž také trochu drzost. Přeci jen Fuzion stojí přes 8000 Kč a to je nejen na desku s Intel P55 a mainstreamovou platformu LGA 1156 hodně.

Za takové peníze čeká uživatel asi všechno top, ale Hydra 200 je přeci jen ve stádiu, kdy s nepodporovanou hrou i při zapojení dvou GeForce (N-Mode) setkáváte více než často. Mnoho kritických chyb se plánuje teprve napravit a nevím, jestli si nebudou někteří majitelé připadat jako pokusní králíci. Na druhou stranu, s Hydrou určitě nebude nuda a techničtí nadšenci si přijdou (s každou novou verzí ovladačů) na své.

Lucidlogix Hydra 200

+ obecně správný přístup k multi-GPU
+
může pomoci tam, kde se CrossFire a SLI příliš nechytají
+ univerzální (pro GeForce i Radeony, bez propojky)

+ i v případě 48 PCIe 2.0 linek (LT24102) nízká spotřeba
– zpoždění za nejnovějšími ovladači i kartami
– DirectX 11 či čtyři GPU teprve plánovány
– zatím jen na jediné desce (s vysokou cenou) a tedy nikoli pro masy
– rozhraní k profilům není dopilované
– počet podporovaných her má ještě daleko k označení dostatečný
– málo podporovaných her v X-Mode a deklarovaná podpora také neznamená ještě výkon
– pomalá adaptace novinek není dobrým souputníkem pro klíčový čip na drahé základní desce a ani pro multi-GPU obecně (používá se přece jen nejčastěji tam, kde nemůže stačit výkon jedné karty)

MSI Big Bang Fuzion

+ skvělé taktování
+ OC Genie
+ bohaté příslušenství a výbava
+ rozložení a zpracování
+ možnosti BIOSu
+ systémová tlačítka
+ měřící body napětí
+ podporuje Hydra N-Mode, A-Mode, X-Mode a CrossFireX

+ odvaha (první sériová deska s Hydrou)
– chybí podpora USB 3.0 a SATA 6 Gb/s
– zvukovku je nutné osadit do prvního slotu
– málo 4pinových konektorů pro větráky
– připojení OC Dashboard k základní desce
vysoká

cena
– nepodporuje SLI (jen N-Mode)
– drzost (Hydra 200 ještě není doladěným produktem
)

Za zapůjčení základní desky Big Bang Fuzion děkujeme společnosti MSI

Použitá literatura:

První test Lucidlogix Hydra v ČR: multi-GPU pro masy

Ohodnoťte tento článek!