Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)

0

PhysX

Na konec jsme si nechali aspekty GeForce GTX 480, v nichž by měla podle všeho vynikat úplně nejvíce. Dlouho dopředu nám Nvidia z Fermi ukázala právě její GPGPU část, přeměnu v cache architekturu a výhody v podobě rychlého přepínání kontextu atd. To všechno by se mělo projevit i na výkonnosti s GPU PhysX, neboť právě pro grafické čipy přepsaná PhysX je jednou z GPGPU aplikací.

Než se pustíte to praktických tesů, určitě byste se měli vrátit alespoň k popisu GPGPU architektury GF100:

Z grafik se stávají procesory: GPGPU část architektury GF100

Přečtěte si také

Možná si ještě vzpomenete na graf, kterým v loni v srpnu Nvidia lákala na fantastický výkon Fermi s PhysX:

Jednalo se zřejmě o ideální případ (a Fermi s 512 stream procesory), ale pokud vezmeme ještě v úvahu fakt, že u Fermi má být výrazně rychlejší přepínání kontextů, očekávali jsme od her, kde dosud bylo optimem mít silnou grafickou kartu pro grafiku a GeForce typicky alespoň 9600 GT pro fyziku, výrazné zlepšení situace a snad i násobný výkon. Anebo jinými slovy minimální propady oproti výkonu bez efektů PhysX.

První hrou, kterou jsem pro test GPU PhysX zvolil, je Mirror’s Edge. Dnešní nejrychlejší karty zde i ve 2560 × 1600 px s 4× MSAA bez vylepšené PhysX dosahují průměrně klidně kolem 140 fps, naopak ani procesor Core i7-920 na 4 GHz nedokáže Enhanced PhysX v této hře počítat dost rychle na to, aby třeba efekt tříštění skla byl plynulý.

Všimněte si, že GeForce GTX 480 s vypnutou akcelerací PhysX běží o něco rychleji než s ní (samozřejmě jen dokud nedojde na první efekt využívající rozšířenou a tedy náročnou PhysX), GTX 480 v této hře není výrazně rychlejší než dvoučipová GTX 295 (SLI zapnuto).

Batman: Arkham Asylum je vůbec nejlépe hodnocenou hrou s GeForce PhysX (metascore 91) a současně také předmětem sporu Nvidie a ATI/AMD. Hra patří do programu TWIMTBP a kromě pokročilé PhysX umožní GeForce hráčům podporu anti-aliasingu přímo ve hře, kdežto s Radeony je třeba vynucovat skrze CCC a to je samozřejmě pomalejší. O kauze jsme toho na EHW napsali hodně, nyní se raději podívejme na srovnání GeForce mezi sebou a i u nejrychlejší karet Radeon HD 5000 konstatujme, že Advanced PhysX bude třeba nechat vypnutou.

Jelikož 94sekundový benchmark neměří stále jen v lokacích s náročnou PhysX, ilustruje vše lépe graf průběhu. Místo s proudy páry v grafu určitě poznáte.

Jakási „Advanced PhysX“ je i v Metro 2033, jestli jsou díky ní všude možně poletující particles počítány realističtěji anebo jich je více, to netuším. Rozdíl ve výkonu je i při počítání na procesoru minimální, zřejmě by to chtělo jinou lokaci než tunel v chase03 (speciálně jsem se na to v Nvidii ptal a pro test byl doporučen stejný level). V Metro 2033 určitě ale platí, že s GeForce nemáte žádnou výraznější výhodu.

Raging Rapids Ride je jedno z dem vytvořených přímo pro ukázku schopností Fermi. Využívá simulaci kapalin a šatů (branky) a jestliže na screenshotu vypadá nevábně, pak v pohybu je tomu naopak.

Testovací konfigurace

  • monitor: HP LP3065 (30″, 2560 × 1600 px, S-IPS)
  • procesor: Intel Core i7-920 (20× 200 MHz = 4,00 GHz, Turbo Boost a HyperThreading vypnuty)
  • základní deska: Gigabyte GA-X58A-UD5 (Intel X58, ICH10R, BIOS F3)
  • paměti: 6 GB Kingston DDR3-1866 (1200 MHz, 7-7-7-20-2T, 1,66 V)
  • pevný disk: Western Digital VelociRaptor VR150 (WD3000GLFS)
  • optická mechanika: Lite-On DH-4O1S (Blu-ray, DVD-ROM)
  • zdroj: Gigabyte Odin GT 800W (GE-S800A-D1)
  • skříň: Cooler Master Centurion 534
  • chladič CPU: Scythe Mugen 2 (1300 rpm) + Noctua NT-H1
  • systémové větráky: Arctic Fan12 PWM + Cooler Master 12 cm @ 1000 rpm

  • Microsoft Windows 7 Ultimate (64bitová verze)
  • vypnuta automatické defragmentace, aktualizace i swap file na všech jednotkách
  • DirectX redist February 2010
  • Intel INF 9.1.1.1
  • ATI Catalyst 10.3 WHQL pro Radeon HD 5870/5970
  • Nvidia GeForce 197.25 pro GeForce GTX 285/295 (197.45 WHQL pro GPGPU)
  • Nvidia GeForce 197.17 a 197.41 WHQL pro GeForce GTX 480/470

GPGPU, Compute Shader, OpenCL

SiSoft Sandra je asi jediným z low-level benchmarků umožňující porovnat GPGPU sílu Radeonů i GeForce. A to jak při použití DirectCompute Compute Shader, tak při nasazení „nativních“ CUDA (GeForce) a Stream (Radeon). Srovnání je možné i pro OpenCL, ale neměl jsem čas instalovat pro Radeony jiný ovladač s podporou tohoto rozhraní (podpora OpenCL není součástí standardních Catalystů). Pro tuto část je důležité si připomenout, že hlavní zbraň Fermi, vysoký výkon v double precision, je u primárně herních GeForce GTX 480 a 470 značně okleštěn (konkrétně na 1/4, max. tedy 64 FMA/takt). Stejně tak GeForce na rozdíl od Tesly postrádá podporu ECC.

 

ComputeMark je novým benchmarkem pro D3D11 DirectCompute a stojí za ním Belgičan a Čech. Jan Vlietinck je autorem jádra, benchmark pak vytvořil Robert Varga. Verze 1.2 ještě neobsahuje optimalizace kódu pro GF100 a autor nám sdělil, že po nich je výkon GTX 480 přibližně třikrát vyšší. Poté bude následovat optimalizace pro Radeony HD 5000. Benchmark tedy ještě prodělává bouřlivý vývoj. Za předpokladu, že už současný kód Radeonu HD 5870 dost sedí a současně, že by se GeForce GTX 400 třikrát zlepšily, by poměr sil byl zhruba podobný jako v Sandře CS Float anebo CHS či NBody Gravity testech z DX11 SDK.

Několik testů D3D11 DirectCompute jsem vám ukázal už v minulém článku:

Dema Nvidie využívají také DirectCompute, určujícím faktorem je ale výkon teselace:

CUDA (i ve hře Just Cause 2) a GPU raytracing

Než jsem vydal GPGPU část recenze GTX 480, vyšel sice vReveal 2.0, to ale asi nijak v zásadě nevadí. I SD rozlišení dá zabrat nejen procesoru ale i silné grafické kartě. vRevealu jsem podstrčil místy pěkně zašuměné video z Canon PowerShot S5 IS (a je pravda, že tento zázračný prográmek dělá s kvalitou divy, koneckonců zkuste si demo).

Od Cyberlink PowerDirector 8 jsem si sliboval srovnání GPGPU schopností GeForce a Radeonu, použitá verze mi ale neumožnila při uložení (a tedy konverzi) do H.264/AVC zatrhnout na Radeonu HD 5870 zpracování přes GPU. Přináším tedy alespoň srovnání s procesorem. Dle skoro stejného výsledku GTX 285 a 480 se dá usuzovat na nějaký limit (pevný disk, nebo snad stejná maximální propustnost GPGPU při práci s daty, jak naznačila Sandra?).

Badaboom od Elemental Tech. byl první aplikací CUDA pro „běžné lidi“. Zpočátku to byl trochu hloupoučký program, který oslovoval asi hlavně majitele iPhone, nyní už jej můžete použít jako rychlý (a přitom kvalitní) převodník pro jakékoli cílové zařízení (parametry lze již volit).

Škoda, že Folding@Home neumožňuje počítání stejných dat na GPU GeForce a Radeon (nebo o tom alespoň nevím), je to totiž, zdá se, pěkný GPGPU benchmark. Zejména výpočty spectrin dávají kartám zabrat a dá se při nich dosáhnout také dost vysokého hluku.

Jeden z nejkrásnějších testů jsem si nechal takřka úplně nakonec. Design Garage je prvním volně stažitelným demem realtime GPU raytracingu. Sice ještě nejsme v době, kdy by bylo možné mít plynulý raytracing ve full HD, ale i jedna GeForce GTX 480 umí rychlejší formu v 1024 × 768 px zhruba při 11 fps. Po zapnutí HQ (Photorealism) výkon rapidně poklesne a o vykreslování v reálném čase se už nedá moc hovořit.

Zkusil jsem ještě jinou scénu s podle mě lépe viditelnými odrazy na laku a skle auta. Ta probíhá na GTX 480 průměrně s 13 fps (testoval jsem pomocí cyklických změn pohledů – klávesa F2). Design Garage je k dispozici ke stažení v sekci Cool Stuff na nvidia.com.

CUDA (nikoli PhysX) našla své využití i v jedné hře. Just Cause 2 vypadá skvěle i bez CUDA, ale konkrétně vodní simulace je velmi pěkné efekt, který vodu ve hře povýší někam na úroveň dema Island11 od Nvidie. Bokeh filtr sice opravdu dělá části scény mimo hloubku ostrosti hezčími, ale určitě se bez něj obejdete (na druhou stranu GeForce GTX 480 moc nepozná, že jej má počítat také). Schválně proklikněte na ilustrační video nad odstavcem a podívejte si i na nějaká nabídnutá související videa. V diskuzi pod vloženým videem si všimněte, že autor jej pořídil na konfiguraci Radeon HD 4850 pro grafiku a GeForce 9800 GT pro CUDA. Máme tu tedy nejen Hybrid PhysX, ale i Hybrid CUDA.

Kromě 3D Vision, kterou jsem nestihl na GTX 480 vyzkoušet jsem vás snad seznámil se všemi možnými aspekty nové vlajkové lodi Nvidie a je jen na vás, jestli její přednosti považujete za tak zřetelné, že se rozhodnete porvat se s nehezkými provozními vlastnostmi a smířit s vysokou spotřebou. Tedy ono to není tak úplně na vás, protože konkrétně GeForce GTX 480 je trochu nedostatkovým zbožím. Ptáte-li se na recenzi dostupnější GeForce GTX 470, tak ta určitě nebude zítra (úterý 27. 4. totiž patří šestijádrovým procesorů AMD Thuban), ale do konce týdne to už snad klapne.