Test historických grafických karet: díl 1. (od Voodoo2 po GeForce, 1998–1999)

0


 

První grafické karty schopné 3D akcelerace se začaly objevovat někdy v roce 1995. Většina z nich nenabízela proti softwarovému vykreslování příliš mnoho výkonu navíc a ani kvalita obrazu nestála za moc.

Revoluce nastala až o rok později s příchodem 3Dfx Voodoo Graphics. Konkurence samozřejmě nespala a zanedlouho se na trhu objevilo spousta nejrůznějších 3D grafických karet. Narozdíl od Voodoo se jednalo o kompletní řešení obsahující i 2D jádro. To sice bylo elegantnější, ale výkon většiny z nich ani zdaleka nedosahoval úrovně Voodoo Graphics. Jen Nvidia s Rivou 128 dokázala Voodoo překonat – ovšem za cenu podstatně slabší kvality obrazu a s ročním zpožděním.

Nepřehlédněte:
20 let vývoje grafických karet: od CGA až po konec 3Dfx (díl III.)

Tento test začíná až u druhé generace 3D akcelerátorů, protože teprve ta disponuje dostatečným výkonem pro plynulé hraní starých klasik. Zároveň také hry z této doby – jako například Quake či Unreal Tournament – mají vestavěná timedema, takže se dají snadno použít pro benchmarkování.

Testování starších grafik s odstupem času přináší proti klasickým recenzím (z doby vydání HW) spoustu výhod. Použití silného procesoru a vyladěných ovladačů ukáže pravý potenciál různých grafik. Zajímavé je rovněž vyzkoušet, jak běží novější hry. Tím pak dokázat, jestli architektura konkrétního GPU byla opravdu tak nadčasová, jak se tvrdilo při uvedení.

Parametry grafických karet

  Voodoo2
8 MB
Voodoo2
12 MB
Voodoo2
12 MB AGP
Voodoo2
12 MB SLI
Banshee PCI
Jádro SSTV2 SSTV2 SSTV2 2x SSTV2 Banshee
Výrobní proces 350 nm 350 nm 350 nm 350 nm 350 nm
Velikost jádra
Tranzistorů 4 mil. 4 mil. 4 mil. 8 mil. 4 mil.
Takt jádra 90 MHz 90 MHz 90 MHz 90 MHz 100 MHz
ROP/RBE 1 1 1 2 1
Texturovacích jedn. 2 2 2 4 1
Paměť 8 MB EDO 12 MB EDO 12 MB EDO 24 MB EDO 16 MB SDRAM
Takt pamětí 90 MHz 90 MHz 90 MHz 90 MHz 100 MHz
Šířka sběrnice 192 bit 192 bit 192 bit 384 bit 128 bit
Propustnost pamětí 2,16 GB/s 2,16 GB/s 2,16 GB/s 4,32 GB/s 1,6 GB/s
Fillrate (pixely) 90 MP/s 90 MP/s 90 MP/s 180 MP/s 100 MP/s
Fillrate (textury) 180 MT/s 180 MT/s 180 MT/s 360 MT/s 100 MT/s
Sběrnice PCI PCI AGP 1x PCI PCI
TDP (odhad) 15 W 15 W 15 W 30 W 12 W
DirectX 6 6 6 6 6
OpenGL 1.1 1.1 1.1 1.1 1.1
  Banshee AGP Velocity 100 Velocity 200 Voodoo3 2000 PCI Voodoo3 2000 AGP
Jádro Banshee Avenger Avenger Avenger Avenger
Výrobní proces 350 nm 250 nm 250 nm 250 nm 250 nm
Velikost jádra
Tranzistorů 4 mil. 8,2 mil. 8,2 mil. 8,2 mil. 8,2 mil.
Takt jádra 100 MHz 143 MHz 125 MHz 143 MHz 143 MHz
ROP/RBE 1 1 1 1 1
Texturovacích jedn. 1 1 (2) 2 2 2
Paměť 16 MB SGRAM 8 MB SGRAM 16 MB SGRAM 16 MB SGRAM 16 MB SDRAM
Takt pamětí 100 MHz 143 MHz 125 MHz 143 MHz 143 MHz
Šířka sběrnice 128 bit 128 bit 128 bit 128 bit 128 bit
Propustnost pamětí 1,6 GB/s 2,28 GB/s 2 GB/s 2,28 GB/s 2,28 GB/s
Fillrate (pixely) 100 MP/s 143 MP/s 125 MP/s 143 MP/s 143 MP/s
Fillrate (textury) 100 MT/s 143 (286) MT/s 250 MT/s 286 MT/s 286 MT/s
Sběrnice AGP 1x AGP 2x AGP 2x PCI AGP 2x
TDP (odhad) 12 W 10 W 9 W 10 W 10 W
DirectX 6 6 6 6 6
OpenGL 1.1 1.1 1.1 1.1 1.1
  Voodoo3 3500 Voodoo3 3500 SE Riva TNT Riva TNT2 m64 Riva TNT2
Jádro Avenger Avenger NV4 NV5 NV5
Výrobní proces 250 nm 250 nm 350 nm 250 nm 250 nm
Velikost jádra 130 mm^2 90 mm^2 90 mm^2
Tranzistorů 8,2 mil. 8,2 mil. 7 mil. 15 mil. 15 mil.
Takt jádra 183 MHz 200 MHz 90 MHz 120 MHz 125 MHz
ROP/RBE 1 1 2 2 2
Texturovacích jedn. 2 2 2 2 2
Paměť 16 MB SDRAM 16 MB SDRAM 16 MB SDRAM 32 MB SDRAM 32 MB SDRAM
Takt pamětí 183 MHz 200 MHz 110 MHz 125 MHz 143 MHz
Šířka sběrnice 128 bit 128 bit 128 bit 64 bit 128 bit
Propustnost pamětí 2,92 GB/s 3,2 GB/s 1,76 GB/s 1 GB/s 2,28 GB/s
Fillrate (pixely) 183 MP/s 200 MP/s 180 MP/s 240 MP/s 250 MP/s
Fillrate (textury) 366 MT/s 400 MT/s 180 MT/s 240 MT/s 250 MT/s
Sběrnice AGP 2x AGP 2x AGP 2x AGP 4x AGP 4x
TDP (odhad) 12 W 13 W 15 W 12 W 12 W
DirectX 6 6 6 6 6
OpenGL 1.1 1.1 1.2 1.2 1.2
  Riva TNT2 Ultra GeForce 256 SDR G200 G400 MAX Rage XL
Jádro NV5 NV10 MGA-G200 MGA-G400 Rage XL
Výrobní proces 250 nm 220 nm 350 nm 250 nm 350 nm
Velikost jádra 90 mm^2 125 mm^2
Tranzistorů 15 mil. 23 mil. 9 mil.
Takt jádra 150 MHz 120 MHz 85 MHz 150 MHz 83 MHz
ROP/RBE 2 4 1 2 1
Texturovacích jedn. 2 4 1 2 1
Paměť 32 MB SDRAM 32 MB SDRAM 8 MB SDRAM 32 MB SGRAM 8 MB SDRAM
Takt pamětí 183 MHz 166 MHz 113 MHz 200 MHz 83 MHz
Šířka sběrnice 128 bit 128 bit 64 bit 128 bit 64 bit
Propustnost pamětí 2,92 GB/s 2,65 GB/s 0,9 GB/s 3,2 GB/s 0,66 GB/s
Fillrate (pixely) 300 MP/s 480 MP/s 85 MP/s 300 MP/s 83 MP/s
Fillrate (textury) 300 MT/s 480 MT/s 85 MT/s 300 MT/s 83 MT/s
Sběrnice AGP 4x AGP 4x AGP 2x AGP 4x AGP 2x
TDP (odhad) 15 W 20 W 5 W 15 W 2 W
DirectX 6 7 5 6 6
OpenGL 1.2 1.2 1.0 1.1 1.1
  Rage 128GL Rage 128 Pro Rage Fury MAXX Savage 4 Savage 2000
Jádro Rage 128GL Rage 128 Pro 2x Rage 128 Pro 86C395 86C410
Výrobní proces 250 nm 250 nm 250 nm 250 nm 180/220 nm
Velikost jádra
Tranzistorů 8 mil. 16 mil. 12 mil.
Takt jádra 80 MHz 120 MHz 125 MHz 110 MHz 125 MHz
ROP/RBE 2 2 4 1 2
Texturovacích jedn. 2 2 4 1 4
Paměť 32 MB SDRAM 32 MB SDRAM 64 MB SDRAM 32 MB SDRAM 32 MB SDRAM
Takt pamětí 60 MHz 140 MHz 143 MHz 115 MHz 143 MHz
Šířka sběrnice 64 bit 128 bit 256 bit 64 bit 128 bit
Propustnost pamětí 0,64 GB/s 2,24 GB/s 4,58 GB/s 0,92 GB/s 2,28 GB/s
Fillrate (pixely) 160 MP/s 240 MP/s 500 MP/s 110 MP/s 250 MP/s
Fillrate (textury) 160 MT/s 240 MT/s 500 MT/s 110 MT/s 500 MT/s
Sběrnice AGP 2x AGP 2x AGP 1x AGP 4x AGP 4x
TDP (odhad) 6 W 8 W 13 W 5 W 5 W
DirectX 6 6 6 6 6
OpenGL 1.2 1.2 1.2 1.1 1.2

 

Testovací sestava

Hardware

  • AMD Athlon XP 1800+ @ 2166 MHz (12 × 180 MHz)
  • MSI KT3 Ultra2 (VIA KT333)
  • 256 MB DDR 360, CL2-2-2-5
  • Samsung 80 GB, 7200 ot./min, ATA133
  • Fortron 350W

Operační systém a ovladače

  • Windows ME
  • DirectX 9c
  • WickedGL 3.02
  • 3Dfx Voodoo3 V1.07.00 WHQL – 3Dfx Voodoo3, Velocity 100/200
  • Raziel Evolution Driver 1.00.00b – 3Dfx Banshee
  • FastVoodoo2 V4.6 – 3Dfx Voodoo2
  • Driver 4.12.7942 – ATI Rage Fury MAXX
  • Driver 4.13.7192 – ATI Rage 128/128 Pro
  • Driver 4.13.2655 – ATI Rage XL
  • Driver 6.82.016.0 – Matrox Millenium
  • ForceWare 53.04 – Nvidia Riva, GeForce
  • Driver 4.12.01.9015 – S3 Savage 2000
  • Driver 8.40.02 – S3 Savage 4

 

Testované hry a software

  • 3DMark 99 MAX – DX6, 1999
  • 3DMark 2000 – DX7, 1999
  • GLQuake – OGL, 1997
  • Quake 2 – OGL, 1997
  • Quake 3 Arena – OGL, 1999
  • Unreal Tournament – Glide, DX6, 1999
  • Clive Barker’s Undying – Glide, DX6, 2001
  • Dungeon Siege – DX7, 2002
  • Serious Sam SE – OGL, 2002

 

Úvod, parametry grafik, testovací sestava

Pár slov k vybraným kartám, návod na interaktivní grafy


3Dfx Voodoo3

Voodoo3 byla poslední kartou založenou na původní architektuře Voodoo Graphics (s mírnými úpravami). Po technologické stránce se nelišila od Voodoo 1/2. Z toho plynou omezení na velikost textur jen 256 × 256 a 16bitový rendering (s 22b postfiltrem). Maximální rozlišení obrazu bylo proti předchozí generaci zvýšeno až na 1600 × 1200 (16MB) nebo 1024 × 768 (8MB karta).

GPU je vyrobeno 250nm procesem, což umožnilo integrovat rasterizér, dvě texturovací jednotky i 2D jádro do jednoho čipu. Frekvence se pohybuje od 125 do 200 MHz. Většina karet byla chlazena malým pasivním chladičem. Aktivní chladič se vyskytoval jen na kartách od některých OEM výrobců. Teploty se pohybují poměrně vysoko – okolo 80°C. Díky kvalitnímu návrhu a výrobě většina Voodoo3 funguje dodnes.

   

ATI Rage Fury MAXX

Rage Fury MAXX je první dvojčipová grafická karta využívající technologii AFR. Na trh přišla koncem roku 1999 jako konkurence pro GeForce 256. Fury MAXX se skládá ze dvou plnohodnotných Rage 128 Pro. Jádra jsou taktované na 125MHz, každé z nich má k dispozici vlastních 32MB SDRAM na 128bit sběrnici. Původně měly být osazeny dva nezávislé VGA výstupy, pro DualHead provoz. Vzhledem k vysokým výrobním nákladům (prakticky dvojnásobným proti konkurenci) je prodejní verze osekaná na nezbytné minimum.

 

Po hardwarové i softwarové stránce je provoz RFM problematický. Ačkoliv karta fyzicky pasuje do AGP 4x slotu, tak ve skutečnosti funguje jen v režimu 1x s 3,3V signallingem – tedy stejně jako Voodoo5. To znamená, že RFM není kompatibilní s většinou desek pro Pentium 4 (podpora pouze AGP 4x 1,5V).  Asi největší problém byly neexistující ovladače pro Windows 2000. Vzhledem k množství problémů zůstala Rage Fury MAXX jen kuriozitou. Stejně tak multi-GPU bylo na dlouhou dobu odloženo k ledu.

Matrox Millenium G400 MAX

G400 bylo první a zároveň poslední úspěšné herní GPU od Matroxu. Hrubý výkon byl srovnatelný s nejrychlejšími variantami Riva TNT2 a Voodoo3. Technologická výbava byla na tehdejší dobu (1999) velmi dobrá. Matrox jako první přišel s podporou Environment Mapped Bump Mapping. Ostatní výrobci EMBM dlouho ignorovali (zejména Nvidia), takže se ve hrách příliš nepoužíval. Další velká konkurenční výhoda byla podpora DualHead – dva nezávislé VGA výstupy. Tím Matrox hodně předběhl dobu, z běžně dostupných grafik DH uměl až Radeon 7000 v roce 2001.

Nvidia GeForce 256 SDR

První grafika z rodiny GeForce byla uvedena na konci roku 1999, krátce po Riva TNT2 Ultra. GeForce přinesla mnoho změn a vylepšení – narostl hrubý výkon a podstatně rozšířena byla i technologická výbava. Proti TNT2 se zdvojnásobil počet pixel pipeline – na celkové čtyři. Z technologického hlediska byla největším přínosem implementace komprese textur a podpora HW TnL podle specifikací DirectX 7. TnL bylo tehdy hodně přeceňováno a vyzdvihováno v recenzích. Až později vyšlo najevo, že geometrický výkon TnL jednotky NV10 není vyšší než bylo možné dosáhnout na dobových procesorech softwarovou cestou. Největší slabinou GF 256 byla pomalá paměť. 128bitové SDRAM taktované na konzervativních 166 MHz výkonu GPU zdaleka nestačily.


 

Jak na interaktivní grafy 2.1

  1. Pokud se vám nelíbí písmo se stíny, velmi snadno je vypnete v Nastavení. Máte-li ještě problémy s rychlostí zobrazování, můžete v Nastavení povypínat také animace. 
  2. V základním nastavení jsou pruhy seskupeny dle úhlopříčky monitory a dále seřazeny dle naměřené hodnoty (vzestupně, či sestupně pak podle toho, je-li zrovna vyšší = lepší či naopak). Toto můžete snadno změnit zvolením řazení dle naměřené hodnoty v testu, seskupením třeba podle matrice apod.
  3. Po najetí myší na některou z položek (třeba na HP ZR24w) se z této stane 100 % (základ) a ostatní položky se spočítají podle ní. Všechny absolutní hodnoty se změní na relativní. Zpět se změní, až kurzor myši opustí oblast s názvy položek (v tomto případě procesorů).
  4. Budete-li chtít nějakou položku (monitor) v grafech sledovat, můžete si její pruh libovolně obarvit. Stačí klepnout levým tlačítkem myši na barevném pruhu a vybrat si z palety. Máte-li povoleny cookies, mělo by vám nastavení vydržet i pro další grafy v dalších kapitolách.
  5. Cenu a další základní parametry (například rozlišení či úhlopříčku) můžete zobrazit kdykoliv v každém grafu: stačí u vybraného procesoru najet kurzorem myši nad pruh s hodnotou (měření) a chvíli počkat. Objeví se jako plovoucí nápověda (tooltip).
  6. Zámek základu (monitor, který se stane těmi 100 % a od něhož se odvíjí další relativní hodnoty) aktivujete pomocí současného stisku klávesy CTRL a levého tlačítka myši nad procesorem (či jeho pruhem v grafu), který chcete uzamknout.
  7. Před prvním použitím grafů si pro jistotu vyprázdněte cache prohlížeče (zřejmě bude stačit refresh) a v případě problém smažte i příslušné cookies.
  8. Interaktivní grafy 2.1 jsou kompatibilní s prohlížeči Firefox (testovány verze 4.x), Opera (testováno s 12.x), Internet Explorer 8, 9 a 10 (verze 7 a starší už nejsou podporovány) a Chrome (zde mají tooltipy hranaté rohy namísto kulatých).
  9. V případě problémů se nejdříve ujistěte, že máte v prohlížeči povoleny skripty i cookies, dále splnění bodů 7 a 8, teprve potom nám chybu prosím co nejpřesněji reportujte. Jedná se o první ostré nasazení grafů, takže i přes delší testování autorem a redakcí při komplexnosti aplikace určitě ještě nějaké mouchy v nějaké kombinaci objevíte.

3DMark 99 Max, 3DMark 2000

Oba testy od Futuremarku jsme ponechali ve výchozím nastavení.

3DMark 99 MAX


           

3DMark 2000

 

 

GLQuake, Quake 2, Quake III Arena

GLQuake

Testováno vestavěné timedemo „demo1“.

Výkon v GLQuake závisí hlavně na multitexturing fillrate.

Všechny Voodoo zde výrazně překonávají svoji papírovou konkurenci. Matrox OGL ovladače si naopak s prvním Quake vůbec nerozumí. GeForce a Rage Fury MAXX drží přesvědčivé vedení nad většinou ostatních grafik. 200MHz Voodoo3 za nimi o moc nezaostává. Multi-GPU škáluje perfektně.

Quake 2

Testováno vestavěné timedemo „demo1“.

Výkon v Quake 2 závisí hlavně na multitexturing fillrate.

Rozložení sil je podobné jako u prvního Quake. Matroxu Q2 sedí mnohem lépe – G400 MAX je na úrovni TNT2 Ultra. Vedoucí pozice se nezměnily, nejrychlejší V3 má o něco větší odstup.

Quake 3 Arena

Testováno vestavěné timedemo „demo1“.

Q3A kupodivu dokáže využít jen jednu TMU/pipeline. Grafiky s konfigurací 2×1, případně 4×1 si tady vedou nejlépe. Podporováno je i HW TnL.

GeForce 256 výrazně vede, RFM nabírá ztrátu. Na třetí místo se překvapivě propracovala Riva TNT2 Ultra. Dobře na tom jsou i G400 MAX a Savage 2000. Velocity 100 a Voodoo2 jsou limitovány malou pamětí.

 

Unreal Tournament, Clive Barker’s Undying

Unreal Tournament

Testováno demo „utbench“.

Měřené demo je výrazně limitováno procesorem – maximum se pohybuje okolo 85fps. Unreal engine podporuje spoustu grafických API. Pro každou grafiku je použité pokud možno nativní API. To znamená Glide pro Voodoo, S3 MeTaL pro Savage a Direct3D pro všechny ostatní.

Rozložení sil je vesměs stejné jako u Quake 3. Voodoo  podávají horší výkon než konkurence – to je patrně způsobeno defaultně vypnutým detail texturingem pod D3D. Výsledky jsou trochu zkreslené.

Clive Barker’s Undying

Testována scéna „cu_03“.

CBU běží na Unreal enginu, platí pro něj tedy totéž, co pro Unreal Tournament, včetně limitu ze strany CPU – cca 90fps.

 

Dungeon Siege, Serious Sam SE

Dungeon Diege

Testováno pomocí utility DS Benchmark.

Dungeon Siege na rozdíl od většiny ostaních her není příliš závislý na fillrate. Nejdůležitější je propustnost videopaměti. 64bitové grafiky tady propadají, 128 bitů (a víc) naopak prakticky garantuje slušnou hratelnost. DS je značně limitován rychlostí procesoru. Ani vysoko taktovaný Athlon XP na karty o několik generací starší nestačí. Engine podporuje HW TnL, ale jeho vliv na fps je minimální.

Serious Sam SE

Frapsem měřeno vestavěné demo „Valley of the Jaguar“.

Engine Serious Sam podporuje Direct3D i OpenGL, všechny karty jsou měřeny pod OGL. Karty Voodoo používají ovladač WickedGL, protože dává lepší rychlost při zachování stejné kvality obrazu.

Nejlépe si vede GeForce 256 se solidním náskokem na Voodoo3 3500. Ostatním grafiky jsou na Serious Sama příliš slabé a pohybují se pod hranicí hratelnosti. Rage Fury MAXX je jen na úrovni jednočipové Rage 128 Pro – multi-GPU nefunguje.

 

Shrnutí výkonu, závěr první části

 

Shrnutí výkonu

Shrnující graf je vytvořen tak, že v každé hře tvoří 100 % (základ) nejlepší výkon a od něj jsou odvezeny další relativní výkony. Takto nemá žádná hra větší váhu. Pokud některá grafika danou hru/nastavení nedokáže spustit, je do průměru započítána nula.

První část testu vyhrála GeForce 256 SDR Na druhém místě je se ztrátou 15% Rage Fury MAXX a hned v závěsu Voodoo3 3500 SE. Výsledky celkem odpovídají papírovým parametrům. RFM díky ne úplně dobrému škálování multi-GPU trochu zaostala za teoretickými možnostmi. Matrox G400 MAX i přes lepší HW výbavu nedokázal překonat Rivu TNT2 Ultra, patrně vinou slabších ovladačů.

S3 Savage 2000 byla směrována jako přímá konkurence pro GF 256. Předvedený výkon tomu ale zdaleka neodpovídá. Ovladače od S3 nikdy za moc nestály a když se k tomu přidá ještě nefunkční TnL jednotka (je v GPU fyzicky přítomná, ale přes ovladače deaktivovaná), je jasné, že Savage 2000 moc úspěchů nesklidila. Možná proto se také stala na dlouhou dobu poslední grafikou od S3.

 

Spodní část pole je docela vyrovnaná – Voodoo2, Banshee, Riva TNT, TNT2 m64, Rage 128GL i Savage 4 podávají prakticky stejný výkon.

Za zmínku stojí vliv PCI vs AGP u různých GPU. 3Dfx má implementaci PCI perfektní. Rozdíl mezi PCI a AGP 2x verzí Voodoo3 je nulový. Naopak Riva TNT v PCI provedení výrazně ztrácí. Z naměřených výsledků je rovněž dobře vidět, že AGP 4x pro tuhle generaci grafik nemělo žádný význam – ačkoliv se marketing razantně snažil přesvědčit o opaku.


Ve druhé části testu se podíváme na další vývoj GPU, až do nástupu DX8. Nebudou chybět klasiky jako GeForce2 GTS, GeForce2 Ultra, Radeon 256 DDR, Radeon 7500, Voodoo5 5500, Matrox G550 nebo Kyro 2.