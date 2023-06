Sapphire RX 7900 XT Pulse je v porovnaní s podobnou výkonnostnou triedou GeForce (RTX 4070 Ti a RTX 4080) takisto výrazne užšia. S takmer 55 mm nezasahuje nad štvrtý slot PCI Express a ten tak môžete pohodlne, to znamená s rozumnou rezervou na (de)montáž, upotrebiť na nejakú prídavnú kartu. Na šírku (od konektora) má RX 7900 XT Pulse má 134 mm. Záslepku okolo výstupov tak presahuje o nejakých 27 mm, ale to je obvykle opäť menej než u celkovo väčších konkurenčných grafických kariet s GPU Nvidia.

Pri detailnom pohľade na ventilátory je vhodné upozorniť na dva prvky, ktoré spevňujú lopatky. Jednak je to stredové „zalomenie“, jednak orámovanie lopatiek kruhovým tunelom. V obidvoch prípadoch výrobca pracuje s tým, aby zvýšil pevnosť lopatiek a eliminoval vibrácie pri špičkách, ktoré by bez týchto úprav pre vysokú pružnosť vznikali. To by potom okrem výraznejších rezonančných frekvencií (tónových špičiek) zvuku viedlo eventuálne aj k rozdrnčaniu krytu a následne pasívu, k čomu dochádza u niektorých jednoduších konštrukcií.

V zadnej časti karty je potom mriežka na lepší odvod ohriateho vzduchu. Je menšia ako na grafických kartách GeForce, ale to preto, že Radeony majú výrazne väčšie PCB. To chladič v tomto prípade presahuje iba o 35,5 mm.

Nevýhoda meraní s aktívnym ReBARom je skrátka to, že všetky porovnávajúce testy nemusia byť vždy perfektne konzistentné. A je možné, že sa budú i naďalej objavovať prípady, kde ReBAR výkon skôr znižuje, než by ho pridával. S týmito vecami treba pri štúdiu výsledkov počítať. To neplatí iba pre naše testy, ale pre testy všetkých osttaných, ktorí s každou novou otestovanou grafickou kartou nepretestovávajú aj všetky staršie modeli v porovnaní.

A nakoniec je pravda i to, že testovať všetky testy na dvakrát (s ReBARom i bez neho) s trojnásobnou opakovateľnosťou, je časovo extrémne náročné. Stále však platí to, čo sme tvrdili viackrát – platforma s ReBARom je, čo sa týka výsledkov meraní, menej stabilná. Naprieč časom sa môžu niektoré veci v procese ladenia (s ovládača na ovládač) meniť a vo vzájomnom porovnaní nemusia „dávať logiku“. Keď teda niekde uvidíte, že v iných testoch pomalšia karta v nejakom konkrétnom prípade predbieha nejakú výkonnejšiu, tak si spomeňte na tieto slová.

Hlavný dôvod je ten, že nové základné dosky počnúc modelmi s čipsetmi Intel Z790 a AMD X670(E) ho už majú vynútený, čo predtým nebývalo a v nastaveniach PCIe sa vyžadovalo sa ručné zapnutie ReBAR. Kto ho nevypne bude teda fungovať s aktívnym ReBARom, čo je z pohľadu hier, kde pridáva výkon, dobre. Je to do istej miery možno aj preto, že grafické karty Intel bez ReBAR sa, zdá sa, nesprávajú korektne a grafických kariet, ktoré s ním budú počítať, bude do budúcna zrejme pribúdať. Dôvod číslo dva pre testy iba s ReBARom už poznáte.

Možnosti hardvérovej akcelerácií je, samoi zrejme, viac, typicky pre strih a prevody videa. To je už však čisto v réžii kodérov, ktoré sú v rámci jednej generácie kariet jedného výrobcu vždy rovnaké, takže nemá zmysel ich testovať na každej grafike. Naprieč generáciami je to už iné a testy tohto typu sa skôr či neskôr objavia. Už len doladiť metriku, kde bude na výstupe vždy rovnaký bitrate a zhoda pixelov. To je na objektívne porovnávania dôležité, pretože kodér jednej firmy/karty síce môže byť v konkrétnom profile s rovnakými nastaveniami rýchlejší, ale na úkor nižšej kvality, ktorú má (ale i nemusí mať, to je len príklad) iný kodér.

Zase z iného cesta sú potom testy dešifrovania v Hashcate s výberom šifier AES, MD5, NTLMv2, SHA1, SHA2–256/512 a WPA-EAPOL-PBKDF2. Nakoniec ešte v broadcastových aplikáciách OBS a Xsplit meriame, o koľko sa zníži herný výkon počas nahrávania. To už neobstarávajú shadrery, ale kodéri (AMD VCE a Nvidia Nvenc). Tieto testy poukazujú na to, akú má ktorá karta približne rezervu typicky na online streamovanie.

Aplikačné testy chceme do budúcna rozvíjať. Výhľadovo určite nejakým pokročilým testovaním AI (zatiaľ sme neprišli na rozumný spôsob) vrátane odšumovania (tam by už nejaké nápady boli, ale pre časovú tieseň sme ich zatiaľ nezapracovali).

Najväčšiu porciu testov si z pochopiteľných dôvodov ukrojilo 3D renderovanie. To napríklad aj v rámci praktických testov Blendery (2.91). Okrem Cycles grafiky potrápime aj renderermi Eevee a radeon ProRender (nech má nejaký spriaznený test aj AMD, keď už je väčšina optimalizovaná na karty Nvidie s proprietárnymi frameworkami CUDA a OptiX). Zaujímavý by bol isteže aj add-on pre V-ray, na ten však momentálne redakčná kasa nestačí, ale možno sa nám podarí časom získať nejakú „press“ licenciu, uvidíme.

Otestovať grafickú kartu komplexne aj z pohľadu výpočtového výkonu je zložitejšie, než urobiť závery z herného prostredia. Už len z toho dôvodu, že sa takéto testy obvykle viažu na drahý softvér, ktorý si „len tak do redakcie“ nekúpite. Na druhej strane sme našli spôsoby, ako vám ten dostupný výpočtový výkon priblížiť. Jednak vďaka dobre stavaným benchmarkom, jednak sú tu aj nejaké voľne dostupné a pritom relevantné aplikácie a do tretice sme i niečo investovali do tých platených.

Ak má hra vstavaný benchmark, tak používame ten (výnimka je iba Forza Horizon 4, kde pre jeho nestabilitu – sem-tam zvykne štrajkovať – jazdíme po svojej trati), v ostatných prípadoch merania prebiehajú na vlastných scénach. Z tých cez OCAT zachytávame časy za sebou idúcich snímok do tabuliek (CSV), ktoré do zrozumiteľnej reči fps interpretuje FLAT. Obe tieto aplikácie sú z dielne kolegov z magazínu gpureport.cz . Okrem priemernej snímkovej frekvencie do grafov zapisujeme aj minimálnu. Tá sa na celkovom zážitku z hrania podieľa významnou mierou. Na čo najvyššiu presnosť sú všetky merania opakované trikrát a konečné výsledky tvoria ich priemernú hodnotu.

Skôr, než sa pustíme do herných testov, tak na zahorenie so zahriatím na prevádzkovú teplotu každá grafická karta prejde testami v 3DMarku. To je na začiatok taká dobrá syntetika.

Najväčšia vzorka testov je z hier. Vzhľadom na to, že sa prevažne budú testovať GeForce a Radeony, teda grafiky primárne určené na herné použitie, je to vcelku prirodzené.

Čiarové grafy s priebehmi budeme rozoberať pre každú časť napájania zvlášť. Aj keď podiel na 3,3 V je obvykle zanedbateľný, monitorovať ju treba. Ťažko povedať, čo táto vetva presne napája, ale obvykle je odber na nej konštantný a keď tak sa mení iba s ohľadom na to, či sa vykresľuje statický alebo dynamický obraz. Spotrebu meriame v dvoch náročnejších hrách (F1 2020 a Shadow of the Tomb Raider) a jednej menej náročnej (CS:GO) s nastavením najvyšších grafických detailov a rozlíšenia UHD (3840 × 2560 px).

Na čítanie a záznam meraní používame riadne skalibrovaný multimeter Keysight U1231A, ktorý vzorky posiela do XLS. Z neho získavame priemernú hodnotu a dosadením do vzorca s presnou hodnotou výstupných napätí na vetve získavame podklady do grafov.

A prečo sa vôbec trápime s takýmito prípravkami, keď má Nvidia analyzátor spotreby PCAT? Pre úplnú kontrolu nad meraniami. Zatiaľ čo naše zariadenia sú transparentné, tak to od Nvidie používa procesor ktoré môže (ale samozrejme i nemusí) merania rôzne prifarbovať. Po testovaní grafiky AMD na meracom prístroji Nvidia by sme asi pokojne nezaspávali.

Dokým to poriadne vyladíme budeme na merania na kábloch používať prúdové kliešte Prova 15, ktoré takisto merajú s peknou presnosťou, akurát majú rozsah do 30 A. To ale stačí aj na OC verziu RTX 3090 Gaming X Trio. V prípade, že by bola nejaká karta cez rozsah, je vždy možnosť realizovať meranie spotreby na dvakrát (najprv na jednej a potom na druhej polovici 12 V vodičov).

Nakoniec rovnako ako pri meraní hladiny hluku v jednom z testov zaznamenávame aj frekvenčnú charakteristiku pískajúcich cievok. Nejaké dramatické rozdiely tu však neočakávajte. Obvykle pôjde o jednu a tú istú frekvenciu a cieľom je skôr odhaliť nejakú prípadnú anomáliu. Zvuk pískajúcich cievok je samozrejme vzhľadom na scénu premenlivý, no my však meriame vždy na rovnakej (v CS:GO@1080p).

Výsledky budú interpretované jednak formou spektrografu s rozlíšením 1/24 oktávy a na lepšie porovnanie s ostatnými grafickými kartami do štandardných pruhových grafov vytiahneme dominantnú frekvenciu nižšieho (20–200 Hz), stredného (201–2000 Hz) a vyššieho (2001–20 000 Hz) spektra tónov a k nemu i intenzitu, resp. hladinu hluku. Na merania používame mikrofón miniDSP UMIK-1, ktorým presne kopíruje polohu hlukomeru s tým, že takisto má límček, a to i s rovnakou ohniskovou vzdialenosťou.

Na zaistenie vždy rovnakých podmienok pri meraní hladiny hluku (a neskôr aj zvuku) používame okolo bench-wallu akustické panely s penovou plochou. To z dôvodu, aby sa zvuk do snímača hlukomera odrážal vždy rovnako bez ohľadu na momentálnu situáciu predmetov v testroome. Tieto panely sú z troch strán (zvrchu, sprava a zľava) a ich účelom odzvučniť priestor, v ktorom hlučnosť grafických kariet meriame. Odzvučniť znamená zamedziť rôznym odrazom zvuku a kmitaniu vĺn medzi plochými stenami. Nemýľte si to s odhlučnením, to máme v testlabe dlhodobo vyriešené dobre.

Kľúčové pre grafy zahrievania bude tak odpočet teplôt internými snímačmi, podľa ktorých sa koniec koncov odvíja aj regulácia frekvencií GPU. Vždy to bude zahrievanie grafického jadra a pokiaľ budú snímače aj na VRAM a VRM, tak vytiahneme do článku aj tieto hodnoty.

Zahrievanie odčítavame z interných snímačov cez GPU-Z. Táto malá jednoúčelová aplikácia umožňuje aj záznam vzoriek zo snímačov do tabuľky. Z nich je potom už jednoduché vytvoriť čiarové grafy s priebehmi či priemernú hodnotu do pruhových grafov. Termokameru tu veľmi nevyužijeme, keďže väčšina grafických kariet má backplate, ktorý znemožňuje meranie zahrievania PCB.

Poznámka: Hra podporuje aj DLSS, ale vzhľadom na to, že ide o starší titul a meraní je viac než dosť, sa tomuto nastaveniu v štandardných testoch venovať nebudeme. Nejaké to meranie na prianie však možné je, ak si oň napíšete.

Testovacia platforma render BMW a Classroom ; renderer Cycles , 12 dlaždíc; extra nastavenia sú OpenCL pre grafické karty Radeon a CUDA pre GeForce. Tak, ako to bude používať väčšina ľudí. OpenCL s GeForce je vždy pomalé, pretože path tracing nepodporuje akceleráciu GPU a počíta ho CPU. Nvidia OptiX sa na podporovaných kartách (GeForce RTX) testuje samostatne a výsledky dávame do oddeleného grafu zvlášť.

Záver

Ak by sme mali iba dve premenné – rýchlosť rasterizácie pre hry a cenu, tak Radeon RX 7900 XT vo svojej cenovej kategórii nemá žiadnu konkurenciu. Tou je rýchlostne až výrazne drahšia GeForce RTX 4080, pri ktorej Nvidia vsadila na iné požiadavky zákazníkov. Ale k tomu, v čom Radeon na GeForce výrazne stráca, až neskôr. Okrem nastavení s uplatnením ray-tracingových jednotiek RX 7900 XT poráža RTX 4070 Ti, teda konkurenčnú grafickú kartu, o triedu. Rozdiel priemerného herného výkonu v prospech Radeonu (RX 7900 XT) je 15–19 %. Spodná hranica (15 %) sa týka rozlíšenia UHD/2160p, na ktoré tieto grafické karty rýhclostne obvykle stačia. Pokiaľ teda nepožadujete RT nastavenia a vysokorýchlostný monitor. RTX 4070 Ti je „slabšia“ možnosť aj v tituloch, ktoré sú lepšie optimalizované na GeForce (vrátane Controlu).

Jediná z 18 testovaných hier, kde má RTX 4070 Ti nad RX 7900 XT navrch, je DOOM Eternal. A aj to iba vo vysokom rozlíšení 2160p. V Assassin’s Creed: Valhalla a v Borderlands 3 je náskok RX 7900 XT až 26–27 %, v CS:GO až 40 %. Obvykle to takto priepastné nebýva a vo väčšine hier je manko RTX 4070 Ti pod 10 % (F1 2020, Forza Horizon 4, Mafia: DE, Metro Exodus, Shadow of the Tomb Raider a podobne), ale často to ťahá skôr k porovnaniu s RTX 4080. Dokonca aj tá v hrách, ako sú Red Dead Redemption 2, CS:GO či FIFA v UHD ťahá za kratší koniec, ale v priemere je obvykle rýchlejšia, čo ilustrujú aj grafy súhrnného herného výkonu. V nich si ale všimnite jednu vec, a síce, že zatiaľ čo v 2160p RX 7900 XT s RTX 4080 prehráva o 7 %, tak v QHD/1440p sú výsledky už vyrovnané a vo FHD/1080p sa Radeon prebíja do vedenia.

Ako je možné, že RTX 4080 rýchlejšia vo vysokých rozlíšeniach, kde je limitom iba GPU, ale vo FullHD sa poradie otáča a zrazu na RX 7900 XT nestačí napriek tomu, že by limitácia CPU mala obidve karty zraziť maximálne na rovnakú úroveň? Grafické ovládače architektúr Nvidia Ampere a Ada Lovelace majú podľa rôznych pozorovaní väčší réžiu – „overhead“. To znamená, že na každú snímku v ovládačoch spotrebujú o trochu viac cyklov CPU ako ovládače grafických kariet AMD s architektúrami RDNA 2 a 3. Pokiaľ je hra limitovaná procesorom , tak môže nastať situácia, v ktorej Radeon môže dosiahnuť vyšších fps než GeForce, pretože počet cyklov CPU je konečný a ovládač AMD s týmto prídelom zvládne obslúžiť viac snímok než ovládač Nvidie. A to aj keď samotné GPU Nvidia potrebujú menej času CPU než GPU AMD (čo sa ukazuje v rozlíšení 2160p), pri limitácii procesorom sa to neprejaví – rozhodujúce je to, koľko snímok stihne za sekundu obslúžiť CPU. Toľko malá odbočka k tomu, prečo je v priereze všetkými hrami RX 7900 XT vo FHD rýchlejšia karta než RTX 4080, hoci v UHD to už neplatí.

Pre majiteľov vysokorýchlostných monitorov tak Radeon RX 7900 XT môže byť atraktívnejšia voľba než RTX 4080. Samozrejme stále za predpokladu, že sa nezohľadňuje herný výkon pre ray-tracingovú grafiku. Ten je u RX 7900 XT výrazne slabší aj v porovnaní s RTX 4070 Ti. Vyrovnané výsledky sú dosahované iba v Shadow of the Tomb Raider s pomerne malým podielom RT práce. Tam, kde je aplikácia ray tracingu komplexnejšia, je už RX 7900 XT oproti RTX 4070 Ti pomalší zhruba o 25–35 %. To tak v Controle, v Cyberpunk 2077 či v Battlefield V. V pôvodnom Metre Exodus (netýka sa teda Enhanced Edition s mimoriadne náročným RT) je rozdiel menší, ale to z podobného dôvodu ako pri Shadow of the Tomb Raider – zase toľko ray-tracingového tam toho nie je.

Takže pokiaľ v hrách chcete ray tracing, atraktivita RX 7900 XT pomaly klesá, o to viac, keď vás pre Frame Generation zaujíma i DLSS 3, ktoré exkluzívne podporujú iba GeForce RTX 4000. Potom je tu v prospech Nvidie takisto GPU akcelerácia tensorovými jadrami v aplikačnom prostredí. RX 7900 XT pri 3D renderingu často zaostáva aj pri akcelerácii sharerami, v Blenderi pod OpenCL jej všetko trvá dlhší čas než RTX 4070 Ti s CUDA. Ale zase pôsobivé výsledky sú v aplikáciách Autodesku, kde RX 7900 XT vo väčšine prípadov nad GeForce (vrátane RTX 4080) dominuje.

Hoci existujú scenáre, pri ktorých sa RX 7900 XT oproti GeForce (RTX 4070 Ti a RTX 4080) vyznačuje atraktívnejším pomerom cena/výkon, ale celkový obrázok Radeon zhoršuje slabšia energetická efektivita. Nie výrazne, ale rozdiel nejakých 15 % tam na hranici maximálneho výkonu je. RX 7900 XT Pulse má spotrebu do 325 W, čo je o 5–10 % viac než v prípade MSI RTX 4080 16GB Suprim X. Na druhej strane, Sapphire frekvencie GPU šponuje pomerne vysoko. V hrách dosahuje aspoň 2500 MHz, v CS:GO dokonca až 2623 MHz. Nejaký priestor na ladenie (podvoltovaním a podtaktovaním) s cieľom zvýšenia efektivity tu teda je. Vzhľadom na pomerne vysokú spotrebu je RX 7900 XT vo vyhotovení Sapphire Pulse je v grafoch s meraniami hlučnosti niekde uprostred, to i čo sa týka cievok. Tie sú hlučnejšie, ale menej než u RTX 4080 16GB Suprim X.

Sapphire RX 7900 XT Pulse je veľmi solídna karta bez zjavných nedostatkov a navyše medzi takto výkonnými grafikami s pekným pomerom cena/výkon, bez uplatnenia RT atraktívnejším, než majú RTX 4070 Ti a RTX 4080. Pokiaľ na ray tracingu vyložene nebazírujete a prežijete aj bez DLSS 3, tak je RX 7900 XT Pulse skvelá voľba. Obzvlášť do nižších rozlíšení v kombinácii s monitormi s veľmi vysokými obnovovacími frekvenciami obrazu.

Ľubomír Samák, redaktor HWCooling.net

Za spoluprácu na zabezpečovaní testovaného hardvéru ďakujeme e-shopu Datacomp