Radeon RX 480 je venku. Bude nejvýhodnější grafikou FinFETové generace?

0

Po čtyřech týdnech od představení na Computexu je zde konec čekání a první 14nm grafika AMD, Radeon RX 480, se vydává na trh. Během této doby a zvlášť v posledních dnech se pořád objevovaly nějaké úniky informací, takže o parametrech je již jasno. Ovšem jde o novou či značně vylepšenou architekturu, a tak frekvence a počet CU nejsou všechno.

 

Nová architektura začíná v mainstreamu

Radeon RX 480 je mainstreamová karta, nikoliv model, který by byl zamýšlen pro pozici nejvýkonnější grafiky v nabídce. Ovšem na rozdíl od Nvidie se AMD rozhodlo postupovat při uvádění z druhé strany, a tak se FinFETové GPU objevuje nejprve na této pozici, kde tudíž nepředstavuje protivníka 16nm grafik Nvidie (GeForce GTX 1070, 1080). Radeon RX 480 je dle AMD kartou, která je ideální pro hraní na rozlišeních okolo 2560 × 1440 bodů, ale také jako dostupný model s výkonem adekvátním pro VR brýle. Ačkoliv výkon by měl odpovídat GPU Hawaii, model je vlastně kartou na pozici, kterou dosud držel Radeon R9 380X.

AMD Radeon RX 480

Nové značení

Změněné značené, které opustilo označení R9/R7, má mít praktický význam. První číslice (4) značí generaci architektury GCN, druhé pak výkonnostní stupeň. Podle informací od AMD je osmička a sedmička (RX 480/470) vyhrazena pro karty na standardní rozlišení, tedy do 2560 × 1440 bodů a Full HD. Tyto karty by obvykle měly mít 256bitovou paměťovou sběrnici, ale pravidlo to možná vždy nebude. Devítka, která zatím čeká na využití, pak je znakem highendu, karet s vyšší paměťovou propustností (384/512bitová sběrnice, HBM), které již budou mít páru i do rozlišení jako 4K.

Konečně nižší pětka a šesta budou vyhrazené pro základní herní grafiky pro hry typu MOBA/“ esports“, typicky se 128bitovými paměťmi. Až do této úrovně budou mít karty společný prefix „RX“, který značí, že jde o herní kartu. Lowendové modely níže již budou prostě „Radeon 450“ (například), což značí, že slouží jako základní zobrazovadlo či pro přehrávání videa a podobně, ale již není doporučen pro „závažnější“ hraní.

 

 

 

Polaris 10: hardware

GPU, vyráběné na 14nm procesu firmy GlobalFoundries, se (jak již asi víte) jmenuje Polaris 10, což je kód sestávající z názvu architektury a čísla, které má být čistě pořadové. Druhý FinFETový čip Polaris 11 je méně výkonný a jmenuje se takto proto, že byl údajně dokončen až po Polarisu 10. Ten obsahuje 5,8 miliardy tranzistorů a měří 232 mm² (Čína tedy měla pravdu).

Polaris 10 obsahuje celkem 36 CU, tedy 2304 stream procesorů, což Radeon RX 480 používá beze zbytku. Jde o maximální konfiguraci, která neponechává nic v rezervě. GPU má jeden Graphics Command Processor, čtyři ACE (Asynchronous Compute Engine), dva hardwarové schedulery (HWS) a čtyři jednotky Geometry Processor. Texturovacích jednotek je 144 (čtyři v každé CU), rasterizačních 32, jako předtím v čipech Tahiti a Tonga. V každé CU jsou také čtyři jednotky load/store o šířce 32 bitů.

„Jádro“ GPU má tentokrát uváděné dva takty (toto se tedy potvrzuje). Maximální hodnota turba pro RX 480 je 1266 MHz, AMD ale negarantuje, že na něm karta poběží většinu času, a proto je uvedena také základní (v praxi minimální) frekvence, jež je 1120 MHz. GPU by se mělo během hraní pohybovat dynamicky někde mezi, zatímco u předchozích grafik na bázi GCN se při provozu obvykle drželo maximálního taktu. Záviset bude na teplotě a na TDP, které je dle specifikací 150 W.

AMD Radeon RX 480

 

Delta komprese

AMD k Polarisu 10 používá standardní paměti GDDR5, jejichž sběrnice je 256bitová a v Radeon RX 480 se bude dát pořídit v 8GB variantě, ale i v levnější verzi s 4 GB RAM. Morální životnost GDDR5 podle svých slov AMD vylepšilo jednak použitím v současnosti nejrychlejší třídy čipů, běžících na efektivním taktu až 8,0 GHz. S těmi má i pouze 256bitová sběrnice hrubou propustnost 256 GB/s (dvě třetiny kapacity Radeonu R9 390X).

Většina karet, které jsme zatím viděli, vskutku používá 8GHz paměti, ale referenční návrh údajně připouští i pomalejší 7GHz čipy (224 GB/s). Ty má AMD použité u 4GB referenční karty, ale výrobci budou mít patrně volnou ruku u obou typů. 8GHz karty budou patrně o něco rychlejší (i když rozdíl nemusí být vždy významný), takže pokud máte možnost a cenový rozdíl není velký, doporučuji se zaměřit na ně.

Paměťový subsystém by každopádně měl být silnější, než říká papír. Má totiž vylepšenou delta kompresi barev (DCC), která podporuje bezeztrátové poměry 2:1, 4:1 a 8:1 a má vylepšovat propustnost, ale i spotřebu energie.

Efektivitě pamětí má pomáhat i určité vyladění a zvětšení L2 cache, která seskupuje požadavky pro lepší využití zdrojů. Kapacita L2 cache je 2 MB, každá CU má pak 16KB L1 cache, 4KB skalárních registrů a 4×64 KB vektorových registrů.

 

Výkonnostní optimalizace

Tím se dostáváme k architektonickým zlepšením shaderů a GPU jako takového. Ty nejsou zanedbatelné, podle informace od AMD by měly zlepšovat výkon při stejných parametrech (počet CU a takt) až o 15 %, i když nejspíš bude záležet na situaci. Pokud začneme u samotné CU, pak byl vylepšen prefetch instrukcí, díky kterému by měly být eliminovány některé prodlevy, kdy pipeline stream procesorů běží naprázdno, a vylepšovat efektivitu cachování kódu. Buffery pro instrukce jednotlivých „vln“ (wave) jsou prohloubené, což podle AMD zvyšuje výkon na jednotlivém vlákně.

 

 

Darmožroutské primitivy pryč

Nad samotnými shadery je zlepšení ve zpracování geometrie (Geometry Processor), které by zřejmě mělo být hodně podstatné. Novinkou je Primitive Discard Accelerator, který slouží k eliminaci prvků scény, které se nepodílejí na její viditelné části nebo v ní mají mají nulovou plochu. Takové trojúhelníky jsou v raných fázích zpracování detekovány a vyhozeny z dalších operací. Přínos této optimalizace má růst s úrovní MSAA a také s úrovní teselace, v které by měla být eliminace primitiv znát.

 

Hardware scheduler (HWS) a vylepšené asynchronní shadery

Asynchronní shadery či výpočty by také v architektuře Polaris měly nabízet evoluci, spojenou s integrováním hardwarových schedulerů (HWS). Ty přebírají část práce ovladače a rozdělují práci výpočetním prostředkům, přičemž umožňují předtím nemožné věci. Úlohy či procesy mohou opět zadat současně (obvykle je to využito k proložení grafického a obecného výpočtu, čímž se využijí jinak volné prostředky, podobně jako v případě HT u procesorů), nebo mezi nimi prostě přepínat („preemption“, takto by měla věc řešit Nvidia).

 

S HWS ale je možné pracovat s prioritou jednotlivých úloh a vyvažovat jejich výkon. Scheduler by měl být konfigurovatelný a lze jej údajně aktualizovat mikrokódem. S jeho pomocí bude možné některým úlohám přiřadit prioritu, nebo jim zcela vyhradit část CU, aby je měly vždy volné pro sebe.

Lze tak implementovat tzv. „Quick Response Queue“, která na latenci kritickým úlohám rychle přidělí velkou část prostředků, aby byla tato práce hotova co nejdříve. Pro na latenci nejcitlivější vlákna je pak dostupný i scheduling s prioritou „realtime“, využitelný pro audio nebo VR.

 

TrueAudio Next

Právě tato novinka v Polarisu sebou nese jednu velkou změnu. Od teď může přímo na shaderech běžet výpočet fyziky prostorového zvuku s technologií TrueAudio. To v generaci Polaris již nebude závislé na přítomnosti licenčního DSP v GPU, ale bude fungovat takto softwarově a na všech grafikách pod názvem „TrueAudio Next“.

S touto formou asynchronních shaderů s pokročilou správou priority a možností používat je k výpočtům s nízkou latencí totiž lze konečně dosáhnout potřebné stability a předvídatelnosti výkonu i bez zvláštního bloku DSP. Navíc lze škálovat na vyšší výkon, kdežto klasické TrueAudio mělo určitý strop. Také TrueAudio Next bude dostupné jako knihovna s otevřeným kódem v projektu GPUopen.

Polaris 10 je tu, architektonické změny

Nové funkce, software

Podpora 16bitových výpočtů

Polaris 10 má také nativní podporu pro výpočty s 16bitovými hodnotami jako datovým typem (a to celočíselnými i „floating point“). Ty lze použít ke snížení spotřeby aplikace a k zefektivnění využití paměti a registrů, samotná hrubá výpočetní propustnost („TFLOPS“) je patrně stejná. Tato funkce bude patrně využitelná hlavně k ručním optimalizacím a pro výpočetní využití, takového číselné hodnoty může využít například strojové učení a analýza obrazových dat.

AMD Radeon RX 480

 

Intrinsics Functions: asemblér pro GCN

Pro ruční optimalizace má jinak AMD přichystánu možnost používat cosi jako ekvivalent ručního asembléru u programů pro CPU – intrinsics functions. Ty programátorovi umožní psát přímo pro interní instrukční sadu GCN a vydřít tak co nejvíc výkonu pro kritické části kódu. Používat to bude možné pod DirectX 12, Vulkanem i DirectX 11 a nástroje budou dostupné v rámci projektu GPUOpen (do kterého AMD od jeho zveřejnění vložilo i řadu dalšího softwaru a nástrojů pro vývojáře). Programátor her na PC tak bude podle AMD mít možnost optimalizovat výkon podobně, jako vývojáři her pro konzole.


 

 

Diagnostika při spuštění

Polaris 10 má i některé další triky, které se netýkají ani tak optimalizace výkonu, jako optimalizace fyzického fungování čipu vůbec. Od APU CarrizoBristol Ridge byly převzaty pokroky ve správě spotřeby a v ovládání taktu GPU, včetně detekce poklesu napětí a rychlé reakce na něj („Adaptive Clocking“, „AVFS“).


 

Stejně jako Bristol Ridge čip Polaris 10 při spuštění provádí diagnostiku kvality napájení a své vlastní kondice, podle čehož také umí zkalibrovat své takty. Výsledkem je, že lze z čipu bezpečně a při zachování stability vytáhnout nějaké MHz navíc, či se vyhnout tomu, aby po čase nějaká degradace učinila GPU nestabilním. GPU díky těmto technikám nemusí mít zbytečně zvýšené napájecí napětí pro rezervu, a tím pádem se ušetří na spotřebě.

 

Obrazový výstup: HDMI 2.0b, DisplayPort 1.4, HDR

Ještě než s hardwarovými aspekty skončíme, je třeba připomenout, že 14nm GPU jako významnou novinku (stejně jako 16nm od Nvidie) přinášejí podporu pro vyšší rozlišení monitorů. S DisplayPortem 1.3 (porty mají být připravené i na DP 1.4, který se ale asi do monitorů dostane až později) bude možné provozovat Full HD monitory běžící až na 240 Hz, a to i s 10bitovými barvami (HDR), 2560 × 1440 bodů poběží na 240 Hz při 8bitech (HDR 200 Hz), u 4K obrazovek bude možných 120 Hz při 8 bitech a 96 Hz při 10 bitech. Rozlišení 5120 × 2880 bodů poběží na 60 Hz, ale jen při 8 bitech (tedy bez HDR). K připojení 5K obrazovek ale konečně bude třeba jen jeden kabel, podporují-li DP 1.3.


 

 

12bitové a 10bitové barvy

HDR, neboli obraz s vysokým dynamickým rozsahem, je jednou z novinek Polarisu, i když ovladače mají zpřístupnit částečnou podporu také pro Radeony řady 300, Fury a Nano. HDR přináší vyšší rozsah gamutu barev (sytosti) a také jasu. Výhledově by se tedy lepší monitory měly dostat z relativně omezeného gamutu sRGB na na barevné prostory jako P3 Digital Cinema a později snad až Rec. 2020, který má dvojnásobek viditelných barev. HDR bude jednak použito v audiovizuálním obsahu, uplatnění ale má také ve hrách. Obraz s ním může být jasnější při zachování detailů v temnějších částech a mít živější barvy, beze ztráty přesnosti: Polaris podporuje 10bitové a dokonce i 12bitové barevné složky.

 

Ve hrách by dle AMD neměl být větší problém HDR nasadit, protože enginy již nyní pracují interně s větším rozsahem a přesností, které pak mapují na omezený barevný prostor sRGB. Do značné míry tak bude stačit jen změnit výstup a mapování – na což bude AMD nabízet SDK Photon, podporující DirectX 11 a DirectX 12 (Vulkan zatím zmíněn není, ale opomenut asi nebude). Jednou z výhod tohoto SDK bude to, že se přizpůsobí monitoru a dle jeho charakteristik (údaje o jasu, kontrastu a barevném gamutu) upraví vykreslování přímo ve hře, takže pak nebude třeba další konverze v monitoru. Photon by měl být použitelný i při přehrávání HDR videa.


 

 

 

10bitové HEVC, dekódování VP9

Pro HDR video podporuje Polaris 10 také dekódování 10bitového videa ve formátu HEVC Main 10, a to až do rozlišení 4K. Bude tedy plně podporovat přehrávání disků Ultra HD Bluray. Komprese videa v GPU také podporuje 4K HEVC při 60 snímcích za vteřinu, již ale asi jen v osmibitovém profilu. Kvalita má ale být vyšší, neboť enkodér používá techniku lookaheadu, která částečně kompenzuje nevýhody jednoprůchodového kódování. Polaris 10 má jinak také mít akcelerované dekódování VP9, ale to bude zprovozněno až v někteérm z nadcházejících ovladačů.


 

 

 

Variable Rate Shading

Různých změn ve vykreslování budeme asi teď vídat více, což souvisí i s příchodem VR brýlí jako nového zobrazovacího zařízení. Na ty míří patrně optimalizace nazvaná Variable rate shading. Její princip je poměrně prostý – rozdělí obrazovku na několik sekcí, v nichž lze pak pomocí tzv. Multi-viewport API vykreslovat s různou úrovní kvality či detailů.


 

Typicky s tímto trikem tedy bude centrum obrazu vykreslováno s vyšším rozlišením a periférie s nižším, jde tedy o prioritizaci nejdůležitějších částí zobrazené scény. Zajímavý detail je, že tento trik je připraven na spolupráci s detekcí směru pohledu, takže bude umět reagovat na to, když se uživatel na onu zanedbanou periférii podívá – ono centrum zájmu by mělo být schopno se v obraze dynamicky přesouvat podle směru pohledu oka.

 

CrossFire stále pro čtyři grafiky (a víc v DX 12)

Než různé softwarové technologie, které AMD v souvislosti s Polarisem představilo, úplně opustíme, podíváme se ještě na CrossFire. Radeon RX 480 podle AMD oficiálně podporuje CrossFire až čtyř karet (zatím tedy firma nepodnikla stejný krok jako Nvidia, možná proto, že tradičně vytváří duální grafiky), a to bez externích můstků (což mu asi výrobci předražené herní bižuterie budou zazlívat). To ovšem platí pro tradiční multi GPU realizované v ovladačích. Podle AMD se nyní tato funkce začne více přesouvat do rukou vývojářů. V DirectX 12 a Vulkanu pomocí explicitního multi GPU přímo řízeného enginem hry bude počet grafik spolupracujících na vykreslování neomezený. K implementaci explicitního multi GPU mají údajně být k dispozici různé pomůcky a nástroje od MS, ale také AMD (opět v rámci GPUOpen).

 

Nicméně určitá zlepšení se údajně chystají také pro standardní CrossFire ze staré školy v DirectX 11, běžící metodou AFR. Ta spočívá v střídavém počítání snímků na individuálních GPU. To, jak se na monitoru řadí obrázky z více GPU za sebou, ale většinou vede k nestejným časům mezi jednotlivými snímky, tedy jevu nazývanému microstuttering. Proti této bolesti chystá nyní AMD údajně vylepšený frame pacing pro režim AFR, který by měl přijít v některé budoucí verzi ovladačů Radeon Software. Tento AFR frame pacing by měl v CrossFire upravovat časy zobrazení snímků tak, aby nebyly příliš dlouhé nebo zase příliš krátké. Díky tomu by měl být obraz plynulý, byť za cenu mírně horší latence (ta by se ale neměla zhoršit o víc, než o čas jednoho snímku).


 

 

AMD Wattman

Poslední změnou pro ty, kdož taktují, je pak nový nástroj na taktování, nazvaný Wattman. Ten nahrazuje aplikace AMD overdrive a umožňuje manipulaci s nastavením otáček ventilátoru, limitů a cílových provní teplot, TDP, napětí a frekvencí. Podstatné je, že umí tyto parametry individuálně změnit pro každý z několika výkonnostních režimů, takže máte kontrolu nad celou křivkou výkonu při různé zátěži.


 

 

 

 

Závěr… Ceny jsou 6000 a 7000 korun

A tím jsme prakticky u konce premiérového přídělu informací. Zbývají už prakticky jen nízké „materiální“ záležitosti. Radeony RX 480 mají být v obchodech hned, a to údajně ve velkých počtech. Od počátku mají být dostupné jak 8GB, tak 4GB verze. Ty se pochopitelně liší cenou. Menší 4 GB model má oficiální cenovku jak známo stanovenu na 199 dolarů, u ná sje oficiálně doporučeno 6095 Kč. Cenu 8GB verze, jejíž parametry se jinak neliší, nastavilo AMD na 239 dolarů, pro naše území je oficiální cenovka 7085 Kč. To jsou ceny doporučené, v prvotním zápalu se ale asi nevyhneme tomu, že bude cena leckde nadsazená. Jak rychle se srovná, to teprve uvidíme, bude to určitě záviset i na poptávce a na tom, zda se karty nebudou z počátku vyprodávat.

Na pořadu dne jsou prozatím jen karty s referenčním chlazením s radiálním ventilátorem a napájením jedním šestipinovým konektorem (a pro rekapitulaci: karta má jako výstupy standardně tři DisplayPorty 1.3/1.4 a jedno HDMI 2.0b). Termín dostupnosti karet nereferenčních AMD přímo nesdělilo a závisí spíše na jednotlivých výrobcích, podle neoficiálních zdrojů by se ale mohly začít objevovat zhruba od poloviny července, počkáte si na ně tudíž minimálně dva týdny. Na nreferenční karty se asi vyplatí počkat zejména pokud chcete velmi tiché chlazení, dle testů je ten referenční spíše průmerný, byť teploty úspěšně drží někdo kolo 80 stupňů.

 

 

Jelikož nemáme vlastní recenzi, budeme vás muset odkázat na výsledky, které mají v den vvypuštění dostupné renomované zahraniční weby. A to například The Tech Report, německy ComputerBase, či PC Perspective, podle nějž je RX 480 rychlejší nebo stejně rychlý jako GeForce GTX 970 ve všech stestovaných hrách kromě GTA V, kde se údajně objevují problémy, které by mohla opravovat aktualizace ovladače. GCN obecně a také Polaris má zdá se  náskok spíše v DirectX 12 (Hitman, AotS, někdy značný), které mu zdá se sedí lépe, než Maxwellu. AnandTech má zatím jen preview, dle kterého se také po zprůměrování z více her RX 480 dostavá o pár procent před GeForce GTX 970 a Radeon R9 390. Na tomto výkonnostní hodnocení (alespoň s první verzí ovladačů) se testy více méně shodují. Hlavní přínos karty je tak asi třeba vidět v tom, že tuto úroveň výkonu přináší o cenovou třídu níže a výkonnostní nárůst proti GTX 960 nebo R9 380X už je velmi velký.

 

Radeon RX 480 (PCOnline)
Polaris 10 v Radeonu RX 480 (PCOnline)

Zdroje: AMD

Radeon RX 480 je venku. Bude nejvýhodnější grafikou FinFETové generace?

Ohodnoťte tento článek!
5 (100%) 1 hlas/ů