Zač je toho Pascal: Uvedení GeForce GTX 1080 je tady, vše odhaleno

0

Jak bylo avizováno, dnes vypršelo NDA (tedy smluvní informační embargo) na první 16nm GPU Nvidia a na něm založenou grafickou kartu GeForce GTX 1080, která se stane nejrychlejším herním tahounem architektonické generace Pascal. Část specifikací již Nvidia prozradila při odhalení čipu GP104, na to tedy nyní navážeme a přidáme zbývající informace.

GeForce GTX 1080 s referenčním chladičem
GeForce GTX 1080 s referenčním chladičem   

 

Kompletní specifikace GP104

Nejprve k samotnému čipu. GPU o rozměru 314 mm² obsahuje 7,2 miliardy tranzistorů a varianta GP104-400 použitá v kartě GTX 1080 má aktivních všech 2560 stream procesorů. Ty jsou rozděleny do čtyř bloků GPC (Graphics Processing Cluster) po 640 shaderech, GPC je zas rozdělen na pět SM (Streaming Multiprocessor) a konečně každý SM je rozdělen na dva bloky po 64 shaderech. Zde je rozdíl proti GP100, kde je v každém SM jen jeden blok s 64 shadery. Po čipu je je celkem rozloženo 160 texturovacích jednotek (osm na každý SM) a 64 rasterizačních jednotek (ROP), tedy stejný počet jako v GM204, zatímco GM200 jich mělo 96.

Schéma čipu GP104
Schéma čipu GP104

Takt GPU je v základu 1607 MHz, frekvence Boostu je 1733 MHz; GPU tedy bude po výkonu sahat zejména díky nebývale vysoké frekvenci. Nvidia pro GTX 1080 uvádí teoretický výkon ve výpočtech s jednoduchou přesností 8,2 TFLOPS. Jaký je výkon v přesnosti dvojité (FP64), uvedeno není, nejspíše však bude na 1/32 (jinými slovy nízký, okolo 250 GFLOPS?). Nikde není zmínka o tom, že by toto GPU jako GP100 podporovalo také poloviční přesnost FP16.

Paměťový subsystém tvoří 256bitová sběrnice, u GTX 1080 obsluhující 8 GB paměti GDDR5X na efektivním taktu 10,0 GHz (skutečný takt je jen 1250 MHz, jako u 5,0GHz GDDR5). Karta má s touto pamětí surovou teoretickou propustnost 320 GB/s. Nvidia ovšem uvádí, že proti Maxwellu je v GP104 použita účinnější delta komprese dat, což může využitelné pásmo efektivně zvětšit ještě až o další pětinu.

Celá karta má TDP 180 W a je napájena jedním osmipinovým konektorem PCI Express. Chlazení referenčních karet se podobá tomu, které již známe ze starších karet, má však nově tvarovaný kryt. Výška je na dva sloty a klasicky je použit radiální ventilátor, ženoucí vzduch skrz vnitřek a záslepkou ven ze skříně. V základně pasivu by pro lepší odvod tepla měla být vapor chamber.    

 

Ohlas ve světě

Jak dobře si referenční karty vedou, si můžete v tuto chvíli již nastudovat v zahraničních recenzích, jichž vyšla celá řada. Viz například v provedení webu PC Perspective, techPowerUp či HardwareCanucks; kupodivu ale například AnandTech stihl zatím jen krátké „preview“ a zatím chybí třeba The Tech Report. Ti, kdož vládnou spíše než anglicky němčinou, mohou zkusit ComputerBase.de (nebo frančtináři Hardware.fr). Pokud si chcete prohlédnout slajdy k uvedení, unikly již předem všechny na VideoCardz. V krátkosti lze říci, že karta je podstatně výkonnější než highend minulé generace – například onen krátký test AnandTechu vypovídá o průměrně zhruba třetinovém (31–32 %) náskoku na GeForce GTX 980 Ti či Radeon R9 Fury X.

 

 

Konečně asynchronní shadery

Tolik tedy ke specifikacím a nyní se můžeme podívat na některé nové funkce a zlepšení, které Pascal či toto konkrétní GPU přináší nad rámec svých základních „čísel“. První z vylepšení by mělo spočívat v implementaci asynchronně prováděných výpočetních shaderů, tedy aspektu, v kterém Maxwell ztrácel výkon proti architektuře GCN od AMD. V Pascalu by zřejmě tato technika již měla být využitelná pro současně prováděné grafické a výpočetní operace.

Asynchronous Compute
Asynchronous Compute

Dle Nvidie lze současným počítáním úloh také snížit latenci některých úloh kritických na co nejrychlejší zpracování, což by se mělo hodit například ve VR. Pascal by v grafické pipeline měl podporovat formu multitaskingu (tzv. pixel preemption), takže by měl dokázat přerušit běžící operace kvůli rychlému dokončení nové úlohy s vyšší prioritou.

Pixel Preemption
Pixel Preemption

Implementace těchto (konkurentních) asynchronních operací se asi mezi GCN a Pascalem budou do jisté míry lišit (zatímco Nvidia nyní inzeruje techniku preempce, AMD má paralelní jednotky ACE) a zřejmě bude chvíli trvat, než se nashromáždí dost dat k jejich srovnání. Nvidia by snad nicméně mohla dohnat „áčko“, které v této disciplíně měla s Maxwellem.

Zajímavá je novinka nazvaná Simulataneous Multi-Projection, která by měla využívat specifické funkce Pascalu na úrovni hardwaru. Umožňuje současný výpočet více pohledů na jednu scénu, což by mělo být užitečné ve VR hrách – ve virtuální realitě také Nvidia pro GP104 slibuje největší zvýšení výkonu. Část práce se při použití Simulatenous Multi-Projection pro vícenásobné pohledy nemusí opakovat, čímž se ušetří spotřebovaná výpočetní kapacita.

Simultaneous Multi-Projection
Simultaneous Multi-Projection

 

Po stránce zobrazení bude GTX 1080 podporovat nová vysoká rozlišení umožněná DisplayPortem 1.3/1.4, na nějž je připravena, ačkoliv zřejmě ještě nemá hotovou certifikaci. GPU nadále podporuje až šest výstupů, ovšem jen čtyři smějí být aktivní naráz. Maximální rozlišení je 7680 × 4320 bodů, avšak k tomu potřebujete dva kabely DP 1.3, běžné maximum je zřejmě 5K (5120 × 2880 bodů).

S Pascalem také Nvidia přichází s novou funkcí FastSync, což je nový způsob obnovování obrazovky. Nepoužívá variabilní frekvenci jako G-Sync či FreeSync, jde o klaiskcé konstantní obnovování, ale na rozdíl od obvkylého způsobu VSync není spjato s enginem hry. Jde podle všeho o něco připomínajícího triple buffering v OpenGL – engine hry vykresluje nezávisle do zásobníku svou maximální rychlostí, není zamčen na maximální frekvenci jako s aktivním VSync. Monitor však ve svých intervalech kreslí vždy jen hotové snímky, tedy poslední dostupný, a nikoliv necelé, takže nedochází k trhání.

Fungování FastSync
Fungování FastSync

 

GP104 hardwarové dekóduje 10bitové i 12bitové HEVC

Samostatnou kapitolou pak jsou multimédia. K tradičnímu H.264 (dekódování i nahrávání v 4K) přibylo dekódování 4K VP9 (až dva proudy při 120 snímích za sekundu a 320 Mb/s). Novinkou je hardwarové dekódování HEVC, a to ve velmi pokročilé podobě. Je podporován profil Main, Main 10 (použitý na Ultra HD BluRay), a také 12bitový Main 12, byť ten asi v praxi moc využíván nebude. V případě 8bitového HEVC by dokonce měl čip zvládat dekódování v rozlišení 8K, byť jen při 30 snímcích za sekundu. Pro Main 10 a Main 12 limity neznáme, budou však patrně méně štědré. Co je ještě překvapivější, je podpora enkódování HEVC v profilu Main 10.

Přehled schopností multimediální akcelerace
Přehled schopností multimediální akcelerace

Nvidia pro něj totiž má své využití – tento 10bitový režim bude sloužit pro zachytávání a streamování her s HDR obrazem – tedy s vysokým dynamickým rozsahem. Bude tak možné hrát v HDR kvalitě na televizi skrze konzoli Shield a technologii GameStream (tedy pokud vám nevadí kompresní artefakty). HDR zobrazení pro hry je další z novinek, které Nvidia pro Pascal přichystala, následujíc v tom AMD, které HDR pro Radeony Polaris (ale také současnou 28nm řadu 300/Fury) ohlásilo již před časem. První HDR tituly by se podle něj prý měly objevit v roce 2017.

GeForce GTX 1080 podporuje HDR obraz
GeForce GTX 1080 podporuje HDR obraz

 

Už jen dvojité SLI

Zatímco tyto funkce byly přidány, je zde i jedna ztráta. Nvidia uvádí, že podporuje jen SLI dvou karet a vícenásobné „nepodporuje“. S novými HBI SLI můstky ani nic jiného zrealizovat nepůjde. Ovšem se starými lze karty fyzicky propojit i do třícestné či čtyřcestné konfigurace. Problém je, že vám toto nebude automaticky fungovat v ovladačích. Nvidia totiž zřejmě nechce investovat čas do podpory konfigurací, které využije naprosté minimum lidí. Více karet se má dát zprovoznit jen bizarní oklikou. Údajně se budete muset registrovat na webu a požádat o klíč „enthusiast key“. Tento kód vám pak má v ovladačích SLI ×4/×3 polooficiálně zprovoznit. Web PC Perspective to hodnotí tak, že jde zřejmě o pokus uživatele od těchto spádů pomalu odradit. Eventuálně tedy možná Nvidia zatěžující podporu tří a více karet zařízne zcela.

HB SLI můstek pro GeForce GTX 1080 (Zdroj: VideoCardz)
HB SLI můstek pro GeForce GTX 1080 (Zdroj: VideoCardz)

 

Pro nejrychlejší vysokohorská přirážka

Co se týče dostupnosti a ceny karet, tato informace byla již známa. Oficiální cena je 599 dolarů, což momentálně odpovídá 17 300 Kč, a dostupnost má nastat příští pátek, 27. května. Ovšem tato oficiální cena se týká jen nereferenčních modelů, které hned na počátku dostupné nebudou.

Pokud budete chtít kartu hned v prvních týdnech prodejů, bude podle všeho vaší jedinou možností referenční karta. Ta má však nezvykle cenu nastavenou výš, rovnou na 699 $ (a Nvidia ji nyní raději označuje jako „Founders Edition“). To vychází na 20 200 Kč, takže nedočkavci si budou muset připlatit asi tři tisíce. Za jak dlouho budou dostupné nereferenční karty, není v tuto chvíli známo, jejich chlazení však bývá obvykle účinnější i tišší, což je další dobrý důvod, proč počkat.

Zdroje: PC Perspective, VideoCardz