Unikly další detaily Turingu. 8K, lepší komprese paměti, GeForce RTX 2070 má čip TU106

40

V rámci novinek o přicházejících grafických kartách Nvidia GeForce RTX s čipy architektury Turing jsme tu už dnes měli zprávu o tom, že se mírně pozdrží jejich recenze, jelikož zdá se vázne zásobování médií vzorky hardwaru. Současně se na webu VideoCardz ale objevila ještě jedna věc, která stojí za pozornost. A to informace ze zatím nezveřejněné prezentace Turingu o nových vlastnostech této architektury a o čipech, z nichž budou karty GeForce RTX tvořené.

V prezentaci se mluví o některých věcech, které už prosákly, nebo je Nvidia sama nakousla. Sem patří to, že Turingy budou podporovat připojení monitorů o rozlišení 8K při 60 Hz na rozhraní DisplayPort 1.4a. Ale stále to nejspíš bude potřebovat buď dva kabely nebo kompresi DSC kvůli přenosové kapacitě. Turing takovéto obrazovky utáhne dvě najednou. V rozlišení 8K má také GPU být schopno dekódovat nebo enkódovat video, enkodér má zvládnout dva 8K streamy v HEVC při 30 fps. Dekodér bude podporovat 8K ve formátech HEVC, H.264 (VP9 není úplně jasné). U VP9 a HEVC je podporována 10 a 12 bitová hloubka s HDR, u HEVC snad i vzorkování YUV 4:4:4.

Mesh shadery, variable rate shading

Pokud jde o výpočetní jednotky, hlavní změnou je unifikování L1 cache shaderů a přidání separátních ALU pro celočíselné operace, o čemž už také víme. Podle Nvidie prý nová celočíselná ALU může zvednou výkon floating point operací až o 36 % tím, že celočíselné operace přestanou zabírat primární FP jednotku v shaderu.

Schéma jednoho bloku SM se shadery, RT a tensor jádry u architektury Nvidia Turing (Zdroj: VideoCardz)
Schéma jednoho bloku SM se shadery, RT a tensor jádry u architektury Nvidia Turing (Zdroj: VideoCardz)

Turing má podporovat nový model shaderového programu pojmenovaný Mesh shader, který bude fungovat na vertexech, teselaci i výpočtech geometrie (jako u geometry shaderů). Má to dovolit zpracovat více objektů na scéně. Zda jde o něco podobného jako o Primitive shader u GPU Vega, nebo něco jiného, zatím těžko soudit.

Už v první prezentaci Turingu se objevila zmínka o Variable Rate Shading. Tato technika je zřejmě koncepčně podobná foveated renderingu. Jde o funkci, s kterou vývojář hry může ovládat kvalitu/množství shader efektů, které se budou aplikovat v určité oblasti obrazu. Redukcí těchto výpočtů se ušetří výkon (za cenu horší kvality obrazu), což by se dalo využít třeba ve VR pro vykreslování periferních částí obrazu. S VR souvisí i další vylepšení – Multi-View Rendering (MVR). Toto umožňuje výstup více úhlů pohledu na vypočítávanou scénu v jednom průchodu. Jde o rozšíření techniky Single Pass Stereo u Pascalů na více jak dva pohledy.

PCB karty GeForce RTX 2080 s čipem TU104 (Zdroj: Chiphell)
PCB karty GeForce RTX 2080 s čipem TU104 (Zdroj: Chiphell)

Turing má opět vylepšenou kompresi pamětí

GPU Maxwell a Pascal hodně těžila z barevné komprese dat v paměti. Je proto hodně zajímavé, že v Turingu má být tento aspekt ještě vylepšen. Lepší komprese v Turingu prý dokáže efektivně poskytnout jádrům až o 50 % více paměťové propustnosti (zřejmě se stejnou frekvencí a šířkou pamětí) než na Pascalu. Toto číslo by ale asi mohlo být výsledkem ve speciálních případech, kdy jsou barevný data pixelů příhodně komprimovatelná. U Pascalu už totiž byla komprese hodně dobrá a tím pádem by logicky mělo být těžké kompresní poměr dál dramaticky zvyšovat. Jde o bezeztrátovou kompresi, takže její účinnost má také určité „fyzikální“ limity. Asi bychom tedy měli čekat, že průměrné zlepšení pravděpodobně bude nižší než těch 50 %.

Pro pořádek připomeňme, že bezeztrátová komprese se týká dat ve framebufferu, tedy barev pixelů, s nimiž GPU pracuje. Textury uložené v paměti jsou oproti tomu předem komprimované ztrátovými algoritmy a tato bezeztrátová komprese na ně už tedy aplikována není. Podobně by komprese neměla ovlivňovat obecné výpočty běžící na GPU.

Tři čipy: TU102, TU104 a TU106

VideoCardz odhalil, že Nvidia přichystala minimálně tři čipy Turing. První dva už známe. TU102 je čip v GeForce RTX 2080 Ti, který má plochu 754 mm² a 18,6 miliardy tranzistorů. Obsahuje 4608 shaderů, 96 ROP, 288 texturovacích jednotek, 6MB L2 cache a 384bitovou sběrnici pamětí GDDR6. Čip má 576 tensor cores a 72 RT cores pro ray tracing, skládá se celkově z šesti GPC. GPU má mít dvě linky NVLink pro SLI, ale podporováno bude jen propojení dvou karet.

Schéma GPU Nvidia TU102 (Zdroj: VideoCardz)
Schéma GPU Nvidia TU102 (Zdroj: VideoCardz)

Také TU104 se skládá z šesti GPC, ale v každém je o třetinu méně shaderů, celkem tedy 3072. Tensor jader je 384, RT jader 48, ROP 64 a texturovacích jednotek 192, sběrnice je 256bitová a L2 cache 4MB. Až na použití šesti GPC místo čtyř jde tedy skoro přesně o dvě třetiny čipu TU102. Plocha je s 13,6 miliardami tranzistorů 545 mm². Toto GPU má jen jednu linku NVLink pro SLI.

Schéma GPU Nvidia TU104 (Zdroj: VideoCardz)
Schéma GPU Nvidia TU104 (Zdroj: VideoCardz)

Zcela nová informace je, že GeForce RTX 2070 nebude tvořena osekaným čipem TU104, ale vlastním GPU označeným TU106. To by implikovalo mainstream (GTX 960/1060), ale jde stále o hodně velký čip – s 10,6 miliardami tranzistorů zabírá 446 mm². Stále tak jde spíš o highendové GPU, čemuž ale ostatně odpovídá i cena karty GeForce RTX 2070. Je ještě třeba dodat, že v modelu RTX 2070 bude toto GPU neosekané v plné síle, na rozdíl od TU102/104 v kartách RTX 2080/2080 Ti. Na druhou stranu nebude mít vůbec konektivitu NVLink pro SLI.

Schéma GPU Nvidia TU106 (Zdroj: VideoCardz)
Schéma GPU Nvidia TU106 (Zdroj: VideoCardz)

TU106 obsahuje jen tři GPC a 2304 shaderů, 144 texturovacíh jednotek, 288 tensor cores a 36 RT cores. To z něj dělá do značné míry polovinu čipu TU102. Ovšem paměťový subsystém je stejný jako u GPU TU104 – 256bitová sběrnice, 64 ROP, 4MB L2 cache. Výkon mezi GeForce RTX 2070 a RTX 2080 proto asi nebude škálovat právě lineárně. Levnější model bude mít stejný či podobný výkon pamětí, ale výrazně méně hrubé síly. Všechna tři GPU jsou jinak vyráběna na procesu 12FFN, což by měla být stejná pro Nvidii optimalizovaná varianta 12nm procesu TSMC, jaká byla použita pro čipy Volta.

VideoCardz publikoval i schémata těchto čipů, která můžete vidět výš. Ta údajně ale nejsou přímo původní z prezentace. Byla zeditovaná, ale měla by prý sedět s tím, co publikuje Nvidia.

Unikly další detaily Turingu. 8K, lepší komprese paměti, GeForce RTX 2070 má čip TU106

Ohodnoťte tento článek!
4.8 (95%) 20 hlas/ů

40 KOMENTÁŘE

    • Maudit
      2060 podle me mit RT nebude… jestli to 1080Ti zvládá tak tak… potom k čemu by to měla o mnoho slabší grafika… jako aby to jelo na 5FPS? Je fajn a zajímavé, že s tím někdo přišel, ale tak jako vždy… tuto technologii budou líp zvládat až následující generace. Momentálně pojem ladění ve hrách bude znamenat snižování kvality aby to v pohodě jelo. Takže jako . zajimavost určitě ano, ale grafiku bych primárně používat bez RT. Z tohoto pohledu budou zajímavé až 7nm grafiky. Pokud to bude využitelné v nějakém 3D modelovacím programu tak to bude bomba!

        • Tak prej ne, toho 19.9 prej odlozej recenze a uvedeni na 21.9, potom na 23.9, potom na 27.9 a potom …..

          Ne, tos to vubec nepochopil, to bude dynamicky RT pro vsechny jednotne na 1080p/60FPS.
          Akorat na RTX2080Ti poslou jeden paprsek na na centimetr sceny, na RTX2080 poslou jeden paprsek na 5cm sceny a na RTX2070 poslou jeden paprsek. Pak to pobezi ok. 😀

            • no moc ho zatim nepomijis. kdyby ti byl turing skutecne ukradenej, tak se tak nesnazis. prakticky pod kazdym clankem na skoro kazdym ceksym webu ..

          • Hehe, Redmarx to trochu hrotí, ale princip popsal správně. Nižší modely budou raytracovat s použitím míň paprsků a tím pádem větší nepřesností, je to zcela logické.

            Nižší řady pod RTX 2070 mít RT nebudou, nedává to u nich smysl a i proto NV váhá s jejich konečným označením (RTX/GTX). Nepřímo to i potvrdila CFO Nvidie větou „We’ll start with the ray-tracing cards. We have the 2080 Ti, the 2080 and the 2070 overall coming to market,“

            Maudit je opět mimo, žijící ve svém zeleném snu.
            #stopfanatismu
            https://cs.wikipedia.org/wiki/Fanatismus

            • Copak Hnido, jsi poslední dobou zalezlej a necháváš tu ztrapňovat se jen tvého miláčka Maudita. 😀 Asi pilně studuješ prezentace Nvidie co máš otevřené na svém zeleném oltáři. 😀

              Už vydrž jen pár dnů na recenze… pak tě i s tvým pobočníkem rozeberu na atomy. 😀

            • Aznohh
              A nebo se chlapec s nickem hnizdo snaží pořád vehementně najít ty místa kde mám být všude zabanovaný jak tvrdí případně hledá to kde mám těm lidem sprostě nadávat a urážet je a pod 🙂 Jak opět tvrdí 🙂

              Tak co hnizdo kde mám to obrovské vlákno které Ti nedělá problém postnout? 🙂 A pak kdo je tu prokazatelný lhář 😉 😀

            • Ale jen klidne rozebirej, rozebirej i se svym pobocnikem troubelinem co ti libo, ja budu tou dobou parit na svoji 2080Ti 😀 To je jedine co vam fanAtikum zbyde – rozebirat 😉

            • Koukám že máte s Mauditkem i stejný přístup… 😀 jak někdo nesouhlasí, hned je vaší partnerskou dvojicí osočen z AMD fanouškovství. To už je chlapci taková vaše nudná klasika. 😀 😀

        • Může.
          Na druhou stranu, když už má Turing docela pozměněnou i architekturu standardních rasterizačních shaderů – CUDA cores – tak bych spíš čekal, že udělají TU107/108 úplně bez RT a Tensor cores, ale poměr CUDA cores oproti TU102 bude podobný jako GP102 a GP106, označení je naprosto podružné. U Pascal refreshe by přišli o výkoností bonus, který by ty výkonnější CUDA měly dá do IPC.

          Na druhou stranu třeba vůbec nedělali návrh Turing čipů bez RT, takže to ten Pascal refresh bude….na 12nm by i bez IPC bonusu mohli mohli díky absenci RT a Tensor narvat na malý čip dost CUDA jak píšeš.
          Uvidíme.

          A to, že je pro RTX 2070 specielní čip na rozdíl od GTX 1080/1070 může být dané tím, že se jim víc vyplatí dělat zvlášť menší jádra bez NVLink přípravy, zvláště když na 12nm by teď mohla být opravdu dobrá výtěžnost a RTX 2080 bude mít stejně lehce ořízlé GPU, takže lehce nepovedené čipy ještě půjde použít a větší množství vadných se asi nečeká.

        • To se ti zda jen proto, ze o situaci neuvazujes, ale fandis.
          Ja jsem sice take vzdy fandil, ale zaroven i uvazuju a je zrejme, ze raytracing pri soucasnem vykonu grafik nedava smysl.
          Takze v cene grafiky platis navic zbytecny kremik, ktery tam nemusel byt, platis mirne zvysenou spotrebu energie a platis NVidii, aby ta mohla zaplatit vyvojarum za implementaci raytracingu, protoze dobrovolne to zadny herni vyvojar nebude integrovat, kdyz to temer nikdo nevyuzije.

          Me samozrejme nastvalo, ze je Turing tak nepovedeny a ze jsem nemusel setrit a cekat na grafiku, ktera nic neprinasi, ale mohl jsem si uz driv koupit starsi generaci, ktera je o poznani lepsi.

          • Ked si odmyslim ten balast okolo typu „nepovedeny“, „platim zbytocne za“, „vyvojarom“, „nedava smysl“, „mierne zvysena spotreba“ ostane mi proste to, ze nanho nemas peniaze a to ta sere. 😉 Tiez si Turinga nekupim, pretoze je drahy, multi-gpu najskor nefunguje a v podstate ho ani nepotrebujem, pac stale marne cakam na 30″ 5k monitor, ale to neznamena, ze kvoli tomu musim hysacit pod kazdym forom o nom. Ostatne… „vote with your wallet“. Ak ho fakt nikto kupovat nebude, NV bude musiet zlacnovat. Ale to prilis nehrozi a to je to, co ta v skutocnosti sere. 😛

    • Tak ono ty jsi s GTX1080 v pohode, ja uz ted taky, ale narozdil od tebe jsem vytocenej, ze jsem si ji mohl koupit driv. Taky za dva roky na 7nm uz budes mit snad nasetreno na novou grafiku, kdyz jsi mel tolik let cas. Ja budu mit tou dobou tu grafiku jenom dva roky, tak mi bude lito zase davat dalsi penize do nove 7nm, ktera skutecne posune vykon a nebude to snad jen nejakej marketingovej ulet, jako to co NVidia predvadi ted. Taky snad na tech 7nm predvede neco i AMD a budu si moct vybrat tu, ktera nabidne lepsi cenovy pomer s vykonem.

      • Než ti slevní 7nm na tvou cenovou úroveň tak to bude tak 5 let od teď. Takže neboj, to ti ještě nějakej pátek vydrží gtx1080. Když by přišla nějaká brutálně neoptimalizovaná hra s nemožností vypnout raytracing, tak snížíš rozlišení na FHD a pojedeš dál. To není AMD aby to žralo, topilo a sekalo se to. Já na nic šetřit nemusím, klidně bych si teď mohl koupit Titana, ale proč bych to dělal? Se svým Skylake vůbec nemusím přezbrojovat, protože pořád utáhne gtx1080 bezproblému a navíc na Win7 na kterých i pracuju. No a třeba časem uvidím co přinese IceLake a refresh IceLake a refresh refreshnutýho IceLake a třeba si to pořídím a k tomu novou gtx2080Ti… Nebo třeba půjdou dolů LCOS projektory a koupím si nějakej 4K.