Microsoft odhalil detaily GPU Xboxu Series X a akcelerace ray tracingu v AMD RDNA 2

98

Microsoft prozradil architekturu GPU AMD RDNA 2 včetně toho, jak řeší akceleraci ray tracingu a další zajímavé podrobnosti. Podívali jsme se na to podrobně.

Vedle architektury a parametrů čipů nových grafiky Nvidia Ampere se teď už asi netrpělivě vyhlížejí také podrobnosti o tom, co přinesou a jak budou vypadat konkurenční nové Radeony s architekturou RDNA 2. Tam AMD zatím všechno drží v tajnosti, ale nyní za něj během konference HotChips 32 vyzradil tajemství Microsoft.

Architektura RDNA 2 totiž pohání grafiku v Xboxu Series X a MS prezentoval jeho architekturu, včetně schémat výpočetních jednotek a toho, jak do nich byla přidána akcelerace ray tracingu. Mezi APU v Xboxu a samostatnými GPU by přitom neměly být zásadní rozdíly, takže nám to dává hodně zajímavý vhled do architektury Radeonů RX 6000.

APU v Xboxu Series X

Semicustom čip v konzoli obsahuje osm jader Zen 2 a grafiku se 52 jednotkami CU (respektive 26 Workgroup procesory, které obsahují stejně jako v RDNA 1 každý dvě CU). Z toho vychází 3328 shaderů. Fyzicky je GPU poněkud větší a obsahuje 56 jednotek. To je však jenom rezerva pro vylepšení výtěžnosti, aby se daly použít čipy s defektem v GPU.

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 02 Zdroj: Tom's Hardware

Křemík je vyráběný „enhanced 7nm“ procesem TSMC. Jde asi o vyladění původního procesu N7 (jaký používají Ryzeny 3000, Navi 10/14 a APU Renoir), nikoliv o proces N7P nebo N7+. Na plochu měří 360,4 mm², což je dost, ale ne zas nějak supervýrazně moc (podobná plocha jako u Xboxu One X).

Čip tvořen 15,3 miliardami tranzistorů. Rozměr celého pouzdra, které se pájí na desku 2963 kontakty, je docela velkých 5,25 × 5,25 cm. Podle Microsoftu je cena waferů i cena výsledného čipu na 7nm procesu výrazně vyšší než u předchozích (SoC v Xbox One X na 16 nm).

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 04 Zdroj: Tom's Hardware

Čip má trošku nezvyklou paměťovou sběrnici s 320 bitovou šířkou, na níž je pověšená 14GHz GDDR6, jež dodává propustnost 560 GB/s. Kapacita je 16 GB, kde prvních 10 GB má plnou propustnost pro herní data, dalších 6 GB už jen 192bitovou sběrnici a tím sníženou propustnost (336 GB/s), tato sekce se asi bude používat pro systém/CPU a méně náročné části herních dat.

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 05 Zdroj: Tom's Hardware

Paměť není ovšem vyhrazená jen pro GPU, ale i pro osm jader Zen 2. Ta běží na taktu až 3,8 GHz (má jít o trvalou frekvenci, ne turbo a jsou organizována ve dvou CCX, kde každý obsahuje své 4 MB L3 cache. Procesorová část tedy odpovídá spíše APU Renoir než CPU Ryzenům 3000 Matisse.

GPU architektury RDNA 2

Podle Microsoftu podporuje použitá GPU architektura (RDNA 2) hardwarově feature level DirectX 12.2 a měla by umět celé DirectX 12 Ultimate. Je potvrzený hardwarový ray tracing, podpora Mesh Shaders with geometrickém enginu i funkce Sampler Feedback. Tu konzole využívá k lepšímu využití paměti, protože může načítat z SSD části textur selektivně dle jejich využití/nevyužití.

Tip: DirectX 12 Ultimate: Přichází nová generace herní grafiky. Co přináší a jaká GPU ji umí?

Variable Rate Shading je také podporován. Microsoft zmiňuje, že s podporou faktorů 1×1, 1×2/2×1 a 2×2. Zdá se, že nejsou podporovány tak vysoké faktory redukce jako u Nvidie (u Turingu se uváděl i shading v blocích 4×2/2×4 a 4×4).

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 17 Zdroj: Tom's Hardware

Compute Unit architektury RDNA 2

Základní schéma architektury se hodně podobá tomu, jak vypadá RDNA 1 – GPU používá CU (Compute Unit) o 64 shaderech, přičemž CU je rozdělena na dvě SIMD32 poloviny obsahují 32 shaderů (ALU).

Stejně jako u první generace Navi není už jedna celá CU úplně základním stavebním blokem, tím je tzv. Workgroup Processor s dvěma CU (Microsoft pro něj ale používá označení Dual Compute Unit), které sdílejí jednu instrukční L1 cache a paměť pro sdílená data.

Tip: Popis GPU architektury RDNA 1/Navi 10 z roku 2019

Jedna CU má kromě 2×32 shaderů, na nichž lze tedy za takt zpracovat dvě vektorové (SIMD32) operace za cyklus, ještě dvě skalární ALU, takže lze současně také zpracovat dvě skalární operace na CU a cyklus. Dvě skalární jednotky na CU jsou stejný počet jako u RDNA 1. Load/store lze zřejmě provést jen jedno za cyklus/na CU. Vektorové operace jinak shadery zvládají také s přesností FP16, kdy je výkon proti standardním hodnotám FP32 dvojnásobný.

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 13 Zdroj: Tom's Hardware

Microsoft jinak uvádí, že jedna CU RDNA 2 má proti CU předchozí generace při stejném taktu asi o 25 % vyšší výkon. Ovšem pozor, toto asi není srovnání RDNA versus RDNA 2, ale RDNA 2 proti architektuře GCN v Xboxu One X, protože RDNA 1 Microsoft nepoužil.

5MB L2, 64× ROP

GPU Xboxu Series X má větší L2 cache než v čipech RDNA 1 – rovnou 5 MB proti 4 MB u Navi 10. Toto ovšem je zvětšení úměrné počtu shaderů v čipu (ze 40 CU zvýšení na 52), takže asi nelze očekávat nějaký dopad na „IPC“. GPU má 64 rasterizačních jednotek (ROP), zde tedy pořád AMD zůstává na svých předchozích maximech (128 ROP zatím myslím žádné GPU nemělo, podobně jako zatím žádný čip od AMD neprolomil limit 64 CU/4096 shaderů).

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 12 Zdroj: Tom's Hardware

Akcelerace ray tracingu

A tím se dostáváme k novince, která vás asi zajímá nejvíc. Hardwarová akcelerace ray tracingu je v RDNA 2 realizována speciálními jednotkami, v podstatě dle očekávání (spekulace, že by AMD nějak používalo jen generické ALU shaderů, nedávaly moc smysl, respektive by to nebylo dobré řešení, pokud by se trefily).

RDNA 2 má pro zpracování ray tracingových efektů (DXR či „RTX“ v označení Nvidie) jednotky označené v prezentaci MS jako Ray Acceleratory, i když je možné, že AMD jim bude říkat ještě trochu jinak, až vydá samostatná GPU. Ray Accelerator je integrován na úrovni jednoho bloku CU, stejně jako texturovací jednotky. Není úplně jasné, zda je přítomen jen jeden na CU nebo více kusů.

Ray Accelerator funguje zdá se prakticky stejně jako RT jádro Nvidie. Akceleruje hledání průsečíku paprsku světla s objekty scény. Respektive, nejprve hledá průsečíky s boxy v stromu tzv. Bounding Volume Hierarchy, což je neviditelná pomocná struktura obalující objekty na scéně a hierarchickou eliminací usnadňující analýzu (viz článek o architektuře Turingu, kde jsme to vysvětlovali).

Metoda BVH analyzuje průniky/interakce paprsků a objektů na scéně hierarchicky pomocí tzv. bounding volume boxů, až nakonec se hledá průsečík přímo s trjúhelníkem jen v rámci nejmenšího BVH boxu (Zdroj: Nvidia)

Když se strom BVH proanalyzuje až k průsečíku s nejmenším Bounding Volume boxy v hierarchii, začne Ray Accelerator hledat průsečík už rovnou s konkrétními trojúhelníky objektu. Tento sled operací by měl být iniciován shadery a po nalezení průsečíku se výsledek shaderům vrátí, takže ty pak dokončí výpočet bodu, o který se jednalo.

Je možné, že zde budou nějaké odlišnosti ve schopnostech a omezeních proti Nvidii, ale princip akcelerace je zdá se stejný. Tato analýza běží paralelně s jinými výpočty na shaderech, neblokuje tedy GPU od jiné práce.

Výkon 3× až 10× lepší než jen s shaderovými výpočty

Výkon Ray Acceleratorů od AMD versus RT jader od Nvidie zatím nemůžeme nijak porovnat. Nvidia sice uvádí, kolik GPU mohou zpracovat „giga paprsků za sekundu“, ale tato čísla asi nejsou srovnatelná s tím, co uvádí AMD/MS kvůli odlišným metodikám. Microsoft například říká, že Xbox Series X má špičkově či teoreticky zvládat až 380 miliard operací hledání průsečíků s BVH boxy a 95 miliard operací hledání průsečíku s trojúhelníkem polygonu (tyto operace mají tedy zdá se čtvrtinový výkon).

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 26 Zdroj: Tom's Hardware

Jestli to nakonec bude rychlejší nebo pomalejší než u Turingu, to netušíme. Výkon v praxi není určen jen touto výpočetní kapacitou, ale i omezeními danými propustností paměti a tím kolik boxů musí analýza projít od kolika trojúhelníků se jeden paprsek odrazí nebo je protne.

Podle prezentace Microsoftu nejsou Ray Acceleratory na čipu příliš velké (plocha zabraná navíc je „minor“, takže nejspíš pod 10 % z celé grafické části, které je sama jen částí čipu). Ovšem při této relativně menší investici údajně akcelerátory zvyšují výkon ray tracingových efektů 3–10× proti hypotetické situaci, kdy by je počítaly čistě shadery. To je asi řádově podobné jako u Nvidie (podle toho, jaký výkon mají v ray tracingu karty Pascal proti Turingu).

Ray tracing v Xboxu Series X bude mít roli specifálního efektu nad rasterizačním základem

Ray tracingová grafika jinak v Xboxu Series X nemá být „hlavním chlebem“. Používána bude klasicky rasterizace a ray tracing poslouží jen pro efekty tvořící nadstavbu nad ní. Toto je ovšem stejné i u současných DXR her po PC.

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 25 Zdroj: Tom's Hardware

Strategie Microsoftu je údajně taková, že DXR efekty mají s relativně malými („ekonomicky efektivními“) náklady zlepšit vizuální kvalitu klasického rasterizačního vykreslování. Ale ne ho úplně nahradit.

Pro akceleraci AI ale Xbox/RDNA 2 speciální jádra/ASIC bloky nemá

Naopak nějakou obdobu tensor jader Nvidie, tedy speciálních akcelerátorů pro výpočty neuronových sítí (maticové operace), zdá se RDNA 2 nepřináší. Microsoft uvádí, že GPU má nějakou formu akcelerace pro inferenci neuronových sítí, která se využije pro AI nepřítel/postav nebo třeba „škálování rozlišení“ (upscaling – nepředstavujte si ale hned DLSS, upscaling pomocí neuronové sítě může být i jednodušší a je to nápad mnohem starší).

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 27 Zdroj: Tom's Hardware

Podle starších informací se zde ale zřejmě nejedná o použití samostatného ASIC akcelerátoru jako jsou tensor jádra Nvidie, měly by být použité standardně shadery grafiky, ovšem údajně s operacemi nad celočíselnými hodnotami INT4 či INT8, které dávají 4× nebo 8× vyšší výkon než FP32 (49/97 TOPS proti 12 TFLOPS základního výkonu GPU v FP32).

To by celkem odpovídalo údaji Microsoftu z prezentace na HotChips, dle nějž má zmíněná akcelerace AI asi 3× až 10× lepší výkon než běžný hardware, s jen velmi drobnou cenou v ploše/počtu tranzistorů. Podpora INT4 a INT8 výpočtů byla poprvé v GPU Vega 20, architektura RDNA 2 tedy zřejmě toto přebrala.

Další akcelerátory už od MS

Zatímco pro AI nějaké ASIC akcelerátory použité nejsou, APU bude mít akcelerátor MSP pro dekompresi textur načítaných ze SSD (to je připojené přes PCI Express 4.0 ×2), Microsoft má algoritmus, který prý bezeztrátově zmenší textury ve formátu BCn na disku až o 50 %. Rychlost dekomprese je přes 6 GB/s, akcelerovaná je i dekomprese Deflate/Zlib.

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 10 Zdroj: Tom's Hardware

Stejně tak je integrovaná akcelerace kryptografie a hashování (obojí má propustnost přes 5 GB/s) a SoC má i různé bezpečnostní funkce.

Speciální akceleraci dostalo také audio. Microsoft bude používat formát Opus a akcelerátor MOVAD ho dokáže dekódovat 300× rychleji než v reálném čase. Současně také poskytuje velmi výkonou akceleraci pro konverzi vzorkovací konverze s vysokou kvalitou. 300× reálné rychlosti bude dávat také akcelerátor Logan dekódující XMA audio a provádějící pomocí čtyř DSP další audio efekty.

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 08 Zdroj: Tom's Hardware

Třetí audio akcelerátor CFPU2 obsahuje 2×4 floating-point SIMD DSP a 4× FPU pro programovatelné filtrování zvuku, FFT, ozvěny a 3D audio efekty. Všechny tyto speciální jednotky mají uvolnit velké množství výkonu CPU pro jiné účely. Všechny tyto pomocné jednotky jsou již ale vlastní IP Microsoftu, nebudou tedy součástí samostatných Radeonů RX 6000.

Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32 strana 03 Zdroj: Tom's Hardware

Galerie: Prezentace APU Arden v konzoli Xbox Series X a architektury GPU AMD RDNA 2 na HotChips 32

Nadějný příslib pro samostatné Radeony?

Implementace GPU architektury v APU Xboxu Series X (čip má prý kódové označení Arden) vypadá tedy zatím dobře. Výkon GPU má být 12 TFLOPS v jednoduché přesnosti, výkon geometrie 7,3 miliard trojúhelníků za sekundu a výkon rasterizace 116 miliard bodů za sekundu (texely/s uvedené nejsou, ale jedna CU má 4 TMU jako dříve).

To je při taktu 1825 MHz, na němž by grafika měla běžet. Vypadá to, že by spotřeba nemusela současně být moc vysoká, snad odpovídající Xboxu One X. Toto má implikace pro výkon, který by AMD mohlo dosáhnout u samostatného GPU se stejnou architekturou RDNA 2. Ovšem raději bych zde neprováděl žádné výpočty a extrapolace, nepřesnost/míra nejistoty je pro užitečné odhady příliš velká.

Kdo tipujete, že bude mít nejlepší akceleraci (výkon) hardwarového ray tracingu?

Nicméně AMD by mělo být být schopné vyškálovat výkon výš použitím širší sběrnice (aspoň 384 bitů by mělo být možných, pokud už se nepotvrdí drby o 512 bitech, které ale nejsou z těch nejověřenějších zdrojů), více jednotek CU a vyššího TDP (250–300 W). Kolik výkonu se tím ale přesně získá a jak si nakonec takové GPU povede proti top GeForce RTX 2080 Ti a novým GeForce RTX 3000 generace Ampere, to je něco, kde asi bude lepší počkat a nehádat.

Zdroje: Tom’s Hardware, AnandTech

Microsoft odhalil detaily GPU Xboxu Series X a akcelerace ray tracingu v AMD RDNA 2
Ohodnoťte tento článek!
4.7 (93.33%) 18 hlas/ů

98 KOMENTÁŘE

  1. Stve me to zamenovani DXR a RTX, pritom RTX je jen implementaci DXR od NVidie, takze bych navrhoval pouzivat jen zkratku DXR. Nic proti autorovi, clanek je super shrnuti, co vsechno novy Xbox bude mit. Prekvapil open-source format OPUS, ikdyz je to pochopitelne, protoze kvalita a MS chce mit konzoli nadupanou tim nejlepsim.

    Jenze ekonomika projektu je neuprosna a v teto souvislosti se musim smat nad debilnima kecama nekterych vyvojaru, ze nektere nove hry na PC nebudou verze z next-gen konzoli, ale stejne jako na tech starych konzolich. A ze je to z duvodu vykonu, protoze tyhle next-gen konzole budou mit minimalne na launch vetsi vykon nez herni PC. No uz z tohoto vidime, ze horko tezko XBX prekona Turing (RTX grafiky) a na Amperu, ktera bude mit launch driv nez nove konzole se to nebude chytat ani v nejmensim.

    Mozna schyzofrenie u AMD, jestli slibili, ze konzole budou mit predvedeni driv nez jejich „next-gen“ grafiky, kdyz NVidia zase vsem vypalila rybnik a bude tu jako prvni.

    • To je spíš o běžném výkonu u zákazníků. Naprostá většina PC hráčů má grafiky do úrovně RTX2060, spíše méně, nové konzole budou mít výkon kolem, RTX2080, přitom budou levnější, než jen samotná tato karta.

      • Pamatuju, ze prvni Far Cry nespustil v plnych detailech skoro nikdo pri vydani hry, presto to udelali. Pokud by se vydavatele zacali ridit tim, co ma vetsina hracu, tak ani ty next-gen hry nemusi vydavat. Ani next-gen konzole si naprosta vetsina stavajicich majitelu konzoli nepobezi koupit okamzite hned na prvni vanoce a da se ocekavat, ze bude minimalne rok mozna spis dva trvat nez se nove konzole dostanou na prodejni cisla tech stavajicich.

        • „Pamatuju, ze prvni Far Cry nespustil v plnych detailech skoro nikdo pri vydani hry, presto to udelali.“ – ano a další díly už tak HW náročné nebyly.. takže sis vlastně sám odpověděl. 😀 Ona ta prodejnost prvního dílu totiž nebyla až tak bombastická, jednoduše HW náročnost část lidí odradí od nákupu hry.

        • Ja jsem zamereny na grafiku pomerne hodne a kdyz neco vypada hnusne, tak to proste nehraji. Vyjimkou jsou fakt extra zabavne hry typu „nibbles“. S hranim na konzolich ale musim rici, ze jsem grafiku vicemene prestal resit, protoze me vzdy ta hra vtahne. A pokud ne, tak to uz nepustim ani kvuli sebelepsi grafice. Treba Detroid: BH jsem proletel za par hodin, ani nevim jak. A o tom ma byt hra primarne. Nevim jestli je to celkove ovladani a gamepad, ale stejny efekt se mi stal jen u her s vysokym obsahem (MMORPG).

    • Výkon nové generace konzolí je známej jak dlouho? Asi tak rok.. ale Redmarx je stále překvapenej. 🙂 Podle Steamu má jen 9% hráčů grafiku, která se vyrovná novým konzolím. Za těch 600 babek získáš vše v jednom bez dalších investic a nebo holou 3070ku se stejným výkonem. Nůžky mezi PCMR a konzolemi se každou novou generaci zavírají vic a víc.. A to ještě opomíjím věci jako např. ten megavýkonný SSD v PS5, který natrhne zadek 99% PCMR diskům.

      • Prozradim ti zvlastni vec, vykon se meri podle hrdla, muzes mit mega vykonnej disk, ale kdyz nemas vykonnou grafiku, nemas nic. 😉
        Jinymi slovy SSD je to posledni, cim se v PC musis zabyvat. Mas-li nabusenou grafiku, mas-li hodne a rychle RAM, nepotrebujes ani rychle NVMe PCIe3 SSD, pricemz ale hodne hracu tyto SSD uz dneska stejne ma.

        Ano, vzdy budou existovat „zoufalci“ hrajici na integrovanych grafikach notebooku. Jenze trh PC je mnohonasobne vetsi, takze i tech 10% hracu s nadupanou grafikou staci.

        • Hele Mr. Obvious, vzhledem k tomu že multiplatformní hry pro novou generaci se šijí na míru těm rychlým NVME diskům v nových konzolích, tak PCMR s pomalýma SSD či nedejbože HDD budou asi dost rozčarováni. 😀

          • HDD bylo rozcarovani uz pred 10 lety, kdy jsem kupoval sve prvni SSD do PC. O tom si tehdy mohli konzolisti nechat jen zdat. 😉

            Na PC si proste hra alokuje potrebna data do RAMky a ta se da vzdycky zvetsit, u konzole bude GPU + CPU sdilet 16GB, na PC mam 32GB a nova grafika bude mit nejspis dalsich 10GB VRAM.

            Jiste zalezi na vyvojari hry, jenze tak to bylo, je a bude. Zrovna jsem se vratil k FF XIII-2, vytezuje to grafiku ve spicce na 45%, prumer je na 25%, procesor hru temer nezaznamenal a flaka se na 10%. RAM ze 3/4 prazdna, SSD o hre temer nevi a stejne se ten port seka na nejakych 25FPS.

            • HDD nemám v PC 10+ let, 32GB RAM mám cca 6 let. Nechápu souvislosti o čem tu točíš…
              O tom právě píšu, že dřív byly konzole značně pozadu za PC, ale ty rozevřené nůžky se stahují. SSD budou mít nové konzole rychlejší, než má většina PCčkářů, grafický výkon někde na úrovni 2080..

              A to vše za stavu, kdy pc dgpu stále zdražují..

            • Rozevřené nůžky se stáhnou vždycky jen v době vydání nové generace. Těch dalších 6 až 8 let než vyjde další generace se pak zas rychle roztahují. Ty konzole budou v reálu výkonově někde kolem RTX 2070 (bez super). Takže jejich výkon bude zastaralý pravděpodobně už teď na podzim.

            • Jak pise Bedrich. A ikdyby to melo vykon RTX2080, o cemz ja pochybuji, tak za 14 dni tu jsou nove grafiky vykonem uplne jinde. 🙂

              Ale konzole nema 32GB RAM a ani ty next-gen mit nebudou. Ze maji nahodou rychle SSD je fakt platne, jak mrtvymu zimnik. Pritom i na PC uz si muzes rychla SSD na PCIe4 uz poridit, jen je to jaksi zatim zbytecne, moc se to vyuzit neda.

              Konzole nikdy nedorovnaji vykon PC, mohly by, ale nemuzou kvuli omezeni prodejni a tim i nakladove ceny.

            • Béda: No, právě že to tak není. Porovnej si PC co byly v době vydání předchozích generací a zjistíš, že PC na tom bylo vždy o dost líp než teď. To, že PC v dalších letech zvyšují výkon je snad jasné, ale ve chvíli kdy se hry dělají multiplatformově a často primárně na konzole, tak se HW nároky stejně optimalizují právě na ty konzole. Jinak 6-8 let je taky demagogie, zapomínáš na PS4 Pro, které vyšlo po třech letech.

              Redmarx: „Ale konzole nema 32GB RAM“ – k čemu proboha? Konzole s diskem kterej hrne 2.4 GB/s resp. 4.8GB/s s HW kompresí a Xbox Velocity Architecture nic takovýho nepotřebuje… je to mimochodem 40x tolik jak Xbox One.

              „Pritom i na PC uz si muzes rychla SSD na PCIe4 uz poridit, jen je to jaksi zatim zbytecne, moc se to vyuzit neda.“
              Ty jsi vůbec nepochopil základní pointu. Ta je v tom, že hry pro PS5/Xbox S X můžou na 100% počítat s tím, že tam ten superrychlej disk je a programovat hru podle toho. Tedy nebrat ohledy na cokoliv pomalejšího, což se teď na PC děje.

            • Aznoh to pise spravne. Vykon PS5 a XOX bude silne nad prumernym dnesnim hernim PC/notebookem. Bude trvat par let, nez se PC hrani zvedne „v prumeru“ aspon na uroven budoucich konzoli.
              Takze o vykon (nedostatecny) konzoli bych nemel nasledujici min 3 roky strach.

            • Take moc nechapu, o cem se tady toci. Koho zajima vykon konzole? Za celou dobu, co hraji na konzolich, me ani jednou nenapadlo merit nejaky vykon. To, co me obcas stvalo byl loading, jenze to se delo i na PC s HDD. Nova generace konzoli, jak uz tu bylo popsano, toto mmj. resi.

            • tombomino:

              „Vykon PS5 a XOX bude silne nad prumernym dnesnim hernim PC/notebookem.“

              Tak pokud se PC scena zacne ridit prumernym hernim notasem typickeho zoufalce. tak muzeme opravdu to PC hrani rovnou zabalit.
              Je proste nesmysl, aby se PC herni segment ridil prumernym rekreacnim hracem, ktery uhraje 2-3 hry do roka. Naopak, u lidi, kteri daji jen za grafiku 15.000 – 35.000 Kc se da ocekavat, ze ji taky budou vyuzivat a nakoupi a budou hrat her mnohem vic.

              Takze ne, vykon XBSEX a PS5 nebude vyssi nez vykon hernich PC, spis bude velmi rychle nizsi jako to nakonec bylo vzdycky.

            • Ano ale kolik těch lidí je? Zrovna ty jsi se tu asi rok prsil, jak koupíš Turing hned jak vyjde a pak když vyšel, tak jsi tu každej den pod článkem brečel, že je drahej a že tě Nvidie zklamala. 😀 Nakonec jsi skončil u bazarovek Pascalu za pár tisíc. 🙂 Tak raději nic nepovídej o grafikách za 35k. 😀

            • @Redmarx
              „Takze ne, vykon XBSEX a PS5 nebude vyssi nez vykon hernich PC,“
              .. ale to jsem preci ani netvrdil. Schvalne jsem pouzil slovo PRUMERNE PC/laptop, protoze to je neco, na co ta hra na PC bude typicky delana, aby na tom jela. Tech par featurek navic, co ti pak zvysi vykonovou narocnost o „50%“ jsou pozlatka navic.
              „pis bude velmi rychle nizsi jako to nakonec bylo vzdycky.“
              .. ano zastara proti PC highendu, ale ne proti PC „prumeru“ aspon v nasledujicich par letech. A to je dost velky rozdil oproti dobe 2013, kdy prisla minula generace na trh. Vzdyt ty konzole meli silne podprumerna CPU i na tehdejsi dobu. Vykon GK nebyl pomalu ani na urovni tehdejsiho prumeru. Minimalne u XBOX teda ne.O nejakem Highendu nemohla byt uz vubec rec.

          • Vzhledem k tomu, že superrychlé NVMe SSD bude mít jen PS5 a ne Xbox Series X, tak se není v PC čeho bát. Na té UE5 prezentaci bylo jasně zmíněno, že ta jejich nová texturovací feature je v současné době zamýšlena pro PS5.

            • Chápeš, že mezigenerační rozdíl v rychlostech je o řád vyšší pro OBĚ konzole?
              Skoro si vzpomínám na klasický soubor SATA SSD vs NVMe, zákon klesajících výnosů je neúprosný. O sekundu rychlejší load time na PS5 bude fakt terno. 🙂

            • Generační skok je parádní oproti PS4 a Xbox One, ale jde o to, že dnešní nová PC mají taky uplně v klidu výkon SSD na úrovni Xbox Series X. Kdežto SSD v PS5 je víc než dvakrát rychlejší.

            • Aznohh 20.8.2020 at 12:39
              PCMR s pomalýma SSD či nedejbože HDD budou asi dost rozčarováni.

              Jak vidíš psal o něčem jiným.. o tom, že když někdo bude mít např. sata ssd nebo nedejbože hdd, tak hra nové generace programovaná na rychlé nvme ssd nových konzolí s tím může mít problém – např. stuttering při dočítání textur apod..

            • Bude se celkove i trochu menit koncept her diky povinnemu NVMe s min. „2.4“. Navrhy levelu se budou delat jinak, nebude potreba napr. „mezisekvence“ pro naloudovani levelu, atd. U PS5 je to jeste vyhnane o level dal.

            • tombomino 20.8.2020 at 19:48
              MS tusim zminovali neco jako „vice pustenych her naraz“. Sony bude mit podle me to same.

      • Jen na okraj, ten supervykonny ssd je tam jen proto, aby suploval nedostatek ram a hlavne vram. Jestli se ted potvrdi vyrazne zvyseni ram v nove generaci gpu a vyrazne navyseni vykonu v dxr, tak budou gondole opet zastarale v den vydani. O nejakem priblizovani gondoli PC muzou gondole peasants dal snit.

        • „hnizdo 9.8.2020 at 11:58
          ja v kazdem pripade do PS5 jdu“
          https://www.cnews.cz/datum-odhaleni-grafik-nvidia-geforce-rtx-3000-ampere/#comment-232505

          Jak říkáš peasante. 😀

          Pro Vram bude vyhorazeno 10GB, že by to byl nějaký bottleneck vzhledem k výše uvedenému (4,8GB/s SSD + Xbox Velocity Architecture /u PS5 ještě víc) to si opravdu nemyslím. 🙂 Naopak si tipnu, že se možná ukáže nová cesta jak hry programovat, že není neustále nutné bobtnat vram.

        • Moje grafarna stala +- trojnasobek toho co bude stat PS5. A ted se pojdme pobavit o mem monitoru asus PG27UQ.
          Takze si fakt nemyslim, ze se ze mne koupi PS5 stane gondole peasant 😀

          Ano, pro vram bude vyhrazeno 10GB, o tom mluvim, nova gpu budou mit 24GB, Mozna se najdou nove cesty jak vylepsit grafiku za asistence velke vram.

          • Tak to jsem asi nepochopil konotaci toho tvého gondole peasanta. Já myslel, že to je pro tebe každej vlastník konzole. Koukám, že ty si to dělíš ještě dle sociálního či finančního postavení. 😀 Hmno hlavně že jsi spokojený. 🙂

            • to si pis ze jsem spokojeny. ze nechapes pojmy jako primarni platforma mne neprekvapuje, ale spis bych rekl ze chapes a jako obvykle jen bezmocne trollis.

            • Bezmocně evidentně ne, když jsi dostal nutkavou potřebu chlubit se tu tím co máš nebo nemáš za hardware.. ale upřímně jsem rád že PS5 kupuješ, těšíme se až se tě budu pravidelně ptát jak se ti hraje na AMD hardwaru. 🙂

        • “ tak budou gondole opet zastarale v den vydani“
          .. tohle porovnani nemuzes delat podle nejvykonejsich sestav, ktere ma tak 0.1% uzivatelu, ale podle neceho, aby se to na tom ta hra rozjela. Muzeme tomu rikat „prumerne PC/notebook“. Coz bude neco typicky treba.2 generace pozadu. Takze o zastaravani novych konzoli v den vydani se opravdu nebojim a to ani v nasledujicich par letech 🙂 Situace je podstatne jina, nez v roce 2013..
          Pri pohledu na nastrel cen novych karet s NV, se to „zastaravani“ jeste protahne 😀
          https://wccftech.com/nvidia-rtx-3000-series-rumored-pricing-rtx-3090-for-1399-rtx-3080-for-799-rtx-3070-for-599-and-rtx-3060-for-399/

          • ale ano, muzu. vzdycky se porovnavalo s tim nejvykonejsim, co je v danem segmentu na trhu. vzdy se braly v uvahu i ty nove technologie, ktere v danou chvili mely velmi omezene vyuziti, ze – treba asynchronni vypocty, tesselace sveho casu, bump mapping jeste drive.

            • AKorat ze technologicky jsou na tom stejne. Konzole maji mit nejaky druh DXR, maji mit neco podobneho jako je DLSS, ma to mit VRS. Je mozne, ze NV varianta v Ampere bude vyzralejsi, ale technologicky zaostavat nebude.
              Dnesni herni CPU Top je v principu 9900K (3800XT) a 16T. Konzole ma 16T, pouze frekvence je na tom hur, ale zase bude mit pridane technologie, ktere to CPU odlehcuji, coz PC nema. Viz nejake to „decompres‘ udelatko, zvukovy koprocesor a mozna dalsi. Celkovym vykonem na tom muze byt podobne jako dnesni Top. V PS4 a XBOX jsi mel silne podprumerne CPU uz v dobe vydani. Tady mas silne nadprumerne, ktere se s temi pridavnymi featurkama muze porovnavat s aktualnim TOP.
              Grafika, ano, v dobe kdy vyjde Amper a RDNA2, tak zacne zaostavat, ale vuci aktualnimu Top, vzdyt XOX ma odhadovany vykon na urovni 2080-2080S. Amper to zmeni, ale prumerna sestava, kde je dneska neco jako 1660S/Rx580/590 v lepsim pripade, tak vykon tech konzoli dozene mozna tak z 3 roky. 2013 jsi mel Top karty ktere mely 2,5x vyssi vykon nez ps4, v pripade XBOX dokonce 4x. Amper nebude mit pravdepodobne ani 2x oproti tomu, co bude v konzolich a dalsich skok se neceka driv nez za dva roky.
              Pokud se bavime o SSD tak na tom je PC dnesni uplne mimo koleje, protoze porad se dela jeste na „HDD“.
              Ja bych se o to, ze konzole budou ‚zpomalovat‘ herni trh opravdu moc nebal, aspon ne nejblizsi 3 roky.

      • Tak. A teraz mi este povedz, ako si na tej konzoli spusim Cheat Engine a pridam povedzme gold, ked sa mi nechce grindit, urobim vlastny server pre MMO (Conan Exiles), prerobim interface starsej hry modom do 4k alebo pohodlnne zahram mysou ovladanu tahovu strategiu. Keby vsetci PC hraci, co pouzivaju PC ako konzolu s internetovymi bragging rights (nemylit si so skutocnymi high-endistami, co si uber PC buduju pre vlastnu radost) odtiahli niekde do… do konzoli, PC gamingu by to iba prospelo. 😉

  2. Mě překvapuje těch 16GB sdílené RAM jak pro CPU tak GPU. To mi už dneska přijde docela málo, natož pro next-gen hardware. Optimalizace sice udělá své, ale přesto mi to přijde omezující.

    • Taky myslím, že je to prostě obyčejný N7P. TSMC totiž nic jiného nemá. Buď by to musela být ta 1. verze N7, což podle Microsoftu není, takže nezbývá nic jiného, než že je to N7P, protože EUV verzí N7+ by se pochlubili, navíc by pro ni museli navrhovat ta Zen 2 jádra znovu.
      Na stejné verzi N7P vzniká Zen 3. Vzhledem ke kompatibilitě s N7 bych čekal, že N7 linky postupně převedou (možná už převedli) na N7P a N7 vůbec nebudou nabízet.

      • Podle mě to je ta první verze 7nm procesu (důvod by mohlo být to, že na ní má AMD udělaný fyzický design těch jader Zen 2, možná i té grafiky RDNA 2 a portovat by to byl velký problém protože ty týmy GPU/CPU na to nemajá čas).
        Ale i v rámci té první verze procesu během toho roku dvou udělali nějaké úpravy a vylepšení, které jsou kompatibilní s původními maskami/design kity, ale trošku vylepšily výsledný křemík.
        Takhle se údajně vyrábí ty Ryzeny 3000 XT – není to N7+ ani N7P, ale v rámci toho procesu pořád první generace u nich TSMC zaplo při výrobě nějaké extra tweaky tohohle typu. Ten čip Xboxu by mohl být stejný postup.

        • Nejsem si vůbec jistej, jestli je to potvrzené, IIRC AMD nechtělo přesně říct, jaký proces bude použitý. Ale protože je to nová architektura (kdežto tohle Xboxí APU má architekturu z Renoiru/Matisse), tak tam by už N7P nebo N7+ mělo být možné.

          Ta informace WikiChip je asi odhad a může být ještě z doby, kd TSMC mělo v roadmapě jenom originální N7 a N7+ (EUV), nic jiného, takže když AMD mluvilo o vylepšeném 7nm procesu, tak to interpretovali jako EUV – ale tohle pak později AMD oficiálně odmítlo s tím, že „zatím neříkáme, co to bude“.

          • Přesně tak. Mají tam i ten starý slajd z prezentace AMD, který říkal, že je Zen 3 na 7nm+, což už v novějších verzích nemají a samy říkají, že to bude na „vylepšeném“ 7nm procesu.
            Obecně bych si tipnul, že ten N7+ proces nebude TSMC moc preferovat, protože ty nedostatkové EUV osvitové jednotky raději použije na lepších procesech.

            • nevím jestli by se jim na refresh vyplatilo dělat komplet nový návrh …

  3. „Speciální akceleraci dostalo také audio. Microsoft bude používat formát Opus a akcelerátor MOVAD ho dokáže dekódovat 300× rychleji než v reálném čase. “

    Skôr to chápem zo slide-u tak, že v realnom case zvladne dekodovat viac ako 300 zvukovych kanalov. Nie, ze dokaze 300 krat rychlejsie dekodovat Opus.

    • No samozřejmě že dekódovat jediný stream není cíl, určené je to k tomu dekódovat spoustu zvuků (které se pak smíchají). V Q&A tuším dávali příklad, že ta audio akcelerace má věnovaných tolik prostředků proto, aby se daly utáhnout scény, kdy třeba 20 hráčů lítá je v jeskyni, přehrává se 300-400 zvuků a k tomu různé ozvěny a efekty…

      Ŕekl bych že ten akcelerátor nebude mít „300“ jednotlivých paralelních kanálů, které budou fungovat 1× realtime, ani jeden kanál 300x realtime který to všechno udělá čistě sériově, ale že to bude něco mezi tím – ten akcelerátor bue určitě mít paralelní jednotky, které zároveň budou dekódovat rychleji než realtime takže se tam ty zvuky budou dekomprimovat i sériově po sobě. Takže někde mezi těma extrémy.

  4. „spekulace, že by AMD nějak používalo jen generické ALU shaderů, nedávaly moc smysl, respektive by to nebylo dobré řešení, pokud by se trefily“ – tak naslo se hodne odborniku z rad mistnich, podle kterych to byla tutovka. 😀

    • Jasně se v té prezentaci píše:
      „4 Texture OR Ray ops/clk per CU“

      To si tady zade redakce něco vybásnila. Samozřejme, že to nejsou samostané raytracingové jednotky, protože nemůžou dělat zároveň texturovací a raytracingové operace. Takové omezení Nvidia nemá. A než začnete tvrdit něco o tom, že ty shadery můžou běžet zároveň – to neznamená nic jiného, že na jedné CU půjde texturovací operace a na jiné raytracingová.

      Opravte si to, než se před jinými weby ztrapníte.

        • no presne. reality distortion field Jana Olsana jede na plny obratky koukam 😀

          jako posledne, kdyz se odvolaval na nejakej zahadnej conference call, kterej nam jakoby nahodou nemohl zverejnit. to jsem se malem pocural smichy 😀

          • Akorát že stejný informace jako v něm byly a jako jsem psal, o tom stejně publikovali i všichni ostatní tak tady nepřepisuj historii. Smiř se s tím, že jsem prostě DLSS pochopil a popsal správně, kdežto ty sis tam vybájil nějaký vzdušný zámky.

            A nepublikoval jsem ho řekněme si to na rovinu proto, že tvůj přístup ke mě a manipulativní lhaní v diskucích je spíš na zabanování, než abych ti dělal laskavosti. (Pro ty kdo neměli tu čest – Maudit je kromě spam botů asi jedinej člověk, kterého jsem někdy navrhl na ban, i když k tomu nikdy nedošlo.)

            Taky jsem ještě neviděl, že by ten záznam někdo na web dával, takže si nejsem jistej, jestli je to taktní, není to něco ve formě zamýšlené k prezentaci. Ale hlavní je, žes mě furt opruzoval 🙂

            • Realita je taková, že
              1) Napsal jsem článek o tom, jak funguje DLSS 1.0, tobě se to nelíbilo, protože sis vysnil nějaký fantasmagorie.
              2) Vyšlo DLSS 2.0, napsal jsem článek o tom, jak to funguje (jestli se ti nelíbilo i to, jak funguje DLSS 2.0, to už si nepamatuju a je mi to fuk).
              2.1) Nvidia spolu s těma informacema v 2) potvrdila, že článek 1) je správně, takže jsi byl hořkej.
              Hele, přečti si o tom ostatní články od jinejch webů, nebo materiály od NVidie, pochybuju, že někde najdeš něco, co by to vyvrátilo, teda pokud to taky nepsal nějakej magor/cvok.

              No ale protože neumíš prohrávat, tak mě pořád zpochybňuješ a útočíš na mě jako maniak.
              Proč si tu zlost nevyliješ na Nvidii? Já za to nemůžu, já jenom prodávám jak jsem koupil, to oni „pošlapali tvůj sen“ 🙂

              P.S. Jestli tu budeš ty hlouposti dál opakovat, tak to budu mazat, protože tohle je jako diskutovat s konpiračním teoretikem, tj. blázinec o kterej nemám zájem a moji trpělivost si vyčerpal už tak dva roky zpátky. Už jsem s tebou ztratil tolik hodin…

            • Nejlepší je jak Maudit veřejně psal, že odchází a už sem nikdy psát nebude… a pak tu slídí od rána do večera a vždycky když už to nemůže vydržet, tak napíše hejtovací komentář. 😀

            • Kdyby ta DLSS 1.0 aspon za ty emoce stalo, ale vzdyt to byl docela propadak..

            • hele Honzo, bud reagujes na neci prispevek a pak ho nemaz, nebo ho cenzuruj, ale pak na ten prispevek nereaguj.

              a je smutny ze te tak dere Maudit, a kdyz tady litaly sproste nadavky od azznohy, trombozy a dalsich, tak jsi nehnul prstem. to teda vazne smrdi jak jista nohha.

            • Hnízdův brekot a žalování, to je tu už taková klasika. Většího uplakánka jsem nezažil. 😀 Hlavně že ve stejným příspěvku dětinsky komolí nicky všem který napadá. 😀

            • Tak aspon Hnizdo neprekvapil 😀 Jeho uplakane komentare jsou klasika 😀

        • „In addition, by utilizing the texture processor infrastructure …“
          Teď jsem se na to díval, a to spojení/sdílení s texturovací jednotkou je podle toho patentu dělané proto, že Ray Accelerator využije její buffery, respektive je mají společné. Samozřejmě za předpokladu, že to funguje přesně podle toho patentu.

          Uvidíme, jak efektivní to bude.

      • Aha, takže to souvisí s TMU. Já tam měl původně větu „ray accelerator je integrován na úrovni CU stejně jako texturovací jednotky, s kterými možná je propojený/souvisí“ enbo tak něco, ale pak jsem tam v té prezentaci nenašel doklad toho, tak jsem to zase odebral.

        Že je to propojené s TMU nebo dokonce na integrované v texturovacích jednotkách je docela zajímavý, ale to neznamená, že to není samostantá hardwarová jednotka – kdyby to jenom genericky nějak emulovalo operace paprsků na TMU? tak to mohli softwarově provádět už na starších GPU, čili ty hardwrové bloky akcelerující ten BVH traversal a ray/box a triangle/box search tam musí být.
        Zajímavé bude IMHO spíš, jaké jsou důvody toho, proč je to takhle je udělané.

        • To je jednoduché a je to popsané i v tom patentu – ušetří se tím spousta křemíku. A proto to AMD dělá, protože ten křemík potřebují na dohnání Nvidie v klasickém rasterizačním výkonu. To jejich řešení má totiž spoustu nevýhod – ty jednotky budou muset nějak dedikovat po dobu běhu aplikace pro raytracing nebo texturing. Bylo by strašně neefektivní v jednom snímku tu sdílenou cache invalidovat, tzn. zahodit data textur, a nahrát do ní BVH data, ty pak zase zahodit a nahrát texturovací data a tak dokola. To pak ta cache uplně ztrácí význam, protože nic necachuje. To budou muset nějak vyřešit v scheduleru a nebo v ovladačích. Ty ovladače jsou podle toho patentu pravděpodobnější, protože tam mluví o hybridním řesení klasických shaderů, raytracingových obvodů a softwaru. Mohlo by to také znamenat, že RDNA2 stále nemá tile-based rendering.

          Podle mě je k té texturovací jednotce jen připojených několik čistě výpočetních obvodů pro počítání průsečíků a vše ostatní je sdílené s texturovací jednotkou. Jestli by tohle stačilo k nazvání toho řesění jako RT jednotka, to si nemyslím. Otázka je taky, jestli se zrovna tady trochu nebude rozcházet RDNA2 a ty custom úpravy pro Xbox. Kdoví, jestli tohle třeba nebyl custom požadavek Microsoftu. Třeba má AMD pro jejich normální čipy ještě neco lepšího.

          Můj odhad je, a je to opravdu jen odhad, že tohle řešení je dočasné, protože nemá smysl, aby AMD příliš investovala do raytracingu, když zaostává v rasterizaci. Až Nvidii trochu doženou, pak nejspíš přijdou s něčím lepším.

          • Já bych čekal, že to v Radeonech bude stejně. Třeba CPU jádra jsou silně optimalizované fyzicky a tam se AMD IMHO bude zuby nehty bránit šáhnotu do nich a bude to copy paste z Renoiru (protože ověřování by muselo jet znovu).
            U GPU je pravda že v minulosti ta architektura shaderů měla custom úpravy, asi je cena změny v nich o dost měnší. Ale zrovna tohle mi přijde jako dost ústřední věc, takže myslím, že to není specialita a samotný Radeon RDNA 2 to tak bude mít taky. AMD by nedělalo zvláštní implementaci, která by nebyla podobná tomu, co samo použije, buď teď, nebo v následující generaci. Například FP16 v konzolích taky asi bylo proto, že to pak AMD chystalo do Radeonů.

          • „Ty ovladače jsou podle toho patentu pravděpodobnější, protože tam mluví o hybridním řesení klasických shaderů, raytracingových obvodů a softwaru.“

            To se mluví, ale co ten patent popisuje, je nakonec stejné jako u Nvidie. Softwarem se tam nemyslí ovladač, ale obecný GPU kód běžící na shaderech (tj. jako jiné grafické operace), který inicializuje a finišuje celou operaci, hardwarem se myslí tak akcelerace/offload toho výpočetně nejintenzivnějšího BVH traversalu na speciální jednotku. Přesně takhle to dělá Turing, rozdíl by byl jenom v tom, že jednotka u AMD bude používat interní buffery sdílené s texturovací.
            Dává to smysl, protože akcelerovat to celé by znamenalo, že to nebude dostatečně pružné/programovatelné, jak ten patent říká. Tudíž se mimo shadery dělá jenom ta nejintenzivnější část.

            „Mohlo by to také znamenat, že RDNA2 stále nemá tile-based rendering.“

            To nevím, jak by z toho mělo vyplývat, počkal bych, až to vyjde/bude o tom něco známo…

    • Mauditek se nam vratil ze zahrobi..to zase bude 😀
      Hele tak co, uz jsi prijal za fakt aspon to, ze HWUnboxed publikuje textove na Techspotu? Ja si vzpominam, ze jsi tady byl presne za „genia“ ty sam, kdyz jsi se snazil dokazovat, ze techspot ma nejaky youtube kanal, kde nikdo uz 4 roky nepublikoval. Ono to je genie jeste zajimavejsi v tom, ze Steve byl kdysi i redaktorem na techspotu, takze proto i to publikovani jejich recenzi. No jo no..kazda ‚genialita‘ neco stoji, co..nekdo ani netusi ze HwUnboxed a eTchspot maji stejne recneze 😉

      • ja si jen utahuju z tech jeho vzdusnejch zamku, jak mu jeho mala AMD dusicka nedovoli pripusit, ze AMD je v necem (v hodne vecech) horsi. stejne jako jsem si utahoval z toho jeho vykrucivani po uvedeni DLSS 2.0 a pak zas vypadnu. nema cenu nic jinyho, nez si s nej delat srandu. on totiz vi, ze ja vim. a cely ty nase diskuze nejsou o nicem jinym, nez ze se krecovite snazi zachranit si tvar pred vama ostanima .. zbytecny travit s tim cas uz. olsan se uz nezmeni. je to takova slabsi verze stacha s trochu vic informacema, nic jinyho

        ty me vubec nezajimas. ale je dobry aspon pozdravit. takze cau o7