Nvidia se vrací s vlastním CPU. Jádro Olympus je prý o 50 % rychlejší než AMD a Intel

Sdílet

Nvidia Vera Autor: Nvidia
Nvidia Vera
Nvidia po deseti letech opět přichází s úplně vlastní architekturou CPU. Procesor Vera má 88 jader, která jsou podobně široká a výkonná jako ta od Armu a Applu. Podle Nvidie má vést ve výkonu a být mnohem úspornější…

Nvidia tento týden pořádala konferenci GTC. Pro hráče a trh PC z ní bylo nejdůležitější odhalení kontroverzního AI filtru DLSS 5, zatímco už opravdu dlouho vyhlížené Arm procesory N1 a N1X pro počítače a notebooky zase nikde k vidění nebyly. Nvidia ale uvedla jiné CPU – procesor Vera pro servery. O tom mluví už dlouho a před časem oznámila, že ho bude prodávat i samostatně (mimo své vlastní servery). Nyní oficiálně přichází na trh.

Nvidia Vera

Procesor Vera (svým názvem naznačující kombinaci s AI akcelerátory Rubin) není úplně přelomový, protože Nvidia už předtím uvedla vlastní procesory Grace, které však používaly licenční architekturu Neoverse-V2.

Zásadní je Vera tím, že se v něm Nvidia vrací k vlastní architektuře jádra CPU (kterou zkoušela v minulé dekádě, ale neúspěšně), takže přebírá do vlastních rukou nejdůležitější aspekty tohoto procesoru. A firma by ho chtěla už nejenom přibalovat ke GPU ve svých serverech, ale sebrat s ním část širšího datacentrového trhu Intelu, AMD a případně dalším Arm procesorům.

Nvidia uvádí DLSS 5: Fotorealistická grafická revoluce… nebo filtr, který z her dělá AI „slop“? Přečtěte si také:

Nvidia uvádí DLSS 5: Fotorealistická grafická revoluce… nebo filtr, který z her dělá AI „slop“?

Vlastní jádro s SMT

Procesor Vera je založený na jádrech, kterým Nvidia říká Olympus, patrně stále propojených mesh sběrnicí – má jít o druhou generaci logiky Nvidia SCF (Scalable Coherency Fabric). Jader je v procesoru 88 a celkově pro ně propojovací logiky poskytuje 162 MB L3 cache. Podle ilustrace či snímku čipu by v křemíku mohlo asi fyzicky být jader víc, snad 91, vypadá to totiž, že mesh uspořádání má 7 sloupců se 13 jádry v každém. Tři jádra by pak vždy byla vypnutá, což dovolí využít i zmetkové čipy.

Tato jádra implementují instrukční sadu ARM v9.2 včetně například instrukcí SVE2, ale Nvidia architektura by měla být čistě podle představ Nvidie. Firma toho o řešení jádra moc neříká, ale jedna velká odlišnost je zřejmá – zatímco Arm nepoužívá technologii SMT, jádro Olympus něco podobného má a jádro zpracovává dvě vlákna. Celkem má tedy Vera 176 vláken.

Deska s procesory Vera

Deska s procesory Vera

Autor: Nvidia

Zdá se ale, že technologie není tak pružná jako u Intelu a AMD – aktivace SMT staticky rozdělí všechny prostředky jádra, takže vždy snižuje výkon na 1 MHz, i když je druhé vlákno neaktivní. Zapnutí nebo vypnutí SMT lze údajně provést při bootu systému, za běhu ho nelze změnit. V architektuře pro osobní počítač by tedy toto SMT nebylo na rozdíl od serverů moc dobře využitelné.

Tato technika také nebude tak efektivní v extrahování maximálního potenciálu výpočetních prostředků v jádře. Je ale možné, že v budoucích architekturách Nvidia funkci zdokonalí. Nvidia ji označuje Spatial Multithreading, zatímco klasické pojetí SMT s flexibilní alokací jednotek znamená Simultaneous Multithreding.

Slajd k procesorům Nvidia Vera

Slajd k procesorům Nvidia Vera

Autor: Nvidia, via: Tom's Hardware

Nvidia toho dále o jádrech říká relativně málo. Víme, že používají vedle zmíněné L3 cache také 2MB L2 cache privátní pro každé jádro (u Grace to byl jen 1 MB). Jádro má údajně podobně jako nejnovější architektury Armu a Applu údajně schopnost dekódovat 10 instrukcí za cyklus. Frontend má mít zdvojený prediktor větvení, tedy schopnost zpracovat dvě větvení za cyklus, nebo vyhradit jeden prediktor pro každé z vláken při použití SMT.

Jádra by měla mít poměrně dobrý hrubý výkon v SIMD výpočtech – Nvidia podobně jako Arm u jádra Cortex-X925 nasadila šest pipeline se 128bitovou šířkou. Ač tedy procesor podporuje instrukce SVE2 (mezi nimiž jsou i operace s hodnotami FP8 pro AI kód), nevyužívá jejich možnost práce s většími šířkami vektorů. Procesory x86 tedy budou mít v hrubém výpočetním výkonu pořád hodně velkou výhodu díky 512bitovým jednotkám AVX-512.

Součet všech vykonávacích jednotek v backendu, tedy ALU, jednotek pro větvení a SIMD/FPU pipeline, ale zřejmě mimo AGU a load/store jednotek, prý má být minimálně 14. Takže vedle 6 SIMD pipeline by to mohlo být 8 ALU – kvůli SMT asi jednotky budou vždy v sudých počtech. Výkon na 1 MHz („IPC“) má být o 50% vyšší než u jádra Neoverse-V2 v Grace – ale nevíme, zda je to včetně SMT.

Čiplety

Procesor je disagregovaný do více čipletů. Jádra jsou na jednom centrálním kusu křemíku. Vedle něj je po stranách osm malých čipletů s paměťovými řadiči – Vera má velmi široké paměťové rozhraní o šířce 1024 bitů (ekvivalent 16kanálových pamětí v tradiční terminologii) a opět používá paměti typu LPDDR, čímž se vymyká z klasické koncepce serverů. Propustnost RAM má být 1,2 TB/s (což by implikovalo, že je použitá paměť LPDDR5X-9600) a kapacita až 1,5 TB. Osazuje se v modulech SOCAMM, kapacitu lze tedy měnit podle libosti.

Nvidia Vera

Nvidia Vera

Autor: Nvidia, via: ServeTheHome

Dále je k centrálnímu čipletu přilepený čiplet s konektivitou NVLink-C2C, která slouží k propojení s dalším procesory nebo s GPU. Její propustnost může být až 1,8 TB/s. Oproti němu je pak větší System I/O čiplet, který implementuje různé řídící a doplňkové funkce a bloky, které jsou potřeba k vytvoření plnohodnotného SoC, ale také obsahuje řadiče PCI Expressu 6.0. Ty alternativně podporují také koherentní konektivitu CXL 3.1.

Spotřeba neznámá

Firma zatím nesdělila frekvence, cenu ani TDP. V prodeji prý má být jen jedna konfigurace s 88 jádry, bez nějaké větší variability modelů. Podle Nvidie má výkon procesoru být až 1,5× lepší než nejmenovaného konkurenčního x86 CPU pro servery v Nvidií definovaných AI úlohách a prý jsou až dvakrát energeticky efektivnější než „jakékoli ostatní procesory“.

Jde samozřejmě o oficiální benchmarky, které mohou být silně selektivní a různě přikrášlené. Nvidia dala vedle toho také předběžný přístup k procesoru firmě Red Panda, která provedla nějaké další testy proti procesorům Epyc 9004 a 9005. Ale i tyto jsou asi aspoň částečně marketingového charakteru a přibližují jen některé typy úloh – nejde o nezávislý test.

Oficiální benchmarky procesoru Vera proti předchozí generaci Grace

Oficiální benchmarky procesoru Vera proti předchozí generaci Grace

Autor: Nvidia, via: Tom's Hardware

Nvidia bude procesory Vera používat v rackových systémech NVL72 s GPU Rubin, ale bude je nabízet v rackových systémech s 1U servery, s až 8 procesory na jeden 1U server, v celém racku má být 256 procesorů Vera, což bude vyžadovat chlazení vodou.

Kromě Nvidie ale má servery či desky pro ně údajně nabízet i víc dalších výrobců (mezi nimi Dell, HPE, Supermicro, Lenovo), takže servery s procesorem Vera nebudou exkluzivní produkt jen Nvidie.

školení AI

Šéf Nvidie: Drahé a nedostupné počítače nebo elektřina? Pro nás je to fantastická věc Přečtěte si také:

Šéf Nvidie: Drahé a nedostupné počítače nebo elektřina? Pro nás je to fantastická věc

Extrémní výsledky, extrémní zisky Nvidie: Tržby přesáhly 215 miliard $, většina je čistý profit Přečtěte si také:

Extrémní výsledky, extrémní zisky Nvidie: Tržby přesáhly 215 miliard $, většina je čistý profit

Dostupnost až v druhé polovině roku

Jak to už u Nvidie chodí, ačkoliv minulý týden na GTC byl procesor Vera oficiálně vydán, je to stále převážně papírové uvedení. Zákazníci teď totiž asi stále mají jenom vzorky. Dostupnost sériových procesorů má totiž nastat až v druhé polovině roku.

Zdroje: ServeTheHome, Nvidia (12), Tom's Hardware (1, 2)

Autor článku

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Kvíz týdne

Tyto konektory zná každý. Ale víte, co jejich zkratky doopravdy znamenají?
1/9 otázek