Na trhu nejvýkonnějších serverových procesorů, které se používají hlavně v datacentrech a superpočítačích, figuruje zejména AMD a Intel, přičemž jejich hlavní konkurencí doteď byly Arm procesory, které si na základě licencí vyráběly sami datacentroví „hyperscaleři“ jako Amazon. Teď ovšem možná vyroste konkurent další, a to Nvidia, která během mánie okolo AI ovládla většinu tržeb za serverový hardware svými GPU a teď by chtěla i do CPU.
Nvidia už má první generaci procesorů pro servery na trhu v podobě produktu nazvaného Grace či Grace Superchip, který byl podobně jako Graviton Amazonu nebo Cobalt od Microsoftu založený na technologii licencované od Armu. Loni ale firma oznámila druhou generaci Vera, která by měla být významnější. A tyto procesory už nebude dodávat jenom jako součást vlastních serverů s GPU, ale i jako samostatný procesor konkurující standardním serverovým platformám od AMD nebo Intelu. A teoreticky by tedy mohl být používán i v pracovní stanici či desktopu.
Nvidia Vera
Vera má 88 jader s instrukční sadou Armv9.2, kterým Nvidia říká „Olympus“. Ačkoliv takováto kódová označení používal i Arm samotný, v tomto případě jde zřejmě o vlastní „custom“ architekturu Nvidie, která se tedy tímto po nepříliš úspěšných architekturách Denver a Carmel vrací k vlastním jádrům.
Příliš mnoho podrobností o jádrech Olympus zatím není. Mělo by asi jít o out-of-order architekturu (nic jiného dnes v mainstreamu neexistuje) a Nvidia potvrdila, že podporují SIMD instrukce SVE2. Avšak jen se 128bitovou šířkou jednotek. Procesor jich má podobně jako třeba Cortex-X925 rovnou šest, což bude dávat slušný výkon, ale v hrubém výpočetním potenciálu nebude tato architektura schopná dorovnat pokročilejší 512bitové jednotky AVX-512 procesorů AMD a Intel. Nvidia ale do jádra přidala podporu výpočtů s datovým typem FP8 pro interakci s aplikacemi strojového učení na GPU.
Víceméně unikátem mezi procesory Arm bude to, že jádro Olympus používá SMT a bude schopno zpracovávat dvě vlákna na jednom jádru. Na plné konfiguraci Vera s 88 jádry tedy 176 vláken. Nvidia tuto techniku nazývá „Nvidia Spatial Multi-Threading“, ale čím se liší od typických implementací SMT, nevíme. Přítomnost SMT je ale znak, že architektura by skutečně měla být vlastnoručně vyvinutá.
Procesor také podporuje technologie NVLink-C2C pro propojení mezi CPU a GPU (od Nvidie) s celkovou propustností linek až 1,8 TB/s. Ale to možná bude použitelné jen tehdy, pokud je na to deska speciálně stavěná s akcelerátorem umístěným blízko procesoru. Vera se vymyká běžným procesorům i v tom, že používá paměti LPDDR5X, které dodávají větší energetickou efektivitu, ale vyžadují speciální moduly SOCAMM. Paměťová propustnost s nimi má dosáhnout až 1,2 TB/s. To by vyžadovalo 1024bitovou sběrnici, ale nevíme, zda případně tyto údaje o propustnostech nejsou součty propustností dvou procesorů, protože Nvidia čip Vera používá i v 2S balení.
Nvidia teď oznámila, že procesor Vera bude dostupný jako samostatný produkt a univerzální procesor, čímž se stane přímou konkurencí procesorů Intel Xeon a AMD Epyc, případně dalších Arm procesorů se stejnou ambicí, jako jsou ty od Ampere. Pravděpodobně by měly být na trhu dostupné severy či desky pro tyto procesory od výrobců serverů. Fyzická dostupnost asi nastane až později v letošním roce, aktuální oznámení je spíše „papírovým vydáním“.
První reference od (vazalského?) AI startupu
Prvním zákazníkem pro procesor Vera je firma CoreWeave, která poskytuje cloudové instance pro aplikace umělé inteligence a je s Nvidií poměrně úzce spřízněna. CEO Nvidie Jen-Hsun Huang ale oficiálně tvrdí, že dalších „design winů“ pro tato CPU bude ještě velmi mnoho. Předchozí procesory Grace nebyly nějak výjimečné, nicméně firma by mohla teoreticky obsadit značné procento trhu jen už vzhledem ke své obchodní a finanční síle coby největší firmy na světě, která navíc může k prosazení svých CPU využít svou pozici na trhu GPU a AI infrastruktury.
Je otázka, zde je kontrakt od CoreWeave pro procesor skutečně dobrá reference. CoreWeave je totiž případ, kdy Nvidia praktikuje tzv. cirkulární investice – vlastní už 9 % akcií tohoto startupu a právě investice Nvidie umožňují Coreweave nakupovat hardware Nvidie. O tom, jak tyto praktiky mohou uměle a zvyšovat prodeje a maskovat to, že startupy kolem AI nejsou rentabilní (a nafukovat přitom AI bublinu), jsme psali v tomto článku, který také CoreWeave zmiňoval:
Teď firma od Nvidie dostala další dvě miliardy investic, takže spojitost s tím, že kupuje a veřejně chválí procesory od Nvidie, velmi pravděpodobně není náhodná. A nelze tak vědět, do jaké míry jsou za touto volbou CPU opravdu technické kvality a do jaké míry rozhodování ovlivňovaly dohody použít financování od Nvidie na nákup jejího zboží. Coreweave mimochodem údajně minulý měsíc mělo problémy s financováním (AI firmy typicky jsou silně ztrátové a „pálí“ miliardy dolarů ročně, a jimi nabízené služby často mají i vyšší náklady, než jsou tržby, čili fungují s negativní hrubou marží). Takže je možné, že si investory nemůže až tak vybírat a transakce s Nvidií firmu v podstatě udržela nad vodou.
Zdroj: Tom’s Hardware
