Nvidia už má dlouho vlastní ARM procesory – původně SoCy Tegra určené do mobilních zařízení, které poté našly útočiště v konzolích Switch a infotainmentech automobilů. Nvidia také před deseti lety zkoušela vlastní jádro CPU nazvané Denver, ale jeho VLIW koncepce s emulací instrukční sady ARM byla neúspěchem. Teď se firma do světa CPU naplno vrací a její vlastní architektura má ambice na procesory pro PC i ty nejvýkonnější servery.
Nvidia včera na GTC odhalila roadmapu (plán budoucích produktů) výpočetních GPU, používaných nyní zejména pro akceleraci AI. Z těchto plánů už jsme probírali GPU Blackwell Ultra, Rubin, Rubin Ultra a Feynman. Spolu s generací GPU Rubin ale Nvidia plánuje uvést i novou generaci vlastních procesorů nazvanou Vera (tedy křestním jménem astronomky, podle které se jmenuje GPU).
Nvidia Vera
Vera tedy bude nástupcem a náhradou současných serverových procesorů Nvidie nazvaných Grace. Ty byly původně souputníkem GPU Hopper (opět jde o odkaz na stejnou osobu), ale Nvidia je používá nadále i s GPU Blackwell. Vypadá to, že u serverových procesorů má Nvidia naplánovaný méně agresivní plán obměny generací zhruba po třech či čtyřech letech. Podle roadmapy totiž procesory Vera mají poté být používány i s následujícími generacemi GPU Rubin Ultra (což je refresh pro rok 2027) a Feynman (což už bude nová generace GPU v roce 2028).
Samotné informace o podobě procesorů Vera jsou zatím omezené. Jejich primárním účelem asi opět bude být hostitelem pro GPU Nvidia – k tomu budou poskytovat konektivitu NVLink, která má mít celkem propustnost údajně až 1,8 TB/s (jde asi o součet všech linek a možná i pro oba směry, tedy směrem do GPU i nazpět). U současného CPU Grace je to polovina, 900 GB/s. Zda si procesory zachovají použití původně mobilních úsporných pamětí typu LPDDR, které je charakteristické pro procesory Grace, to zatím není potvrzeno.
Vlastní architektura jádra
Nejdůležitějším detailem je, že procesory budou mít vlastní a pravděpodobně dost výkonné jádro ARM. Nvidia má totiž možnost si licencovat jádra Neoverse řady N nebo V od ARMu. Pokud se rozhodla navrhnout si jádro vlastní, mělo by to nejspíše být ve snaze dosáhnout vyššího výkonu, než je možné mít se standardními licenčními jádry, jaká používá například Amazon v Gravitonech a další firmy, které si s pomocí ARMu navrhují vlastní serverová CPU. Je ale samozřejmě otázka, zda se takovou ambici povede naplnit – nové architektury CPU často skončí s horším výkonem, než architekti plánovali.
Předpokládáme, že Nvidia nebude potřetí (po neúspěchu Denveru a Carmelu) zkoušet VLIW jádro emulující instrukční sadu ARM (což je koncept táhnoucí se od také eventuálně neúspěšné firmy Transmeta) a půjde klasickou cestou, která se i v současnosti nejvíce osvědčuje – tedy out-of-order jádra s velkou „šířkou“, čímž se myslí velký počet paralelních dekodérů, ALU, AGU, jednotek v FPU/SIMD části), které se bude snažit o co nejvyšší IPC, podobně jako jádra od Qualcommu/Nuvie nebo jádra Applu.
Netypický ARM se SMT
Procesory Vera mají podle roadmapy mít 88 jader – to nemusí nutně být maximální konfigurace, protože Nvidia má ve zvyku počítat s tím, že pár jader či jednotek GPU bude vždy vypnutých, aby se daly využít i čipy s defektem. Je možné, že procesor bude reálně mít třeba 96 jader a část jich je rezerva. Co však dokládá, že budou použita zcela nová vlastní jádra, je počet vláken. Procesor s 88 jádry má poskytovat 176 vláken, což znamená, že bude implementovat technologii SMT umožňující na jednom jádru současně zpracovávat dvě vlákna, stejně jako jádra AMD nebo serverová jádra Intelu.
Mezi jádry architektury ARM je SMT velmi vzácné, takže architektura Nvidie bude už tímto asi dost pozoruhodná. Propagátoři instrukční sady ARM (zejména z „fanklubu“ Applu) občas přínosnost SMT zpochybňují, zdá se ale, že ji Nvidie považuje za užitečnou. Tato technika je výhodná zvlášť u procesorů s velkou šířkou (velkým počtem výpočetních jednotek), protože u nich často značná část prostředků není jedním vláknem využita kvůli omezené možnosti paralelního zpracování, třeba kvůli závislostem jedné instrukce na výsledku druhé.
SMT umožňuje využít takto ladem ležící prostředky a stejně tak umožňuje využít výkon, který by byl na ocet třeba při čekání na data z paměti, jde tedy o techniku, která může být dost efektivní. Její nevýhodou je zejména velká náročnost na ověření, že vše funguje korektně a procesor vlákna správně spravuje. Vedle toho je také potenciálně náchylná k různým side-channel útokům. Zdaleka to však není jediná potenciálně zranitelná část jádra CPU, takže to nemusí být argument pro odebrání SMT. Tyto slabiny by jeho odstraněním nebyly eliminovány.
ARM notebooky a PC od Nvidie?
Toto jádro nás ale bude zajímat nejen coby serverové řešení používané hlavně v produktech Nvidie samotné. Firma má podle všeho ambice vstoupit i na trh osobních počítačů a eventuálně třeba prodávat vlastní procesory pro PC a notebooky. Jádro použité v procesorech Vera je dost možná zamýšleno už i s tímto cílem. Za pár let by teoreticky na odvozených procesorech tedy mohly běhat i Windows (a hry pro ně).
Rok 2026
GPU Rubin mají vyjít ve druhé polovině příštího roku, takže i procesory Vera by asi mohly přijít na trh v tomto čase. Pokud tedy nebudou mít zpoždění. I procesory Grace šly na trh relativně dlouhou dobu po svém oznámení (které bylo již v roce 2021). Samotné přiřazení v roadmapě může být dost přibližné, zatím asi Nvidia nesdělila pro vydání CPU Vera nějaký závazný termín.
Zdroj: Tom’s Hardware, Nvidia
