Ampere přejde z jader od ARMu na vlastní architekturu. Máme parametry 128jader Altra Max

5

Ve světě serverových procesorů ARM se dějí zajímavé věci. Máme už parametry 128jádrových 7nm čipů Altra Max; jejich výrobce Ampere Computing teď ale také oznámil, že místo jader Neoverse vyvíjí vlastní architekturu CPU. Pracují na ní i inženýři odešlí z Intelu.

Procesory ARM teď vkročily do notebooků a desktopových počítačů od Applu, ale od uvedení architektury ARM Neoverse N1 sklízejí úspěch i v serverech, zejména tedy v cloudu Amazonu, který má vlastní čipy Graviton2. Pro ty, kdo nejsou Amazon, nabízí takové procesory firma Ampere, vedená bývalou exprezidentkou Intelu, až 80jádrové procesory Ampere Altra jsou překvapivě konkurenceschopné procesorům AMD Epyc a Intel Xeon Ice Lake – nebo alespoň v těch úlohách, které jim dobře jdou, což nejsou zcela všechny.

Ampere nyní představil své další ambice – jednak novou generaci procesoru Altra Max, které jsou zatím pořád založené na stejné architektuře Neoverse N1 (a ne na novější V1 nebo N2), ale mají už 128 jader, tedy dvojnásobek toho, co nejvýkonnější AMD Epyc. Vedle toho ale také oznámila, že po těchto CPU opustí architekturu Neoverse, licencovanou přímo od ARMu, a přijde s úplně vlastními jádry, která mají být výkonnější i úspornější. Pokusí se tedy jít ve stopách Apple nebo Nuvie/Qualcommu, což by mohlo tyto serverové procesory vytáhnout nahoru, ale má to samozřejmě i svá rizika.

Tip: Exprezidentka Intelu a kandidátka na CEO řídí nového výrobce ARM procesorů pro servery

Altra Max: první 128jádrové procesory pro servery proti AMD, Intelu

Altra Max není na našem webu úplná novinka. O přípravách tohoto čipu už firma informovala dřív v předstihu. Teď firma hlásí, že už jsou testovány a blíží se jejich vydání, které nastane v pozdější části letošního roku. Přesně kdy ale neříká.

Procesory Altra Max jsou kompatibilní s první generací Altry a měly by proto fungovat ve stejných deskách, Také TDP zůstává údajně stejných 250 W, což by mělo usnadnit rozjezd platformy. Konektivita by měla být identická, tedy 128 linek PCI Express 4.0 a osmikanálové paměti DDR4-3200. Čip je vyráběný pořád 7nm procesem TSMC.

Strategie Ampere s procesory Altra Max
Strategie Ampere s procesory Altra Max (Zdroj: Ampere, via AnandTech)

Modely

Původní 80jádrové Altry de facto nepoužívaly boost nebo jinou dynamickou změnu frekvence. Výrobce je nechával běžet na maximální frekvenci (spotřeba tím dost kolísala), ovšem pokud se stalo, že by překročily TDP, tak se přece jen podtaktovávaly. Altra Max už zdá se částečně koncepci boostu nasadí, protože je pro ně specifikována základní a maximální frekvence. Jde nepochybně o něco, co si vynutilo použití už 128 jader. Pokud by maximální frekvence byla pořád konstantní, v těžších úlohách by kvůli tomu TDP a nároky na napájení musely být stanovené vysoko, snížení maximální frekvence by ale zase obětovalo výkon v méně náročných úlohách, které by se do TDP vešly i při zvýšeném taktu. Ačkoliv tedy Ampere i ARM dosud prezentovali konstantní (a tím předvídatelný) výkon jader Neoverse kvůli nefluktuující frekvenci jako výhodu, z pohledu optimálního využití procesoru to představuje nižší evoluční stupeň proti procesorům s boostem a jemným řízením frekvencí.

Firma Ampere stále neodhalila parametry modelů, i když se už dřív objevilo označení Altra Max M128-30, které by mělo znamenat takt 3,0 GHz při 128 jádrech. Nyní ale zdá se prosákly modely 128jader Altra Max neoficiální cestou, ukázal je Longhorn na Twitteru. Protože jde o nepotvrzené údaje, berte je nicméně s rezervou.

Modely procesorů Altra Max Longhorn Twitter
Modely procesorů Altra Max (Zdroj: Longhorn/Twitter)

Nejvýkonnější model M128-30 bude podle tohoto zdroje mít 128 jader s 250W TDP, ovšem ona frekvence 3,0 GHz není základní či trvalý takt. Jak už bylo řečeno, budou tato CPU zdá se již mít „base“ základní frekvenci a separátní maximální frekvenci, tedy asi by se dalo říct boost. U tohoto 128jádra je základ 2,8 GHz a maximum je oněch 3,0 GHz. Frekvence udávaná v názvech CPU Altra Max je tey boost, ne základ.

Další modely 128jader budou M128-28 s frekvencí 2,6 až 2,8 GHz, kterému již stačí 230W TDP a M128-26, kde bude takt 2,4 až 2,6 GHz a TDP 190 W. Jak můžete vidět v tabulce s uniklými neoficiálními specifikacemi, dále bude Ampere nabízet modely se 112 a 96 jádry. Ty budou vznikat ze stejného čipu, jen bude část jader deaktivováno, což dovoluje využít i křemíky s nějakými defekty.

Parametry procesoru Altra Max se 128 jádry
Parametry procesoru Altra Max se 128 jádry (Zdroj: Ampere)

Co je poměrně překvapivé, je že Ampere u těchto CPU údajně zmenšil L3 cache, či jak je označována, System Level Cache. Již Altra ji měla relativně malou – na 80 jader jen 32 MB. Ale Altra Max údajně i přes vyšší počet jader kapacitu ještě snižuje, a to jen na 16 MB, což se zdá hodně v nepoměru. Těmto procesorům tak budou chutnat aplikace, které potřebují hrubý výpočetní výkon, ale které příliš nevytěžují paměť a sdílená data. Toto už platilo i o 80jádrech Altra.

Schéma procesoru Altra Max se 128 jádry
Schéma procesoru Altra Max se 128 jádry (Zdroj: Ampere)

Procesory Altra i Altra Max jsou asi určené zejména pro provozovatele cloudů a jejich smyslem je asi hlavně provoz mnoha různých instancí, kde každá bude využívat jen pár jader, nebo třeba jen jedno. Při takových úlohách se asi CPU bude spoléhat hlavně na privátní L2 cache každého jádra. Procesory Altra Max (či původní Altra) se ořezáním cache a asi i dalšími rysy zdá se na tuto oblast do značné míry specializují, což ovšem také může znamenat, že nejsou úplně univerzálním řešením pro všechny serverové potřeby a tím také nejsou něčím, co by mohlo celkově nahradit procesory Intel (potažmo AMD) ve světě serverů.

Výkon slibovaný Ampere Altra Max
Výkon slibovaný Ampere Altra Max (Zdroj: Ampere, via AnandTech)

Ampere chystá vlastní jádra, na nové Neoverse nepřejde

Důležitější než parametry procesoru Altra Max, který už firma několikrát prezentovala, ale ještě pořád se na něj čeká, je ale druhá část oznámení Ampere. Firma totiž nyní sdělila, že chce přejít z licenčního modelu, kdy jen přebírá jádra CPU, navržená ARMem, na svá vlastní jádra, která si vyvine sama. Má tedy v plánu posunout se na vyšší úroveň, kdy bude sama vyvíjet architekturu.

Vlastní jádra od Ampere má mít hned následující generace procesorů (dříve kódově označovaná Siryn), která má vyjít v roce 2022 (ale dost možná až na jeho konci), a tedy by asi již měla být delší dobu v přípravě. Podle Ampere po víc než tři roky, plán na vlastní jádra údajně firma sledovala od založení (to bylo v roce 2018). Půjde o 5nm procesory. Vlastní jádra pak mají mít i další následující generace. Instrukční sada ARM zůstane i u těchto nových jader, softwarově by tedy asi měla tato CPU být bezproblémová.

Roadmapa ARM procesorů Ampere Computing
Roadmapa ARM procesorů Ampere Computing (Zdroj: Ampere, via AnandTech)

Je to trošku překvapení, protože nyní procesory Altra vděčí za úspěch právě architektuře Neoverse N1 od ARMu (předchozí eMag bez ní příliš neoslnil), která se dočkala poměrně slušného kritického úspěchu. A pozitivně byly přijaté i na ni navazující budoucí architektury Neoverse N2 a Neoverse V1 (zatím existující na papíře). Očekávalo se, že Ampere bude jednou z firem, které na nich bude stavět, pokud ne dokonce hlavním nositelem (pomine-li Amazon). ale Ampere to vidí jinak a tato jádra nepoužije.

Podle Ampere jeho vlastní jádra umožní vytvořit výkonnější a energeticky efektivnější procesory, což je důvod, proč firma vlastní architekturu sleduje. Firma tedy jinými slovy slibuje, že její jádra budou mít jak lepší absolutní výkon, tak lepší poměr výkonu ke spotřebě, než co dokáže samotný ARM u Neoverse. Samozřejmě až budoucnost ukáže, jak se toto podaří naplnit.

Tip: ARM odhalil procesory Neoverse V1 a N2. S IPC vyšším o 50 % chce porazit serverové x86

Vlastní jádra nemusí automaticky dopadnou skvěle

Vývoj vlastních jader má ale i rizika. Ačkoliv je avizovaným cílem Ampere nabídnout zákazníkům něco lepšího, než jsou licenční architektury Neoverse, což vlastně zároveň vyjadřuje určité přesvědčení, že ty nejsou úplně nejlepší, ve skutečnosti jsou tato jádra považována za docela povedená, jak jsme už zmiňovali výše. I když je samozřejmě otázka, zda za tím trošku nemůže být určitý hype nebo podléhání sympatií.

Překonat tuto architekturu v hrubém výkonu, ale zároveň udržet spotřebu nízkou a tím zachovat energetickou efektivitu, nemusí být vůbec snadné. V oné efektivitě například ztroskotal mnohaletý projekt vlastních CPU Samsungu, který nedokázal nakonec vytvořit jádro, které by bylo lepší než Cortex přímo od ARMu. Podobně opustil vlastní jádra Qualcomm, než před nedávnem koupil Nuvii s cílem pokusit se znovu.

Tip: Procesory Qualcomm s výkonnou architekturou Nuvia přijdou v roce 2023, jsou pro notebooky

Je proto slušné riziko, že se Ampere, zvlášť vzhledem k tomu, že jde o dost malého hráče, nepodaří ARM překonat a jeho jádro bude horší. Ostatně, firma původně – ještě pod původní značkou Applied Micro vyvinula vlastní jádra v procesorech X-Gene, ale ta nikdy nebyla příliš dobrá. Je tedy otázka, zda napodruhé může firma dosáhnout nadprůměrného výsledku a úspěšně navrhnout něco, co by cloudoví hráči měli motivaci koupit místo toho, aby si sami nevyrobili vlastní procesor s z hotových bloků Neoverse od ARMu, jako Amazon. Je ale třeba říci, že proti éře Applied Micro má nyní Ampere o dost silnější tým, do nějž zdá se přešla řada inženýrů z Intelu.

80jádro Ampere Altra Zdroj ServeTheHome
80jádro Ampere Altra Q80-30 (Zdroj: ServeTheHome)

Kalkul na akvizici?

Objevila se i škarohlídská interpretace, že oznámení plánů na vlastní jádro je poněkud cynický pokus zatraktivnit Ampere v očích velkých internetových hráčů (Google, Microsoft, Facebook…) a docílit tím, aby firmu koupili. V takovém případě už nemusí tak záležet na tom, jak moc se jádro opravdu povede. Odkoupení je poměrně častý konec startupů, které s tím někdy asi i vyloženě kalkulují.

Koupě může být cíl proto, protože podle některých názorů samostatná firma Ampere nemá moc velkou naději se prosadit. Právě proto, že cloudoví giganti, kteří jsou nejnadějnějším trhem pro serverové procesory ARM, mohou jít cestou Amazonu a licencovat si architekturu ARM Neoverse sami. Mohou si totiž díky dostupnosti licenční architektury navrhnout vlastní CPU poměrně snadno a obejít prostředníky typu Ampere.

Pokud by se toto stalo normou, tak se odbytiště pro Ampere o dost zmšnšuje. Živit se prodejem celých vlastních procesorů je proto pro malou firmu těžké, protože proti AMD a Intelu, potažmo ještě třeba Nvidii, až by ta koupila ARM, by to byl značně nerovný boj.

Galerie: ARM procesory Ampere Altra a Altra Max

Zdroje: ServeTheHome (1, 2), Longhorn (1, 2), Ampere, AnandTech

Ampere přejde z jader od ARMu na vlastní architekturu. Máme parametry 128jader Altra Max
Ohodnoťte tento článek!
4.3 (85%) 4 hlasů

5 KOMENTÁŘE

  1. „ještě pod původní značkou Applied Micro vyvinula vlastní jádra v procesorech X-Gene, ale ta nikdy nebyla příliš dobrá.“ — tak vetsi blabol uz jsem dlouho nevidel. Autore, ruku na srdce, X-Gene vyslo v 2011/12 a byl to revolucni pocin, protoze to bylo bezne dostupna 64bit ARM implementace a navic az 8 jadro. V te dobe o necem takovem v samotnem ARMu mohli jen snit. Takze z pohledu ARM sveta blabolite. Z pohledu porovnavani s amd64 svetem budiz, ale porovnavate jabka a hrusky. Na 40nm procesu (X-Gene) zadne velke kriky nenadelate zvlast kdyz konkurence uz ma 22nm (Intel rok 2011).
    Jinak clanek dobry, uvidime jak to s Amerou dopadne. Pracovni stanice se daji koupit, coz je +, ale jak podotykate vykon je trosku rozkolisany. Ta cache je mala, takze web/nginx — stejne jako v historii SPARC T1/T2 treba.

    • X-Gene nevyšlo v roce 2011/2012, to bylo jenom oznámeno na papíře. Vyšlo až o dost později iirc v roce 2014 (Apple je předběhl s vydáním 64bit. jádra v roce 2013) a to byl ten problém. Byl to úspěch v tom, že to byl první 64bit. serveorový ARM na trhu, zatímco předtím nebylo nic (jen Calxeda, která bylo moc málo) a tím pádem se mohlo dál pohnout rozjíždění té platformy, to máte pravdu.

      Ale jako produkt nebo obecně procesor pro praktické nasazení to selhalo, výkon nebyl nic moc a nezafungovala moc ani ta efektivita – než to vyšlo, měl Intel venku 22nm Atomy Avoton, proti kterým tehdy už X-Gene nevypadal dobře. Že to bylo na 40 nm není úplně výmluva, ale spíš část toho problému. Další generace měly stejné jádra a přicházely logicky ještě později a IIRC se nevyvíjely dost rychle na to, aby se staly zajímavější.

      Tím pádem X-Gene myslím nikdy moc nevystoupil z niky procesoru, který je pro „vývoj ARM serveru“, ale už ne úplně pro produkční ARM server. Za praktický byl považovaný spíš až ThunderX2. A to je to o čem píšu, když říkám, že „jádra nebyla nikdy příliš dobrá“, myslím že to, že ta architektura byla přinejlepším nemastná neslaná, není jenom můj názor.

      „Takze z pohledu ARM sveta blabolite. Z pohledu porovnavani s amd64 svetem budiz, ale porovnavate jabka a hrusky.“ — no právě. Aby se to mohlo ucházet o trh a ne jen o trh „vývojářských strojů určených pro přípravu na budoucnost“, tak to muselo být nějak konkurenceschopné proti x86. A v podstatě nebylo.

      • Vidim, ze se na vec divame kazdy z jine strany. Ja z pohledu historie a vyvoje a dulezitosti pro ARM (kdyz se jedna o ARM), vy z pohledu potencionalni konkurenceschopnosti na trhu. Pokud se na to podivam vasim pohledem a budu velmi prisny, pak budu muset prohlasit, ze vsechny ARM jadra jsou nepouzitelne a to vcetne tech nejvykonejsich. Takze Apple M1 (neni k dispozici jinde nez v Apple), Altra (oproti x64 prilis slabe — mluvim o jadre ne o CPU), AWS Graviton(2) (opet jen AWS a nic jineho. Kdyz se podivam na x64, tak nabizi silna jadra a k dispozici vsude, takze nejen v cloud ale i v kdejakem shopu s vypocetni technikou a dokonce se uspesne tlaci i do embedded/industrial.
        Necham na vasem uvazeni, ktery pristup je lepsi kdyz pisete o ARM implementaci v podobe Altry.

        • Tu Altru recenzenti celkem chválí a považují ji za konkurenceschopnou (i když třeba v některých úlohách není – ve spoustě je).
          Je pravda, že má pořád o dost nižší ten maximální jednovláknový výkon, ale MT dokáže mít dobrý. No a v praxi často bude mít dvě svoje jádra proti dvěma vláknům běžícím na jednom x86 jádře, kdy pak může být výkon na vlákno možní i lepší, nebo aspoň srovnatelný. A energetická efektivita je taky vcelku tam, kde má být.

          Sice to asi není vítězství, ale je to podle všeho použitelné v normálním nasazení. Amazon ostatně stejnou architekturu v asi o trošku úspornější (a pomalejší) konfiguraci vesele tlačí a zdá se, že s tím má úspěch.

          Z toho vašeho pohledu je X-Gene důležitý, to beru. Ono ale zase na druhou stranu měl tři generace (3. = eMAG). Pokud by šlo jen o to, dodat prototypový/development hardware pro ladění a vývoj platformy, než přijde THudnerX2 nebo Graviton2/Altra, tak to tedy dokázala ta první generace a měla by stačit. Od těch druhých dvou generací bychom už mohli čekat i víc…

          Každopádně jsem ale hlavně hodnotil tu architekturu CPU jádra. Kontext byl to, že teď chce následnická firma navrhovat vlastní jádro a chce ho mít lepší, než licenční design od ARMu. A v tom kontextu není tedy od věci podotknout, že když se o tohle pokoušeli naposled, tak to nevyšlo. Podle mě je tenhle pohled na věc relavantní, i přesto, že X-Gene jak říkáte nejspíš splnil nějakou svoji historickou úlohu.