AMD vydává Epyc 9004, procesory s 96 jádry Zen 4. Zabiják Xeonů a gamechanger v serverech?

23
Ilustrace procesoru Epyc 9004 bez kovového rozvaděče tepla 1600
Ilustrace procesoru Epyc 9004 bez kovového rozvaděče tepla
-
Zdroj: AMD

Zen 4 po procesorech Ryzen 7000 dorazil i do serverů. A v nich zřejmě představuje mnohem větší bombu než v desktopu. Intel moc nemá odpověď a je možné, že jeho Xeony Sapphire Rapids byly poražené ještě dřív, než konečně přijdou na trh.

Na konci září přišla nová generace procesorů AMD s 5nm výrobním procesem a jádry Zen 4 do desktopů. Teď s menším odstupem přichází stejná nová architektura také do serverů. Serverová forma Zenu 4 byla dříve známá pod kódovým označením „Genoa“ a nyní přichází na trh pod oficiálním jménem AMD Epyc 9004 (Epyc 4. generace). V serverech se Zenem 4 také přichází nová platforma a možná jde o ještě větší událost, než byl Ryzen 7000.

Zen 4 v serverech

Lze říct, že Genoa je cosi jako šestinásobek Ryzenu 7000 v jednom balení. Tyto procesory používají stejné 5nm CPU čiplety jako desktopové procesory, ale v počtu až 12 kusů, což dává až 96 jader se 192 vlákny a až 384 MB L3 cache (12× 32 MB, nejde tedy o celistvý blok mezipaměti).

Jádro Zen 4 má podle AMD proti předchozí architektuře Zen 3 přibližně o 14 % vyšší IPC čili výkon na 1 MHz v serverových úlohách. Vychází to tedy o trošku vyšší, než v desktopových testech. Toto číslo je podle AMD zjištěno z geometrického průměru 33 serverových aplikací, přičemž byly testovány 64jádrové modely (Epyc 9004 versus Epyc 7003 „Milan“ s jádry Zen 3) zamčené na identickou frekvenci.

Se Zenem 4 přichází také podpora instrukcí AVX-512 (včetně VNNI) a výpočtů s hodnotami Bfloat16, které pomáhají v různých výpočetních úlohách a zejména v aplikacích umělé inteligence.

Integrace 96 jader znamená, že procesory poskytují o 140 % víc jader než konkurenční Intel Xeony Scalable 3. generace (Ice Lake-SP). I proti budoucí generaci Xeonů „Sapphire Rapids“, která bude mít maximálně 60 jader a která vyjde až po Epycu 9004, budou mít výhodu o 60 % více jader.

Zatímco čiplety s jádry CPU jsou sdílené s desktopovými procesory, 6nm IO čiplet, který vše propojuje, je samozřejmě odlišný. Zajímavá novinka u něj je, že zatímco u 12čipletových (respektive 13čipletových) modelů s 96 jádry je každý CPU čiplet připojený jednou linkou GMI, u modelů s méně jádry je možné použít dvě linky s dvojnásobnou propustností pro jeden CPU čiplet.

Prezentace procesorů AMD Epyc 9004 při uvedení 07
Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

U například 32jádrových modelů tedy bude možné použít dvě linky mezi CCD a IOD a trošku tím v některých situacích vylepšit výkon.

12kanálové paměti DDR5

Zatímco čiplety s jádry CPU jsou sdílené s desktopovými procesory, 6nm IO čiplet, který vše propojuje, je samozřejmě odlišný. Zajímavá novinka u něj je, že zatímco u 12čipletových (respektive 13čipletových) modelů s 96 jádry je každé CPU čiplet připojený jednou linkou GMI, u modelů s méně jádry je možné použít dvě linky s dvojnásobnou propustností pro jeden CPU čiplet. U například 32jádrových modelů tedy bude možné použít dvě linky mezi CCD a IOD a trošku tím v některých situacích vylepšit výkon.

V procesorech Genoa poskytuje 12kanálový řadič pamětí DDR5-4800 s ECC. Podporovány jsou dva moduly RDIMM nebo 3DS RDIMM na kanál a celkově je možné mít až 6 TB RAM na jeden procesorový socket (toto je o 50 % vyšší maximální kapacita RAM proti Xeonům Ice Lake-SP). Propustnost pamětí je při 12kanálovém zapojení DDR5-4800 až 460 GB/s.

Prezentace procesorů AMD Epyc 9004 při uvedení 06
Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Levnější 72bitové ECC moduly DDR5?

Platforma bude podporovat dva moduly na kanál (takže až 24 DIMMů na procesor), ale to bude validováno až o něco později příští rok. Zajímavá zmínka je, že Epycy 9004 by prý měly podporovat nějakou alternativní podobu ECC pamětí označenou „AMD-C“. S ECC je u pamětí DDR5 jeden problém. Modul interně člení na dva 32bitové kanály (podrobnosti viz tento článek), což bohužel znamená, že na jeden modul o šířce 64 bitů už nestačí přidat dalších 8 bitů (devátý čip k osmi) pro ECC. Oba kanály musí mít vlastní ECC čip, takže je třeba přídavný čip na každé čtyři čipy ukládající data. ECC modul tak má místo 72 bitů šířku 80 bitů a jeho cena je vyšší, protože na každých devět čipů u DDR4 je u DDR5 třeba deset.

AMD ale uvádí, že podporuje ECC paměti DDR5 s šířkou 72 bitů, které by tuto cenovou výhodu neměly. Je to snad dosaženo trikem – tyto moduly mají čipy s datovou šířkou jen 4 bitů, takže na jeden 32bitový kanál se použije osm čipů plus devátý pro ECC, což je celkově šířka 36 bitů. Se dvěma kanály se dostáváte na 72 bitů a je zachována ona levnější redundance 1:8 místo 1:4. Zatím ale nevíme, zda se tento alternativní druh pamětí prosadí a jak široce budou dostupné.

Prezentace procesorů AMD Epyc 9004 při uvedení 03
Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Konektivita: PCIe 5.0 a CXL 1.1, až 160 linek

AMD používá flexibilní IO, kdy jeden procesor nabízí 128 rozhraní SerDes s rychlostí 32 Gb/s. Z těchto linek je polovina (64) tzv. typu P. Ty mohou být provozovány buď jako PCIe, SATA, CXL 1.1, nebo jako xGMI, které slouží k propojení dvou procesorů. Zbylých 64 linek se označuje jako typ G a proti linkám P nepodporují režim CXL ani SATA, jen PCIe 5.0 a xGMI. Toto rozdělení linek podle funkcí je vidět na schématu zapojení.

Tyto linky PCI Express 5.0 jinak podporují plnou bifurkaci až po rozhraní ×1, ale na každém rozhraní ×16 může dohromady být maximálně devět zařízení (možné je tedy například ×8 plus osm rozhraní ×1, ale ne 16 rozhraní ×1).

Schéma zapojení 2S sestavy a 1S sestavy s procesory Epyc 9004
Schéma zapojení 2S sestavy a 1S sestavy s procesory Epyc 9004 (zdroj: AMD, via: TechPowerUp)

2S konfigurace

V 2S konfiguraci je buď 64, nebo 48 „G“ linek PCIe 5.0 u každého z procesorů (ze 128 poskytovaných 1S konfigurací) použito k propojení socketů logickou xGMI. Z toho pak vyplývá konektivita dostupná u 2S systémů. Linky G použité k propojení xGMI mají rychlost až 32 Gb/s, takže propustnost mezi sockety je až 256 Gb/s nebo 192 Gb/s duplexně.

V dvouprocesorové konfiguraci spojená IO konektivita nabízí buď 128 linek typu P (s podporou CXL a SATA), pokud je k xGMI propojení CPU použito 64 + 64 linek, nebo až 160 linek PCI Express 5.0, z nichž 128 linek P podporuje i režim CXL 1.1 nebo SATA, zbylých 32 jsou linky G (v této situaci procesory propojuje jen 48 + 48 linek G v roli xGMI). K linkám generace 5.0 ještě 2S konfigurace má jako výpomoc 12 linek (šest z každého z CPU) PCI Express 3.0 pro méně náročné periférie.

Schopnosti linek P a linek G v preocesoru Epyc 9004
Schopnosti linek P a linek G v procesoru Epyc 9004 (zdroj: AMD, via: TechPowerUp)

1S servery

V jednoprocesorových serverech (1S) by zřejmě mělo být podporováno 128 linek PCI Express 5.0 (64 linek G s podporou CXL/SATA, 64 linek P použitelných jen jako PCIe 5.0) a k tomu osm výpomocných linek PCI Express 3.0.

Pokud je třeba připojovat disky přes rozhraní SATA, podporuje Epyc 9004 až 32 portů (každý konzumuje jednu linku PCI Express). Toto je vše konektivita vyvedená ze samotných procesorů – Epyc 9004 je opět SoC a nepoužívá externí čipset (který by znamenal spotřebu navíc).

Procesory Epyc 9004 mají také vylepšení RAS a nové bezpečnostní funkce (například automatické zapínání IBRS při změně úrovní zabezpečení, funkci pro ochranu klientů virtualizovaných procesů před útoky na SMT, Secure Encrypted Virtualization a Secure Memory Encryption jsou vylepšené). Procesory mají nový pokročilý ovladač přerušení AVIC. Ten má zlepšovat výkon, což se má projevit například při obsluze 200Gb/s Ethernetu.

Prezentace procesorů AMD Epyc 9004 při uvedení 04
Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Procesory používají nový socket SP5, což vyplývá i z přechodu na paměti DDR5 a navýšení počtu kanálů paměťového řadiče o 50 %. Logicky tedy neexistuje žádná kompatibilita se staršími deskami a servery. Pouzdro procesoru je kvůli více řadičům také výrazně větší (72 × 75 mm).

Modely

Procesory Epyc 9004 se pohybují v konfiguracích od 16 až po 96 jader, s TDP od 200 po 360 W, nicméně TDP jsou konfigurovatelná. Na nejvýkonnějších modelech může provozovatel navýšit spotřebu až na 400 W pro vyšší výkon. Pravděpodobně při tom stále ale bude zachovaná poměrně vysoká energetická efektivita, 96jádro totiž pravděpodobně i při tomto TDP používá jen okolo 3 W na jedno jádro, což je v kategorii jader ARM Cortex méně, než třeba používají velká jádra v procesorech Apple M1/M2.

Nejvýkonnější model je 360W Epyc 9654 s 96 jádry a 192 vlákny, který má základní takt 2,4 GHz, tedy docela dost na serverové CPU. Jeho maximální boost je 3,7 GHz, což je také více, než bývalo u Epyců zvykem. Zen 4 a 5nm proces tedy navýšily frekvence i v tomto sektoru. Cena je ovšem značná: 11 805 $.

AMD Epyc 9654 v socketu SP5 zdroj ServeTheHome
AMD Epyc 9654 v socketu SP5 (zdroj: ServeTheHome)

Levnější alternativou je 360W Epyc 9554 s 64 jádry na taktu 3,1–3,75 GHz za 9087 $ a asi zajímavější model Epyc 9634. Ten má poněkud nepravidelný počet jader 84 (168 vláken) a takty 2,25–3,7 GHz a stojí 10 304 $. Zajímavé je u něj ještě TDP, které je sníženo na 290 W.

V nabídce jsou dále 16-, 24-, 32- a 48jádra s různě se lišícími frekvencemi, nejlevnější 16jádro Epyc 9124 s TDP 200 W a taktem 3,0–3,7 GHz stojí „jen“ 1083 $.

Procesory AMD Epyc 9004 základní modely
Procesory AMD Epyc 9004 – základní modely (zdroj: AMD)

Levnější péčka pro 1S servery

Pro uživatele hledající úsporu jsou ale také ke zvážení procesory označené P, která jinak odpovídají běžným modelům, ale podporují jen 1S servery, ne 2S. Bohužel už tu není tak velká úspora jako v minulosti. V této verzi lze pořídit i 96jádro Epyc 9654P (za 10 625 $, úspora 1180 $) a 64jádro Epyc 9554P (cena 7104 $, sleva je tedy už lepších 1983 $) se stejnými parametry, jako mají modely 9654 a 9554. Nejlevnější péčkový model je 32jádro Epyc 9354P s 280W TDP a frekvencí 3,25–3,8 GHz (cena: 2730 $).

Procesory AMD Epyc 9004 zvýhodněné pouze 1S modely
Procesory AMD Epyc 9004 – zvýhodněné pouze 1S modely (zdroj: AMD)

Modely F s vyššími frekvencemi pro per-core licence

Jako v minulých generacích má AMD také modely „F“, které mají menší počty jader, ale vysoké takty. Zatímco předchozí modely jsou optimalizované na celkový mnohovláknový výkon, tyto modely F naopak mají maximalizovaný výkon na jedno jádro. Je to užitečné tehdy, pokud aplikace neškálují na více vláken a potřebují jednovláknový výkon, nebo pokud používáte software, jehož cena stoupá s počtem jader procesoru, takže jste nuceni držet počet jader nízko.

Modely F začínají 320W modelem Epyc 9174F s 16 jádry na 4,1–4,4 GHz, dostupné je 24jádro Epyc 9274F (320 W, 4,05–4,3 GHz), 32jádro Epyc 9374F (320 W, 3,85–4,3 GHz) a největší model je Epyc 9474F se 48 jádry, frekvencí 3,6–4,1 GHz a 360W TDP. Ceny těchto modelů jsou 3850 až 6780 $.

Procesory AMD Epyc 9004 modely zaměřené na vysoký výkon na jedno jádro a per core licencování
Procesory AMD Epyc 9004 – modely zaměřené na vysoký výkon na jedno jádro a per-core licencování (zdroj: AMD)

Dostupnost ihned

Toto vydání by mělo být tzv. hard launch. AMD oznámilo, že nyní jsou Epycy 9004 již běžně dostupné pro zákazníky. V případě serverů ovšem někdy trvá, než jejich výrobci zareagují a připraví dotyčné nové modely do nabídky, takže v praxi ještě nemusí být úplně snadné nějaký server nebo aspoň desku pro Epycy 9004 sehnat.

Velká úspora energie, na stejnou práci stačí jen třeba polovina serverů

Podle webu ServeTheHome (který nazval procesory Genoa „gamechanger“) je s Epycem 9004 možné zkonsolidovat starší servery do menšího počtu nových, které splní stejné úkoly, s poměrem minimálně 3:2. Při přechodu z procesorů Intel Xeon Scalable 3. generace „Ice Lake-SP“ to ale podle něj bude poměr spíš 2:1, uživatel tedy může zredukovat počet serverů na polovinu. A v případě, že ještě běží na starších 14nm generacích procesorů Xeon, ještě víc.

Prezentace procesorů AMD Epyc 9004 při uvedení 12
Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Přímo AMD také jako tahák těchto procesorů nabízí výrazné energetické úspory, které může takovouto konsolidací počtu serverů provozovatel dosáhnout.

Zdroje: TechPowerUp, ComputerBase, AMD, ServeTheHome

AMD vydává Epyc 9004, procesory s 96 jádry Zen 4. Zabiják Xeonů a gamechanger v serverech?
Ohodnoťte tento článek!
4.7 (94.29%) 14 hlasů

23 KOMENTÁŘE

  1. A přesně v tomhle je genialita řešení od AMD „Zatímco čiplety s jádry CPU jsou sdílené s desktopovými procesory, 6nm IO čiplet, který vše propojuje, je samozřejmě odlišný.“ Stejné chiplety použitelné na desktopu i serveru. Navíc je to i odpověď proč je na desktopu takový propad a proč v serverech AMD začíná dominovat.

    Tímhle řešením udělali v Intelu z Pata velitel všech Matů. Je na čase aby Pat těm svým Matům ukázal tohle řešení a chtěl aby to udělali ještě lépe.

    A propos skvělý článek děkuji.

    • Můžete mi vysvětlit váš myšlenkový pochod s tím, že sdílené čiplety mezi servery a desktopy jsou odpověď na to, proč je na desktopu takový propad a proč v serverech začíná AMD dominovat?

          • Jde o to, že se AMD nemusí za každou cenu nutit do nižších cen desktopových (AM5) CPU když může uplatnit chiplety jinde (v Epycích 9xx4). Teoreticky může probrat z klinické smrti Thr, nečekat 1,5 roku na ThrPro 79x5WX …

            Důvody proč se AM5 neprodává více je celá řada
            * obecné snižování poptávky
            * konkurence ze strany RL
            * v řadě případů lepší poměr cena/výkon (pro hry) na straně AL
            * vyšší cenová hladina
            * konkurence v cenově dostupnější AM4 platformy
            * dražší AM5 MB (s omezeně využitelným PCIe 5.0)
            * nedostupnost levných AM5 MB
            * stále nákladné DDR5
            * očekávání 7xx0X3D modelů

            Patrně bude celá řada dalších. AMD s tím nemůže moc učinit, zlevňování AM5 by dostalo pod tlak odbyt stávajících zásob AM4/Ryzen3(5)000.

            • A z čeho usuzujete, že se neprodávají AM5 čipy?
              Poslední finanční výsledky (s tím nadpolovičním propadem Ryzenů) AMD reportovalo za 3. čtvrtletí, které v jejich podání končilo 24. září, tedy 3 dny před uvedením AM5 na trh. Ano, nějaké ty procesory do distribuce šly, ale naprostou většinu tržeb dělala ještě stará řada, která je zodpovědná za ten propad.

            • Asi jste se právě probudil z ročního zimního spánku, ne? Výroba je rozebrána? Apple, AMD, nVidia a další své objednávky výroby u TSMC krátí.
              A samozřejmě ani v minulosti, kdy to, že byla výroba rozebrána, nebyl problém, aby výroba ve všech segmentech rostla. Ony ty nasmlouvané kapacity byly totiž čím dál větší.

      • Radečku, opět pleteš hrušky s paprikou. Aneb, pro ty co umí požívat odporné termity .. pleteš korelaci s kauzalitou.

        Drobný test …
        1) Pokud můete použít X součástek v produktu prodaném za X*$100 nebo stejných X součastek v produktu prodaném za $1000, kam bude směřovat produkci?

        2) Pokud trh A má pokles v důsledku nasycení a trh B vykazuje růst, který z výbců bude mít výhodu: ten, který potřebuje různé kritické součástky pro A a pro B, nebo ten, který může používat stejné součástky pro A i B a dle potřeby upravit produkci?

        3) „Můžete si zvolit libovolnou barvu vozidla, pokud to bude černá.“ Kdysi prohlásil pan Ford. Jakým způsobm zavední hromadné pásové výroby a unifikace pomohli jeho firmě?

        Pokud zvládete odpovědet na otázky, tak nemáte důvod ptát se na myšlejnkové pochody jiných diskutujících.

        • Nějak vám tykajícímu komouškovi unikl fakt, že ten pokles desktopu nebyl způsoben tím, že by desktopové čipy nebyly k sehnání, takže vše, co jste vyblil, je totálně mimo mísu.
          Ale chápu, že to je na vás moc složité. Vy dokážete jen papouškovat každou kravinu, kterou jste si někde přečetl, a šance, že byste se nad tím zamyslel, je nulová.

          • Argumenty nejsou, kognitivní kapacita vyčerpána … tak nastoupí urážky.
            Chlapče, mně je jedno co si o mně myslíš. Levnější pohřeb kvůli tomu mít nebudu.

            PS: Doporučuji více číst, trochu skromnosti a základy etikety.

            • Aha, takže tykající komoušek si v mém příspěvku argumentu nevšiml. Samozřejmě všiml, jen neví, jak by ho vyvrátil. Ubožáček se snažil vyčíslit, jak je výhodnější prodávat serverové čipy místo těch desktopových, ale že ty desktopové na trhu evidentně nechybí, tedy za jejich sníženým prodejem nemůže stát fakt, že AMD ty čipy raději prodává jako serverové (což je samozřejmě pravda), to už vysvětlit nedokáže. A protože se mu to nehodí do krámu, tak to ignoruje a mele o tom, že nejsou argumenty.
              A je fakt vtipné, jak někdo, kdo ještě nepochopil ani vykání, žvaní o základech etikety.

            • Radku, Radku. Tykám své matce. Jsem tedy komunista? Podle Vás asi ano.

            • Dedekhribb:
              Vážně nevidíte rozdíl mezi matkou a cizím člověkem?

  2. Gamechanger v server nastal v principu s prichodem Zen2 epicu. Od te doby podil AMD konstatntne roste a je jen otazka jak moc Intel se svou aktualni generaci zaostava nebo ne.
    Mozna, ze pristi rok s prichodem Sapphire Rapids Intel bude konkurovat aspon v nekterych segmentech naprimo. Byt si nejsem jisty, jetsli podle tech prosaklych cen, se to vyplati.

      • Saphire rapids ma Golden Cove jadra, ktera jsou IPC priblizne podobna, jako ma Zen4. Takze treba aspon prime vykonostni srovnani 32C vs 32C by mohlo pro Intel vychazet dobre. Alespon za predpokladu, ze frekvence Intelu nebudou prilis nizke, coz muze samozrejme taky nastat.
        U tech „velkych“ chipu alias 64-96C..tam samozrejme Intel nema v ramci „brute force“ moc sanci. A az vyjde 128C Bergamo tak si Intel uz tim tuplem neskrtne..

    • Možná je to tím “zabijákem Xeonů” v nadpisu 😉 Ale také moc nechápu ty dohady, když teď je super čas na nákup CPU (to i serverových), nebo stačí počkat na začátek roku na nové modely a pestřejší nabídku. Nebo se tu mají lidé příliš dobře, že řeší nesmysly.

  3. Palec dolu za chybějící P-varianty (1S) u 16c/24c modelů, snížení velikosti L3 cache u nejlevnějších modelů na 64MB (u Milan měli 128MB), boost takty 7313P schodné s Milan 9124 (přitom Zen4 chiplety umí +2GHz navíc, Zen3 uměly +1GHz navíc).