AMD vydává Epyc 9004, procesory s 96 jádry Zen 4. Zabiják Xeonů a gamechanger v serverech?

15. 11. 2022

Sdílet

 Autor: AMD
Zen 4 po procesorech Ryzen 7000 dorazil i do serverů. A v nich zřejmě představuje mnohem větší bombu než v desktopu. Intel moc nemá odpověď a je možné, že jeho Xeony Sapphire Rapids byly poražené ještě dřív, než konečně přijdou na trh.

Na konci září přišla nová generace procesorů AMD s 5nm výrobním procesem a jádry Zen 4 do desktopů. Teď s menším odstupem přichází stejná nová architektura také do serverů. Serverová forma Zenu 4 byla dříve známá pod kódovým označením „Genoa“ a nyní přichází na trh pod oficiálním jménem AMD Epyc 9004 (Epyc 4. generace). V serverech se Zenem 4 také přichází nová platforma a možná jde o ještě větší událost, než byl Ryzen 7000.

Zen 4 v serverech

Lze říct, že Genoa je cosi jako šestinásobek Ryzenu 7000 v jednom balení. Tyto procesory používají stejné 5nm CPU čiplety jako desktopové procesory, ale v počtu až 12 kusů, což dává až 96 jader se 192 vlákny a až 384 MB L3 cache (12× 32 MB, nejde tedy o celistvý blok mezipaměti).

Jádro Zen 4 má podle AMD proti předchozí architektuře Zen 3 přibližně o 14 % vyšší IPC čili výkon na 1 MHz v serverových úlohách. Vychází to tedy o trošku vyšší, než v desktopových testech. Toto číslo je podle AMD zjištěno z geometrického průměru 33 serverových aplikací, přičemž byly testovány 64jádrové modely (Epyc 9004 versus Epyc 7003 „Milan“ s jádry Zen 3) zamčené na identickou frekvenci.

Se Zenem 4 přichází také podpora instrukcí AVX-512 (včetně VNNI) a výpočtů s hodnotami Bfloat16, které pomáhají v různých výpočetních úlohách a zejména v aplikacích umělé inteligence.

Integrace 96 jader znamená, že procesory poskytují o 140 % víc jader než konkurenční Intel Xeony Scalable 3. generace (Ice Lake-SP). I proti budoucí generaci Xeonů „Sapphire Rapids“, která bude mít maximálně 60 jader a která vyjde až po Epycu 9004, budou mít výhodu o 60 % více jader.

https://twitter.com/aschilling/status/1590825648133574656

Zatímco čiplety s jádry CPU jsou sdílené s desktopovými procesory, 6nm IO čiplet, který vše propojuje, je samozřejmě odlišný. Zajímavá novinka u něj je, že zatímco u 12čipletových (respektive 13čipletových) modelů s 96 jádry je každý CPU čiplet připojený jednou linkou GMI, u modelů s méně jádry je možné použít dvě linky s dvojnásobnou propustností pro jeden CPU čiplet.

Prezentace procesorů AMD Epyc 9004 při uvedení 07 Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

U například 32jádrových modelů tedy bude možné použít dvě linky mezi CCD a IOD a trošku tím v některých situacích vylepšit výkon.

12kanálové paměti DDR5

Zatímco čiplety s jádry CPU jsou sdílené s desktopovými procesory, 6nm IO čiplet, který vše propojuje, je samozřejmě odlišný. Zajímavá novinka u něj je, že zatímco u 12čipletových (respektive 13čipletových) modelů s 96 jádry je každé CPU čiplet připojený jednou linkou GMI, u modelů s méně jádry je možné použít dvě linky s dvojnásobnou propustností pro jeden CPU čiplet. U například 32jádrových modelů tedy bude možné použít dvě linky mezi CCD a IOD a trošku tím v některých situacích vylepšit výkon.

V procesorech Genoa poskytuje 12kanálový řadič pamětí DDR5-4800 s ECC. Podporovány jsou dva moduly RDIMM nebo 3DS RDIMM na kanál a celkově je možné mít až 6 TB RAM na jeden procesorový socket (toto je o 50 % vyšší maximální kapacita RAM proti Xeonům Ice Lake-SP). Propustnost pamětí je při 12kanálovém zapojení DDR5-4800 až 460 GB/s.

Prezentace procesorů AMD Epyc 9004 při uvedení 06 Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Levnější 72bitové ECC moduly DDR5?

Platforma bude podporovat dva moduly na kanál (takže až 24 DIMMů na procesor), ale to bude validováno až o něco později příští rok. Zajímavá zmínka je, že Epycy 9004 by prý měly podporovat nějakou alternativní podobu ECC pamětí označenou „AMD-C“. S ECC je u pamětí DDR5 jeden problém. Modul interně člení na dva 32bitové kanály (podrobnosti viz tento článek), což bohužel znamená, že na jeden modul o šířce 64 bitů už nestačí přidat dalších 8 bitů (devátý čip k osmi) pro ECC. Oba kanály musí mít vlastní ECC čip, takže je třeba přídavný čip na každé čtyři čipy ukládající data. ECC modul tak má místo 72 bitů šířku 80 bitů a jeho cena je vyšší, protože na každých devět čipů u DDR4 je u DDR5 třeba deset.

AMD ale uvádí, že podporuje ECC paměti DDR5 s šířkou 72 bitů, které by tuto cenovou výhodu neměly. Je to snad dosaženo trikem – tyto moduly mají čipy s datovou šířkou jen 4 bitů, takže na jeden 32bitový kanál se použije osm čipů plus devátý pro ECC, což je celkově šířka 36 bitů. Se dvěma kanály se dostáváte na 72 bitů a je zachována ona levnější redundance 1:8 místo 1:4. Zatím ale nevíme, zda se tento alternativní druh pamětí prosadí a jak široce budou dostupné.

Prezentace procesorů AMD Epyc 9004 při uvedení 03 Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Konektivita: PCIe 5.0 a CXL 1.1, až 160 linek

AMD používá flexibilní IO, kdy jeden procesor nabízí 128 rozhraní SerDes s rychlostí 32 Gb/s. Z těchto linek je polovina (64) tzv. typu P. Ty mohou být provozovány buď jako PCIe, SATA, CXL 1.1, nebo jako xGMI, které slouží k propojení dvou procesorů. Zbylých 64 linek se označuje jako typ G a proti linkám P nepodporují režim CXL ani SATA, jen PCIe 5.0 a xGMI. Toto rozdělení linek podle funkcí je vidět na schématu zapojení.

Tyto linky PCI Express 5.0 jinak podporují plnou bifurkaci až po rozhraní ×1, ale na každém rozhraní ×16 může dohromady být maximálně devět zařízení (možné je tedy například ×8 plus osm rozhraní ×1, ale ne 16 rozhraní ×1).

Schéma zapojení 2S sestavy a 1S sestavy s procesory Epyc 9004 Schéma zapojení 2S sestavy a 1S sestavy s procesory Epyc 9004 (zdroj: AMD, via: TechPowerUp)

2S konfigurace

V 2S konfiguraci je buď 64, nebo 48 „G“ linek PCIe 5.0 u každého z procesorů (ze 128 poskytovaných 1S konfigurací) použito k propojení socketů logickou xGMI. Z toho pak vyplývá konektivita dostupná u 2S systémů. Linky G použité k propojení xGMI mají rychlost až 32 Gb/s, takže propustnost mezi sockety je až 256 Gb/s nebo 192 Gb/s duplexně.

V dvouprocesorové konfiguraci spojená IO konektivita nabízí buď 128 linek typu P (s podporou CXL a SATA), pokud je k xGMI propojení CPU použito 64 + 64 linek, nebo až 160 linek PCI Express 5.0, z nichž 128 linek P podporuje i režim CXL 1.1 nebo SATA, zbylých 32 jsou linky G (v této situaci procesory propojuje jen 48 + 48 linek G v roli xGMI). K linkám generace 5.0 ještě 2S konfigurace má jako výpomoc 12 linek (šest z každého z CPU) PCI Express 3.0 pro méně náročné periférie.

Schopnosti linek P a linek G v preocesoru Epyc 9004 Schopnosti linek P a linek G v procesoru Epyc 9004 (zdroj: AMD, via: TechPowerUp)

1S servery

V jednoprocesorových serverech (1S) by zřejmě mělo být podporováno 128 linek PCI Express 5.0 (64 linek G s podporou CXL/SATA, 64 linek P použitelných jen jako PCIe 5.0) a k tomu osm výpomocných linek PCI Express 3.0.

Pokud je třeba připojovat disky přes rozhraní SATA, podporuje Epyc 9004 až 32 portů (každý konzumuje jednu linku PCI Express). Toto je vše konektivita vyvedená ze samotných procesorů – Epyc 9004 je opět SoC a nepoužívá externí čipset (který by znamenal spotřebu navíc).

Procesory Epyc 9004 mají také vylepšení RAS a nové bezpečnostní funkce (například automatické zapínání IBRS při změně úrovní zabezpečení, funkci pro ochranu klientů virtualizovaných procesů před útoky na SMT, Secure Encrypted Virtualization a Secure Memory Encryption jsou vylepšené). Procesory mají nový pokročilý ovladač přerušení AVIC. Ten má zlepšovat výkon, což se má projevit například při obsluze 200Gb/s Ethernetu.

Prezentace procesorů AMD Epyc 9004 při uvedení 04 Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Procesory používají nový socket SP5, což vyplývá i z přechodu na paměti DDR5 a navýšení počtu kanálů paměťového řadiče o 50 %. Logicky tedy neexistuje žádná kompatibilita se staršími deskami a servery. Pouzdro procesoru je kvůli více řadičům také výrazně větší (72 × 75 mm).

Modely

Procesory Epyc 9004 se pohybují v konfiguracích od 16 až po 96 jader, s TDP od 200 po 360 W, nicméně TDP jsou konfigurovatelná. Na nejvýkonnějších modelech může provozovatel navýšit spotřebu až na 400 W pro vyšší výkon. Pravděpodobně při tom stále ale bude zachovaná poměrně vysoká energetická efektivita, 96jádro totiž pravděpodobně i při tomto TDP používá jen okolo 3 W na jedno jádro, což je v kategorii jader ARM Cortex méně, než třeba používají velká jádra v procesorech Apple M1/M2.

Nejvýkonnější model je 360W Epyc 9654 s 96 jádry a 192 vlákny, který má základní takt 2,4 GHz, tedy docela dost na serverové CPU. Jeho maximální boost je 3,7 GHz, což je také více, než bývalo u Epyců zvykem. Zen 4 a 5nm proces tedy navýšily frekvence i v tomto sektoru. Cena je ovšem značná: 11 805 $.

AMD Epyc 9654 v socketu SP5 zdroj ServeTheHome AMD Epyc 9654 v socketu SP5 (zdroj: ServeTheHome)

Levnější alternativou je 360W Epyc 9554 s 64 jádry na taktu 3,1–3,75 GHz za 9087 $ a asi zajímavější model Epyc 9634. Ten má poněkud nepravidelný počet jader 84 (168 vláken) a takty 2,25–3,7 GHz a stojí 10 304 $. Zajímavé je u něj ještě TDP, které je sníženo na 290 W.

V nabídce jsou dále 16-, 24-, 32- a 48jádra s různě se lišícími frekvencemi, nejlevnější 16jádro Epyc 9124 s TDP 200 W a taktem 3,0–3,7 GHz stojí „jen“ 1083 $.

Procesory AMD Epyc 9004 základní modely Procesory AMD Epyc 9004 – základní modely (zdroj: AMD)

Levnější péčka pro 1S servery

Pro uživatele hledající úsporu jsou ale také ke zvážení procesory označené P, která jinak odpovídají běžným modelům, ale podporují jen 1S servery, ne 2S. Bohužel už tu není tak velká úspora jako v minulosti. V této verzi lze pořídit i 96jádro Epyc 9654P (za 10 625 $, úspora 1180 $) a 64jádro Epyc 9554P (cena 7104 $, sleva je tedy už lepších 1983 $) se stejnými parametry, jako mají modely 9654 a 9554. Nejlevnější péčkový model je 32jádro Epyc 9354P s 280W TDP a frekvencí 3,25–3,8 GHz (cena: 2730 $).

Procesory AMD Epyc 9004 zvýhodněné pouze 1S modely Procesory AMD Epyc 9004 – zvýhodněné pouze 1S modely (zdroj: AMD)

Modely F s vyššími frekvencemi pro per-core licence

Jako v minulých generacích má AMD také modely „F“, které mají menší počty jader, ale vysoké takty. Zatímco předchozí modely jsou optimalizované na celkový mnohovláknový výkon, tyto modely F naopak mají maximalizovaný výkon na jedno jádro. Je to užitečné tehdy, pokud aplikace neškálují na více vláken a potřebují jednovláknový výkon, nebo pokud používáte software, jehož cena stoupá s počtem jader procesoru, takže jste nuceni držet počet jader nízko.

Modely F začínají 320W modelem Epyc 9174F s 16 jádry na 4,1–4,4 GHz, dostupné je 24jádro Epyc 9274F (320 W, 4,05–4,3 GHz), 32jádro Epyc 9374F (320 W, 3,85–4,3 GHz) a největší model je Epyc 9474F se 48 jádry, frekvencí 3,6–4,1 GHz a 360W TDP. Ceny těchto modelů jsou 3850 až 6780 $.

Procesory AMD Epyc 9004 modely zaměřené na vysoký výkon na jedno jádro a per core licencování Procesory AMD Epyc 9004 – modely zaměřené na vysoký výkon na jedno jádro a per-core licencování (zdroj: AMD)

Dostupnost ihned

Toto vydání by mělo být tzv. hard launch. AMD oznámilo, že nyní jsou Epycy 9004 již běžně dostupné pro zákazníky. V případě serverů ovšem někdy trvá, než jejich výrobci zareagují a připraví dotyčné nové modely do nabídky, takže v praxi ještě nemusí být úplně snadné nějaký server nebo aspoň desku pro Epycy 9004 sehnat.

Velká úspora energie, na stejnou práci stačí jen třeba polovina serverů

Podle webu ServeTheHome (který nazval procesory Genoa „gamechanger“) je s Epycem 9004 možné zkonsolidovat starší servery do menšího počtu nových, které splní stejné úkoly, s poměrem minimálně 3:2. Při přechodu z procesorů Intel Xeon Scalable 3. generace „Ice Lake-SP“ to ale podle něj bude poměr spíš 2:1, uživatel tedy může zredukovat počet serverů na polovinu. A v případě, že ještě běží na starších 14nm generacích procesorů Xeon, ještě víc.

ICTS24

Prezentace procesorů AMD Epyc 9004 při uvedení 12 Prezentace procesorů AMD Epyc 9004 při uvedení (zdroj: AMD, via: TechPowerUp)

Přímo AMD také jako tahák těchto procesorů nabízí výrazné energetické úspory, které může takovouto konsolidací počtu serverů provozovatel dosáhnout.

Zdroje: TechPowerUp, ComputerBase, AMD, ServeTheHome