Applied Micro začíná dodávat 16nm serverové ARMy. X-Gene 3 má 32 jader a takt až 3,3 GHz

2
X-Gene 3 v serveru na MWC 2017 (Zdroj: AnandTech)

Před pár dny jsme psali o tom, jak Microsoft podpořil výrobce serverových čipů ARM a postavil se za použití této architektury v datacentrech, včetně těch svých. Skloňované při tom byly hlavně procesory Cavium a Qualcomm, ale současně s nimi nyní zatroubil k ofenzivě také další hráč, firma Appplied Micro, která byla s čipy X-Gene vůbec prvním průkopníkem 64bitových procesorů ARM v serverech. Nyní ohlašuje jejich novou verze X-Gene 3, která by měla být proti předchozím zatím nejzajímavější a tedy také s největší šancí na větší prosazení.

První generace X-Gene byla postavená na 40nm procesu a trpěla kvůli tomu na špatný poměr výkonu a spotřeby. S generací X-Gene 2 přenesenou na 28nm proces to již bylo o něco lepší, ale i tato CPU stále nebyla příliš atraktivní. To by se ale mohlo změnit nyní, jelikož X-Gene 3 konečně přichází na moderním 16nm výrobním procesu TSMC s 3D tranzistory. Ty by mu měly přinést podstatně lepší efektivitu, ale zároveň otevřít cestu k výrazně lepšímu výkonu. Důležité je, že tyto 16nm čipy se nyní konečně chystají na trh. Applied Micro (respektive jeho momentální vlastník Macom, který však uvažuje o prodeji tohoto byznysu) totiž ohlásilo, že vzorky procesorů již dostávají přední zákazníci firmy. Křemík by tedy měl být hotov a pomalu se chystá ostré vypuštění těchto CPU na trh.

X-Gene 3 má údajně překonávat výkon prvních dvou generací až šestinásobně (dle benchmarku SPECintRate), což bude dílem vyšších frekvencí a zřejmě i zlepšeného IPC. Dílem ale i tím, že trojka má 32 procesorových jader proti jen osmi u předchůdců. V referenční desce, kterou Macom nabízí, má CPU základní frekvenci 3,0 GHz, ovšem v boostu může běžet až na 3,3 GHz. Frekvenčně se tedy X-Gene 3 dostane tam, kde jsou Xeony (jaký je ale výkon na 1 MHz, toť už jiná odázka). SoC má dále k dispozici 32 MB L3 cache, řadič PCI Express 3.0 s celkem 42 linkami a integrovanou konektivitu SATA a USB 3.0.

Schéma čipu X-Gene 3
Schéma čipu X-Gene 3

Individuálně asi jádra X-Gene 3 stále nebudou srovnatelně silná jako ta v Xeonech, ale pro X-Gene 3 bude mluvit jedna věc: SoC bude umět obsloužit velké množství paměti. Má totiž osmikanálový řadič pamětí DDR4 s ECC a RAS funkcemi, podporující dva moduly na kanál. Celkem tedy jeden SoC obslouží až 16 DIMMů a může být osazen 1 TB operační paměti, při použití 64GB modulů. Podporována je efektivní frekvence 2666 MHz, takže by měla být poměrně dobrá i paměťová propustnost, pokud tedy řadiče budou schopné teoretický potenciál vytěžit. Čistě papírově má nicméně X-Gene 3 stejně dimenzovaný paměťový subsystém, jako procesory Naples, která v současnosti jako konkurenci pro Xeony chystá pro změnu AMD. Ty jsou ovšem modulární, skládají se ze čtyř čipů, kde každý poskytl dva kanály DDR4.

X-Gene 3 v serveru na MWC 2017 (Zdroj: AnandTech)
X-Gene 3 v serveru na MWC 2017 (Zdroj: AnandTech)

X-Gene 3 by se díky 32 jádrům mohl stát nejvýkonnějším serverovým ARMem. Cavium i Qualcomm totiž sice mají či chystají 48jádra, ale pravděpodobně s nižším výkonem na jedno jádro. Čip se samozřejmě teprve bude muset obhájit v praxi, zatím je jeho výkon jen na papíře. Přinejmenším by se, pokud bude mít obstojnou spotřebu, mohl stát alternativou nižších Xeonů E5 a vyšších Xeonů D s 16 jádry. Proti druhým jmenovaným ale bude představovat vyšší váhovou kategorii, neboť podporuje mnohem více paměti, kdežto Xeony D Intel omezuje na kapacitu maximálně 128 GB.

Přitom by tyto SoC údajně neměly být příliš drahé, podle AnandTechu se mluví o ceně okolo 1200 dolarů za jeden. Pokud 16nm proces vyřeší problémy se spotřebou a zvedne se výkon prosti starším generacím, mohl by X-Gene 3 nakonec přece jen udělat větší díru do světa serverů. A zprostředkovaně v nich snad i popotáhnou dál platformu ARM jako celek.

2 KOMENTÁŘE

    • A možno si ešte chvíľu počkáme. Serverové ARMy možno budú fyzicky lepšie, budú mať viac tranzistorov ako Xeony, zároveň vyššiu frekvenciu (7nm TSMC má byť o polovicu rýchlejšie ako 16nm, u Intelov sa očakáva na začiatku skôr obvyklý pokles) a možno dokonca aj ten toľko vytýkaný „single-thread“ výkon (keď implementujú porovnateľne široké vektory ako Intel)… ale celý stack bude asi stále pozadu.

      Konieckoncov, Intelu to trvalo koľko, 20-30 rokov? A pritom Xeony stále niesú na dostatočnej úrovni pre big-iron. O ARM serveroch sa seriózne hovorí ani nie 4 roky (pokiaľ nepočítame mikroservery založené na mobilných ARMv7).