Xeon Phi Knights Landing uveden: 72jádrový Silvermont s AVX-512, 16GB 3D pamětí

0

Včera jsme informovali o čerstvém rekordmanovi mezi superpočítači z Číny, založeném na tamním speciálním procesoru ShenWei SW26010. Ten jsme zmínili jako nepřímého konkurenta Xeonů Phi 14nm generace „Knights Landing“ od Intelu. A tyto velmi zajímavé procesory, vývojově pocházející ze zrušeného programu GPU Larrabee, byly shodou okolností vypuštěny na trh prakticky současně a již se také stihly dostat do praxe, i když ne na čelním místě žebříčku TOP500. Jejich dopad na trh ale patrně bude mnohem zásadnější.

 

Zatím nejzajímavější potomek mrtvého GPU

O Xeonu Phi již delší dobu víme to podstatné: že již nejde o poměrně „hloupý“ akcelerátor do slotu PCI Express, jakým byla první generace. Intel totiž nahradil primitivní architekturu jednotlivých jader a zároveň z čipu učinil autonomně životaschopné CPU, které poběží v procesorových socketech pro Xeony a nepotřebuje na rozdíl od výpočetních GPU jako například Tesla P100 žádné hostitelské CPU (což je z hlediska hustoty, ceny a spotřeby pro superpočítače výhra).

Xeon Phi Knights Landing
Xeon Phi Knights Landing

Intel zveřejnil čtyři modely 14nm Knights Landingu. Špičkovým typem je Xeon Phi 7290 (dvojka na druhém místě signalizuje 14nm generaci) se 72 jádry na taktu 1,5 GHz v základu a 1,7 GHz při maximálním turbu. Tento čip má TDP 245 W a vyjde na mastných 6254 dolarů (s DPH 182 000 Kč). Teoretický výkon v dvojité přesnosti (FP64) je 3,46 TFLOPS, běžná přesnost (FP32) pak je dvojnásobně rychlá.

Jádra jsou sdružena do párů se společnou 1MB L2 cache a jejich architektura vychází z Atomů Silvermont. Každé má však navíc dvě jednotky FPU podporující SIMD instrukce až po AVX-512 (respektive jeho subsety pro HPC) a používá čtyřcestný HT. Tím pádem jeden tento čip – mimochodem měřící údajně okolo 700 mm² a obsahující 8 miliard tranzistorů – obsluhuje 288 vláken.

 

Intel Xeon Phi Knights Landing

 

Kromě Xeonu Phi 7290 má Intel v nabídce ještě tři levnější čipy s TDP 215 W a 64 či 68 aktivními jádry, u nichž očekává největší poptávku ze strany výrobců superpočítačů, kteří obvykle nebudou pořizovat drahý „top“ model. Mimochodem, samotné čipy mají fyzicky 76 jader, ovšem i v „nej“ modelu čtyři slouží toliko jako rezerva pro zlepšení výtěžnosti. 76Jádrovýá verze nebude zřejmě nikdy existovat. Všechny modely vidíte zde v tabulce:

Modely Xeon Phi Knights Landing, srovnání s 22nm generací Knights Corner
Modely Xeon Phi Knights Landing, srovnání s 22nm generací Knights Corner

Kromě Xeonu Phi 7210, který podporuje paměti DDR4 jen na 2133 MHz, umí Knights Landing DDR4 na taktu 2400 MHz, a to v kapacitě až 384 GB celkem v šesti modulech. Paměťový řadič je šestikanálový, což dodává už tak slušnou paměťovou propustnost, ovšem tato velká RAM je jen druhým stupněm hierarchie, dodávajícím hrubou kapacitu.

 

16 GB 3D paměti v procesoru

Xeony Phi Knights Landing mají totiž všechny ještě integrovanou velmi rychlou 3D paměť MCDRAM přímo na pouzdru, a to v kapacitě 16 GB, tvořené osmi čipy. Ta by měla být třídou propustnosti relativně blízko GPU Fiji nebo GP100 od Nvidie s HBM/HBM2 – Intel uvádí „přes 400 GB/s“ dosažitelných v testu Streams Triad. Xeony Phi tedy budou mít podobně výkonné paměti jako nejrychlejší GPU, ale zároveň budou mít i přístup do velkého paměťového prostoru, typického pro CPU. Lze tedy říct, že mají to nejlepší z obou světů.

Xeon Phi Knights Landing v socketu LGA 3647
Xeon Phi Knights Landing v socketu LGA 3647

 

100Gb/s logika přímo z procesoru

Po architektuře a integrované paměti má ale Knights Landing ještě jeden velký trumf. Tato CPU budou volitelně dostupná ve verzi, která má přímo z pouzdra vyveden konektor pro speciální propojovací logiku Intel Omni-Path s propustností 100 Gb/s, na níž může běžet komunikace ve výpočetním klastru. Ta je volitelná, a přidá 278 dolarů k ceně a 15 W k TDP.

Xeon Phi Knights Landing, verze s propojovací logikou Omni-Path
Xeon Phi Knights Landing, verze s propojovací logikou Omni-Path

Procesory s integrovaným Omni-Pathem mají na substrátu jakousi nožičku vyčnívající z pouzdra, k níž se připojí kabel. Jak to vypadá, když jde přímo ze socketu LGA 3647 šňůra, můžete vidět na fotografiích. Kromě toho má CPU také konektivitu PCI Express 3.0 (36 linek) a DMI pro připojení k čipsetu.

 

Mimochodem, stejný socket pro šestikanálové paměti a pořádně velké procesory má příští roky sloužit jako podvozek také pro serverové Xeony Skylake platformy Purley. Také u nich zřejmě bude Intel volitelně nabízet logiku Omni-Path. Kromě socketové verze nicméně Xeony Phi Knights Landing mají existovat také v klasickém provedení karty PCI Express – díky tomu se jimi budou dát upgradovat již existující superpočítače či běžné servery. Tyto modely zatím ale Intel ještě neodhalil. V této podobě ovšem nepůjde o autonomní CPU, zatímco Xeony Phi v provedení samostatného procesoru normálně běží s operačním systémem Linux nebo dokonce Windows Server.

 

Knights Landingy jsou již v provozu

Intel uvádí, že již před nynějším oficiálním odhalením prodal více než 100 000 těchto čipů různým odběratelům. V aktuálním žebříčku TOP500 je díky tomu již jeden systém, který na Xeonech Phi 14nm generace běží. Je to počítač Stampede-KNL, v němž běží 484 Xeonů Phi 7250 (68 jader, i s logikou Omni-Path). Celkem má 32 912 jader a dosáhl s nimi v Linpacku výkon 0,818 PFLOPS (z teoretických 1,474 PFLOPS). Těchto 484 procesorů stačí na umístění na 117. místě žebříčku.

 

Intel Xeon Phi Knights Landing

Zdroje: Intel, The Register, ComputerBase, The Next Platform (1, 2), TOP500, Hermitage Akihabara