Xeon Phi oficiálně uveden. Začátek konce karet Tesla, FirePro a GPGPU vůbec?

0

Zdá se, že přes příděl zpráv z oblasti superpočítačů na této frontě ještě nemáme hotovo. Současně s uvedením Tesly K20 a dvoučipového FirePro S10000 totiž svou zbraň oficiálně vytáhl i Intel. Nejde o nic jiného než o výpočetní akcelerátor či koprocesor Xeon Phi, o němž zde není řeč poprvé. Nyní se tedy toto mnohohlavé dítko architektury x86 po letech vývoje a neveřejného testování definitivně dostává na trh. Příchod akcelerátoru se standardní procesorovou architekturou může být zásadní. Pokud se Intelu zadaří, mohl by Xeon Phi prakticky zlikvidovat odbyt po profesionálních výpočetních grafikách.

Architekturu Xeonu Phi jsme již podrobně probírali, a nebudeme se k ní tedy již vracet (zájemci nechť čtou zde). Snad jen to, že na samotném čipu není hezky kulatých 64 jader. Fyzicky je jejich jen 62, do půdorysného řešení se zbylá dvě už nevmáčkla (což můžete vidět na snímku jádra). Server SemiAccurate mimochodem uvádí, že na čipu je zachován i hardware, který měl obstarávat funkce grafické pipeline, nepříslušející samotným jádrům. To ještě v době, kdy se projekt jmenoval Larrabee a měl vyprodukovat grafický čip. Tyto bloky jsou však z výroby natvrdo vyřazené a odpojené od napájení. Nelze je tedy nijak probudit k činnosti (a vyzkoušet si, jak by grafické Larrabee vypadalo).

 Xeon Phi - aktivně a pasivně chlazené varianty
Xeon Phi – aktivně a pasivně chlazené varianty

Modelů Xeonu Phi je vícero, oficiálně však byl porozen jen jeden: Xeon Phi 5110P. Tato karta má 60 aktivních jader, taktovaných na 1,053 GHz (údajně by však měla mít technologii Turbo). Udávaný výkon v dvojité přesnosti je 1,011 TFLOPS, s jednoduchou se Intel ve specifikacích nezahazuje (vzhledem k použité architektuře SIMD by ale měl být její výkon dvojnásobný, viz starší aktualita). Propustnost pamětí GDDR5 má činit 320 GB/s. Čip má údajně 16 paměťových kanálů (zřejmě o 32bitové šířce). Dle SemiAccurate je paměť údajně taktována na 5 GHz, což by odpovídalo udávané propustnosti, je však otázka, zda je počítáno s režií způsobenou ECC.

Xeon Phi: snímek čipu
Xeon Phi: snímek čipu

Paměti je celkem 8 GB; po aktivaci ECC prý zbude 7,75 GB kapacity. Na každé z jader připadá 512 KB L2 cache. Čip je vyráběn nejmodernějším 22nm výrobním procesem Intelu a jeho TDP je stanoveno na 225 W. Karta je konstruována pro pasivní chlazení (silným) průtokem vzduchu, počítá se zde s nasazením toliko v serverové skříni. Cena karty je stanovena na 2649 USD.

Polooficiálně vyrábí Intel ještě modely SE10P a SE10X, které jsou ale zřejmě k dispozici pouze speciálním zákazníkům (nacházejí se údajně v superpočítači TACC Stampede). Obě karty se liší jen přítomností či nepřítomností pasivního chladiče (Se10X je holá karta), parametry jsou stejné: 61 jader s taktem 1,1 GHz, dávající výkon 1,073 TFLOPS v dvojité přesnosti. Paměť je taktována na 5,5 GHz, takže propustnost stoupla na 352 GB/s. I TDP mají však tyto karty vyšší – rovných 300 W.

Xeon Phi, aktivně chlazená varianta
Xeon Phi, aktivně chlazená varianta

Vedle toho Intel avizuje ještě řadu 3100, kterou údajně odhalí později (v první polovině příštího roku). Zde už se asi jednat spíše o karty pro nasazení v běžnějším serveru nebo pracovní stanici, a jejich TDP bude 300 W. Existovat bude aktivně i pasivně chlazená varianta. Tyto Xeony Phi budou mít pouze 6 GB paměti o celkové propustnosti 240 GB/s. Oficiálně bude jejich výkon „vyšší než 1 TFLOPS“, sdílnější už však Intel není.

Xeon Phi ,pasivně chlazená varianta
Xeon Phi ,pasivně chlazená varianta

Serverům SemiAccurate a The Register se však podařilo vyšťourat, že L2 cache bude mít 28,5 MB, což značí, že aktivních bude 57 jader. Frekvence pamětí je 5 GHz, z čehož je zřejmé, že se čtvrtinou paměti ubral Intel také čtvrtinu řadičů (celková šířka klesla na 384 bitů). Výkon údajně bude 1,003 TFLOPS, a to díky o něco vyšší frekvenci 1,1 GHz. The Register uvádí označení vrtulového modelu jako 3120A, je-li to pravda, bude se zřejmě průtokově chlazená varianta jmenovat 3120P. Cena těchto osekanějších kousků zřejmě bude blíže dvěma tisícovkám dolarů.

 

Cena Xeonů Phi je vůbec atraktivní a jejich uplatnění by mohla dosti pomoci. Zásadním tahákem tohoto koprocesoru je ovšem programovací model. Tyto karty akceptují (po překompilování) běžný kód pro architekturu x86. Jelikož se v systému ukazují jako virtuální linuxový klastr připojený přes síť, je velice snadné na ně portovat existující kód. Odpadá náročný přepis do CUDA nebo OpenCL. Dle mého názoru může tato vlastnost zajistit Intelu naprostou dominanci nad kartami FirePro a Tesla, pokud tyto nebudou mít značný výkonnostní náskok, který by softwarové břemeno vyrovnal. K tomu je třeba připomenout, že Intel možná tuto architekturu jednou včlení i do běžných procesorů.

V žebříčku TOP500 se již stihlo objevit sedm superpočítačů, vyzbrojených Xeonem Phi. Nejsou většinou zrovna na nejvyšších místech – tedy kromě Stampede v institutu Texas Advanced Computing Center, který si s 2,66 PFLOPS vysloužil sedmou příčku. Xeon Phi tak jde do světa s prvními referencemi v kapse.

Zdroje: Intel (1, 2, 3, 4), SemiAccurate (1, 2), The Register