Intel chystá speciální Xeon Phi pro strojové učení a AI, proti Teslám Nvidie

0

Za poslední rok jste si asi všimli, že Nvidia v oblasti výpočetního využití svých GPU začalo místo oblasti HPC (kde je důležitý výpočetní výkon v dvojité přesnosti) klást největší důraz na „umělou inteligenci“ založenou na neuronových sítích, pro což se razí termín „Deep Learning“. Zdá se ale, že i do tohoto nového zelí jí rychle začne lézt Intel, který začal výpočetním GPU konkurovat koprocesory Xeon Phi (nezdá se to, ale už jsou zde skoro čtyři roky). Na IDF nyní firma odhalila plány vydat pro obor strojového učení speciální verzi Xeonů Phi, nazvanou Knights Mill.

Toto kódové označení vypadá trochu jako slovní hříčka, protože v roadmapě by již měl být „Knights Hill“, což je údajně 10nm následník letos uvedených Kights Landingů. Knights Mill má ale být uveden již příští rok, takže je docela reálná možnost, že stále jde o 14nm čipy. V takovém případě by tento procesor mohl být také založen na stejném křemíku jako Knights Landing, jen optimalizovaném na jiné parametry a využití. Knights Landing je pro připomenutí složen ze 72 jader odvozených od Atomu Silvermont, ale obohacených o čtyřcestné SMT a silnou vektorovou jednotku s podporou AVX(2) a AVX-512, která zajišťuje hrubý výkon přes 3 TFLOPS v dvojité přesnosti.

Intel o čipu Knights Mill zatím mnoho neprozradil. Má údajně mít vylepšenou podporu pro výpočty s různou přesností, neuronové sítě totiž pracují pro vyšší výkon s nižší přesností (FP16) nebo 16bitovými či dokonce jen 8bitovými celočíselnými hodnotami (to je případ třeba speciálního procesoru TPU uvedeného Googlem). SIMD architektura instrukcí AVX2 či AVX-512 by pro tyto účely měla být vhodná, jelikož automaticky umožňuje s nižší přesností zpracovat více hodnot. Nicméně Knights Landing by zatím ještě neměl mít podporu pro celočíselná rozšíření AVX-512, na což by Intel patrně potřeboval novou architekturu FPU. Na slajdu nicméně Intel hovoří jen o výkonu v klasické jednoduché přesnosti (FP32), takže je možné, že podpora nižších formátů ještě v Knights Mill nepřijde.

Xeon Phi Knights Mill pro umělou inteligenci (Zdroj: The Register)
Xeon Phi Knights Mill pro umělou inteligenci (Zdroj: The Register)

Kromě toho má být čip optimalizován pro masovější servery (scale-out) a nabídnout vyšší energetickou efektivitu, tedy lepší spotřebu při stejném výkonu. Intel dále slibuje pružnou architekturu pamětí a velkou kapacity, což ale možná není nová vlastnost, jako spíše srovnání se stavem současných GPU, proti nimž je již Knights Landing výrazně napřed. Knights Mill tak možná jen nabídne totéž – tedy kombinaci velmi rychlé integrované paměti podobné HBM v pouzdře, která má podobnou kapacitu jako u GPU, ale navíc ještě podporu pro velký paměťový prostor tvořený konvenční pamětí DDR4, osazenou ve slotech DIMM ve volitelném množství. Tato kombinace propustnosti GPU a kapacity serverového CPU by mohla být opět diferencující vlastností Xeonu Phi Knights Mill, čipy budou lépe schopné pracovat nad velkými objemy dat.

Pokud pomineme zcela speciální akcelerátory jako TPU či různé aplikace na FPGA, které by pro tyto účely možná začnou preferovat velké firmy, pak Intel čipem Knights Mill bude konkurovat zejména GPU Tesla od Nvidie, jak jsme již zmínili v úvodu. Proti těm bude kromě výhody snadnějšího programování a využití potenciálu architektury (oproti výpočtům na GPU) moci uplatnit ještě jednu věc – Xeony Phi dokáží samy spustit a provozovat operační systém, takže klastrový uzel s nimi nepotřebuje další CPU, které by koprocesor řídilo. V klastrech by tedy bylo možno dosáhnout lepší hustoty čipů a výhoda je i v ceně a spotřebě.

Xeon Phi Knights Landing

Přesnější obrysy produktu nebo třeba cenové zařazení Intel již nezmínil, stejně jako bližší určení uvedení – o tom víme toliko, že by čip měl přijít v roce 2017. Půjde samozřejmě o produkt pro trh enterprise, nic pro nás spotřebitele, trénovat své „AI“ algoritmy na nich zejména velké firmy.

Zdroje: The Register, AnandTech, Intel