Elbrus-8C, 8CV: ruské VLIW procesory dostanou osm jader a novou architekturu

0

O VLIW procesorech Elbrus vyvíjených v Rusku jsme zde psali na jaře; jejich historie ale samozřejmě sahá mnohem dále. A jen tak brzy – přes jistou zaostalost například co do výrobního procesu nebo provozních frekvencí – neskončí. Na webu se nyní objevily informace o dalších plánech výrobce s touto architekturou. Elbrusy by podle nich měly příští rok dostat nový výrobní proces a více jader, v dlouhodobějším horizontu je pak připravovaná nová architektura s ještě širším instrukčním slovem a vyšším výkonem za jeden takt.

MCST, tedy Moskevské centrum technologií SPARC (původně totiž vyvíjelo tuto architekturu, nikoliv vlastní), má v současnosti na trhu čtyřjádrový 65nm procesor Elbrus-4C – nebo Elbrus-4S. Panuje totiž trochu zmatek v jejich značení. V azbuce je samozřejmě znak vypadající jako naše C ve skutečnosti S, takže Эльбрус-4С na čipu by logicky mělo znamenat Elbrus-4S. Jak ale vidíte ze slajdů ze zářijové konference Russian Super Computing Days, sám výrobce ve vlastních materiálech psaných anglicky používá verzi „Elbrus-4C“. Každopádně, na rok 2016 a následující jsou plánovány další dvě generace: Elbrus-8C a Elbrus-8CV. Vzhledem k tomu, že znak jako „V“ se v azbuce ani nevyskytuje, je tato část označení zřejmě psána latinkou, jakkoli je to matoucí. Takže to vypadá, že C je správně.

Obě architektury budou vznikat na 28nm procesu TSMC, nicméně generačně budou velmi vzdálené. Elbrus-8C by se měl začít vyrábět v první polovině příštího roku a vzorky by dle plánu měly být hotové ještě před koncem letoška. Elbrus-8CV má vyplodit první vzorky až v druhém čtvrtletí roku 2018 a do výroby by pak měl jít až v jeho čtvrtém kvartále. Pokud jej ovšem nepostihne zpoždění.

Procesor Elbrus-8C
Procesor Elbrus-8C   

 

2016: Elbrus-8C

Elbrus-8C má poskytnout podstatně vyšší výkon: počet jader s zvýší ze čtyř na osm, ale navýšena bude také pracovní frekvence. Zatímco Elbrus-4C běžel jen na 800 MHz, Elbrus-8C již má mít takt 1,30 GHz. Ovšem také TDP má narůst, ze 45–60 W u architektury 4C na 60–90 W. Za jeden takt má čip údajně zvládat přes 30 („30+“) operací, což je víc, než kolik MCST uvádí pro Elbrus-4C (25), takže parně dojde i na nějaké zvýšení IPC. Vysvětlením by mohlo být rozšíření instrukčního slova, neboť jde o architekturu VLIW.

Procesor bude mít rovněž změněný systém pamětí cache – místo 2 MB bude mít L2 cache každého jádra jen 512 KB (díky čemuž by mohla mít nižší latenci) a CPU dostane L3 cache s kapacitou 16 MB, sdílenou pro všechna jádra. MCST uvádí, že teoretický výpočetní výkon Elbrusu-8C by měl činit 250 GFLOPS v jednoduché a 125 GLFOPS v dvojité přesnosti. Pro Elbrus-4C se přitom udává 50/25 GFLOPS.

Roadmapa procesorů Elbrus-8C, Elbrus-8CV
Roadmapa procesorů Elbrus-8C, Elbrus-8CV

Pro čip bude vyvinuta také nová čipová sada KPI-2, jež by měla být uvedena současně. Tento čip bude vyráběn také u TSMC, ale na 65 nm. Poskytne Elbrusu čtyřkanálový řadič pamětí DDR3 na taktu 1600 MHz, řadič PCI Express s celkem 20 linkami a funkce jižního můstku. Podporováno bude 6Gb/s rozhraní SATA s osmi porty, osm portů USB 2.0 a také tři gigabitová síťová rozhraní Ethernet.

 

 

2018: Elbrus-8CV

Elbrus-8CV by měl opět proti předchůdci přinést podstatné zvýšení výkonu, tentokrát ale bude asi hlavně architektonické. Stále osmijádrový čip má zrychlit na 1,50 Ghz a velikost cache bude stejná jako u 8C. Rychlost bude zvýšena výrazným navýšením IPC – jádra Elbrusu-8CV mají údajně vykonávat až „50+“ operací za takt. Bude tedy zřejmě použito výrazně větší instrukční slovo, takže v jednom taktu program ke zpracování odešle víc instrukcí spojených do balíku. Ovšem při takto vysokém paralelismu se bude muset také hodně vytáhnout překladač, aby dokázal výpočetní prostředky navíc saturovat.

Roadmapa procesorů Elbrus-8C, Elbrus-8CV

Elbrus-8CV má zhruba zdvojnásobit matematický výkon jádra za takt. Architektura dnes podle MCST umí za takt 24 operací s plovoucí desetinnou čárkou nad hodnotou s jednoduchou přesností (32 bitů) a 12 operací při dvojité přesnosti (64 bitů). Elbrus-8CV má jedním jádrem za jeden takt zvládnout dvojnásobek. Celkový hrubý výkon v jednoduché přesnosti má být víc něž 512 GFLOPS, v dvojité 256 GFLOPS.

TDP Elbrusu-8CV má být dle plánů nezměněné, tedy 60–90 W, i když velikost čipu značně stoupne. Zatímco Elbrus-8C měří údajně 321,4 mm², Elbrus-8CV naroste na nějakých 435 mm², což už spíše než CPU připomíná výkonné GPU. Je možné, že již bude mít integrovaný paměťový řadič. Pokud ne, dostane alespoň nový čipset – má již totiž místo DDR3 podporovat paměti DDR4. Řadič bude jaždopádně opět čtyřkanálový a zvládne DDR4 na taktu 2400 MHz.

 

Díky binárnímu překladu lze spustit i Windows

Čipy Elbrus se musí vzhledem k exotičnosti architektury používat s vlastním portem Linuxu, což omezuje šíři jejich použití. MCST pro ně proto vyvíjí technologii dynamického binárního překladu v softwarové mezivrstvě. S tou je možné používat software pro architekturu x86 a dokonce i operační systémy – běží pod ní prý DOS, Windows XP/7, QNX, Linux a další. Výkon má přitom být až na úrovni 80 % rychlosti nativního kódu (otázka ale je, zda by to potvrdily i nějaké reálné testy).

Pro Elbrusy je vyvinut softwarový binární překladač, umožňující běh kódu pro architekturu x86/PC
Pro Elbrusy je vyvinut softwarový binární překladač, umožňující běh kódu pro architekturu x86/PC

 

I tak ale patrně Elbrusy stále nedoznají nějakého většího ohlasu mimo určitá citlivá průmyslová odvětví či vojenský průmysl. Pro PC to bude hardware příliš drahý, takže i dostupnost asi bude velmi omezená.

Zdroj: MCST (prezentace na Russian Super Computing Days)

Ohodnoťte tento článek!