IBM Power7+, velké železo s 80MB L3 cache, 8 jádry a kompresí operační paměti

0

Dnes se opět podíváme na jeden z procesorů, o kterých se přednášelo na uplynulé konferenci Hot Chips 2012. Jde o čip z kategorie takzvaného velkého železa, a sice o Power7+ z dílny IBM. Na toto CPU si smrtelníci jen tak nesáhnou; najdete ho časem v superpočítačích a serverech stojících nekřesťanské peníze.

Jak už jméno značí, Power7+ patří do rodiny CPU typu RISC, a používá architekturu POWER. Procesor si IBM vyrábí samo ve svých továrnách, a to na 32nm výrobním procesu (který by zřejmě měl být poměrně blízký tomu, co používá GlobalFoundries a potažmo AMD). Jeho předchůdce, Power7 (bez znaménka plus) vznikal ještě 45nm postupem.

Procesor IBM Power7

Čipy vládnou osmi procesorovými jádry, skutečně dechberoucí je ovšem jejich společná mezipamět. L3 cache totiž má velikost celých 80 MB, což je umožněno použitím technologie eDRAM namísto obvyklých buněk SRAM. Paměť eDRAM si vyžaduje mnohem menší počet tranzistorů, takže si celý čip údajně vystačí s 2,1 miliardy tranzistorů. Při použití SRAM by prý toto číslo vylétlo na téměř 5,5 miliardy. I s eDRAM je přitom Power7+ docela macatý čip, jeho plocha má činit 561 mm². Pro srovnání – osmijádrový Sandy Bridge-E měří 434,7 mm², grafický čip GF100 alias Fermi měl „jen“ 529 mm², GT200 pak 576 mm².

IBM Power7+, čip.

Novější výrobní postup umožnil také vyšší takty. Jak vysoko se dostanou sériové verze není zcela jasné, představitelé IBM ale mluví o 10–25% nárůstu. Existující CPU Power7 přitom dnes končí na nijak mrzkých 4 GHz. Z toho si snadno spočítáte, že novinka by se mohla dostat zhruba někam mezi 4,5 a 5 GHz. Vyšší takty jdou ruku v ruce s úspornými technologiemi. Power gating dokáže odpojit od napájení jednotlivá jádra, jakož i části paměti cache. CPU by také mělo (ve srovnání s předchůdcem) odebírat znatelné méně energie po dobu uspání do úsporného režimu.

Samotné jádro procesoru používá architekturu „out-of-order“. Instrukce jsou řazeny a rozdělovány mezi dvanáct různých výpočetních jednotek. Mělo by jít o dvě ALU, čtyři vektorové FPU, dvě jednotky pro zápis a načítání dat a dále jednotky pro provádění větvení a podmínek. Specialitou procesorů IBM Power je hardwarová podpora počtů v rámci desetinné číselné soustavy. Ty se hodí zejména finančním institucím, a Power7+ pro ně má speciální obvody. Ohledně dvanácté výpočetní jednotky nemám úplně jasno, v jádře se nachází ještě načítávač instrukcí a ISU, která je pořádá a rozděluje. Nejsem si ale jist, zda je lze brát za jednotky přímo vykonávající instrukce programu.

IBM Power7+, jádro.

Jádra mají vyhrazené mezipaměti první a druhé úrovně. Jejich velikost je již poměrně konvenční. Datová i instrukční L1 cache mají po 32 KB, zatímco L2 cache má kapacitu 256 KB, podobně jako například Nehalem či Ivy Bridge od Intelu. Jelikož jde o serverový procesor s poměrně velkým množstvím výpočetních prostředků v záloze, nepřekvapí vás asi, že každé jádro zpracovává více vláken najednou. Zatímco konkurenční Sparc T5 takto obsluhuje osm vláken, Power7+ zůstává na čtyřech, neboť nerezignuje na vysoký výkon v jednom vlákně. Zajímavé je, že tento procesor dokáže počet najednou zpracovávaných vláken dynamicky měnit, takže lze v případě potřeby plný výkon vyhradit jedinému vláknu.

 

Protože hrubý výkon není vše, používá Power7+ řadu (zejména kryptografických) akcelerátorů. Jde o jednotky pro výpočet algoritmů RSA a AES o různých silách klíče (512–4096, respektive 128–256 bitů) a hashování pomocí SHA-1, SHA-256, SHA-512 a MD5. Jak AES a RSA, tak hashovací jednotky jsou ztrojené. Navíc čip obsahuje generátor pravých náhodných čísel. Výkonnostní cíle pak sleduje jednotka MCD, která předvídá, zda budou přístupy do paměti směřovat do lokálního řadiče, či do paměti jiného procesoru. Power7+ má také dvě jednotky pro hardwarovou akceleraci komprese operační paměti. Ty urychlí technologii Active Memory Expansion, kterou IBM nabízí v operačním systému AIX.

Čipy Power7+ lze koherentně propojit do konfigurace s až 32 sockety, což je docela úctyhodná hustota. Vedle toho bude IBM vyrábět i dvoučipovou verzi procesoru (dohromady tedy půjde o 16 jader), která bude ale taktována níže. Socket, do kterého se čipy instalují, údajně zůstává stejný, stávající stroje však prý nové procesory nebudou podporovat. K tomu lze asi říct jen to, že platforma IBM nikdy nebyla pro zákazníky, kteří mají hluboko do kapsy.

Zdroj: The Register