Intel přináší 14 nm do serverů. Xeony E5-2600 v4 mají 22 jader a dvě v rezervě

1. 4. 2016

Sdílet

Ilustrační obrázek Autor: loriklaszlo – Depositphotos
Ilustrační obrázek

Datum (1. 4.) je dnes poněkud rozpustilé, ovšem v kontrastu s tím tu máme velice seriózní, ba i vážný počin. Intel totiž včera uvedl Xeony E5–2600 v4, kódově označované Broadwell-EP. Jedná se o vůbec první vysoce výkonné serverové procesory založené na 14nm procesu. Doposud měl totiž Intel kromě základních Xeonů E3 (což je přeznačený desktop) a úsporných SoC Xeon D svou hlavní a nejvýnosnější serverovou řadu Haswell-EP stále na 22nm procesu. Tedy v podstatě technologii procesorů Ivy Bridge z roku 2012. Nový 14nm proces s čipy Broadwell-EP tedy může přinést velké pokroky pro uživatele a samozřejmě i pro Intel.

Prvním a nejhmatatelnějším
přínosem nového výrobního procesu je zvýšení počtu jader.
V nejvyšší konfiguraci jich přibyla třetina, z 18
generace
Haswell-EP vydané v Q3 2014
 se Intel s Broadwellem-EP
dostává na 24 jader. Ovšem s tím zádrhelem, že dnes vydané
modely řady Xeon E5–2600 v4 pro dvouprocesorové sestavy plného
počtu nevyžívají. Maximální model končí na 22 jádrech, čímž
se náskok na 22nm generaci zmenšuje na čtyři jádra k dobru.
Model s 24 jádry bude zřejmě dostupný jen v řadě Xeon
E7, založené na stejném křemíku.

K tomu mají tato CPU v záloze
architektonická
zlepšení jader Broadwell
, jejichž IPC je dle úlohy obvykle až
o 3 % lepší než u Haswellu (Intel uvádí zlepšení
o 5 %, v praxi je ale obvykle procento nižší). Pro
asymetrické šifrování jako RSA má Broadwell přidány instrukce
ADCX a ADOX pro aritmetiku s libovolnou přesností.
Broadwell-EP také má konečně funkční instrukce TSX, které byly
uvedeny u Haswellu, ale poté zablokovány
kvůli chybě v návrhu čipu
. Navíc jen pro Broadwell-EP
byla zvýšen výkon instrukce PCLMULQDQ (násobení bez přenosu),
propustnost této operace vzrostla na dvojnásobek, což urychlí
symetrické šifrování AES údajně o 20–25 % a CRC
až o 90 %.

Tři verze křemíku

Broadwell-EP se bude vyrábět ve třech
verzích čipu s různou velikostí. Největší s 24 jádry
má mít zhruba 456 mm², 7,2 miliardy tranzistorů a jádra
má uspořádána v dvou prstencových sběrnicích, kde každý
má po dvou šestičlenných sloupcích. L3 cache je po blocích
distribuována u jader a podle toho, jak daleko se data
nacházejí, je latence variabilní.


Schéma 24jádrové verze čipu

Oba prstence jsou spojeny
přepínači ve dvou místech a napojují se na ně jednak
řadiče PCI Express a QPI a bloky home agent s dvěma
paměťovými řadiči, které dohromady poskytují čtyři kanály
paměti DDR4. Paměť také prošla upgradem, CPU podporují o
stupínek rychlejší takty – 2400 MHz místo 2133, 2133 místo
1866 MHz, a lowend povýšil z 1600 na 1866 MHz.

Druhá varianta má jader fyzicky
patnáct. V tomto případě stojí v pětičlenných
sloupcích a jeden z prstenců je obsazen jen jedním
sloupcem (takže na jednom je 10 jader a na druhém jen pět).
Čip má v této verzi mít výměru 306 mm² a nějakých
4,7 miliardy tranzistorů.


Patnáctijádrový a desetijádrový čip

Poslední verze, která by se za nějaké
dva měsíce zřejmě měla objevit
i v desktopu
, je desetijádrová a s 3,4
miliardami tranzistorů by měla zabírat 246 mm². Zde vidíte,
jak přínosný 14nm proces je, toto je totiž velikost
28nm APU Carrizo
s čtyřmi jádry, čipsetem a velkým
integrovaným GPU. Použita je již jen jediná prstencová sběrnice,
na níž sedí všech deset jader. Mělo by to znamenat v průměru
lepší latence do L3 cache, na druhou stranu ale tyto čipy můžou
mít zhruba o 5–10 % menší propustnost pamětí,
jelikož home agent a paměťový řadič je již jen jeden,
obsluhující místo dvou všechny čtyři kanály DDR4.

Zlepšováky pro servery

Broadwell-EP má v oblasti cache
jednu novinku: Resource Director Technology (RST) umí nejen
monitorovat, ale také regulovat využití L3 cache. Lze s ní
alokovat místo v L3 zvlášť pro jednotlivé procesy, vlákna,
nebo virtuální stroje. Při virtualizaci či podobném využití
tak lze zamezit tomu, aby jedna úloha vytěžující I/O brzdila
zaplňováním cache ostatní a technologie by měla umožnit
lepší „QoS“ i v dalších nasazeních.

Broadwell-EP má také zredukovány
výkonnostní postihy virtualizace (latence VM exitu) a umí
obsluhovat přerušení přímo uvnitř virtuálního stroje pomocí
přemapovávací tabulky. Tento tzv. „posted interrupt“ by již
měl být podporován v KVM a Xenu.

Poměrně podstatné by mělo být
zlepšené řízení spotřeby při použití instrukcí AVX. Jejich
256bitové registry a datové cesty poměrně razantně zvyšují
spotřebu CPU (což se projevuje i na desktopu, kde lze jejich
použitím dostat CPU přes TDP, ačkoliv se normálně při zátěži
pohybují značně níž). Na Haswellu-EP aktivita instrukcí AVX
srážela frekvenci všech jader na čipu o zhruba 200–400
MHz, neboť pro AVX mají procesory specifikovány nižší základní
i turbo frekvence. U Broadwellu-EP je toto chování
upraveno: jádra mění takt samostatně, takže ta postižená AVX
kódem spadnou níže, ale ostatní bez SIMD zátěže mohou zároveň
běžet na vyšších taktech. Pokud na serveru pracují různé
úlohy naráz a jen některé používají AVX (či AVX2), měl
by celkový výkon být lepší.

Víc jader, menší takty, někdy víc peněz

A teď již k specifikacím
modelů, které Intel vypouští na trh. Dobrá zpráva je, že jsou
kompatibilní s existujícími základními deskami (někdy i desktopovými platformy X99) a servery,
tedy za podmínky, že pro ně máte/dostanete aktualizaci UEFI.
Modely spolu s cenami shrnu zde do tabulky. V materiálech
od Intelu není bohužel uváděno turbo, to tudíž pochází
údajů
databáze ARK
. Základní takty procesorů se při zvýšení
počtu jader o dvě obvykle snížily o 100–200 MHz,
někde se (obvykle o 100 MHz) snížilo i turbo.

 Model  Jádra  Takt CPU Turbo L3 cache DDR4 QPI TDP Cena
Xeon E5–2699 v4 22 2,2 GHz 3,6 GHz 55 MB 2400 9,6 145 W 4115 USD
Xeon E5–2698 v4 20 2,2 GHz 3,6 GHz 50 MB 2400 9,6 135 W 3226 USD
Xeon E5–2697A v4 16 2,6 GHz 3,6 GHz 40 MB 2400 9,6 145 W 2891 USD
Xeon E5–2697 v4 18 2,3 GHz 3,6 GHz 45 MB 2400 9,6 145 W 2702 USD
Xeon E5–2695 v4 18 2,1 GHz 3,3 GHz 45 MB 2400 9,6 120 W 2424 USD
Xeon E5–2690 v4 14 2,6 GHz 3,5 GHz 35 MB 2400 9,6 135 W 2090 USD
Xeon E5–2683 v4 16 2,1 GHz 3,0 GHz 40 MB 2400 9,6 120 W 1846 USD
Xeon E5–2680 v4 14 2,4 GHz 3,3 GHz 35 MB 2400 9,6 120 W 1745 USD
Xeon E5–2667 v4 8 3,2 GHz 3,6 GHz 25 MB 2400 9,6 135 W 2057 USD
Xeon E5–2660 v4 14 2,0 GHz 3,2 GHz 35 MB 2400 9,6 105 W 1445 USD
Xeon E5–2650 v4 12 2,2 GHz 2,9 GHz 30 MB 2400 9,6 105 W 1166 USD
Xeon E5–2650L v4 14 1,7 GHz 2,5 GHz 35 MB 2400 9,6 65 W 1329 USD
Xeon E5–2643 v4 6 3,4 GHz 3,7 GHz 20 MB 2400 9,6 135 W 1552 USD
Xeon E5–2640 v4 10 2,4 GHz 3,4 GHz 25 MB 2133 8,0 90 W 939 USD
Xeon E5–2637 v4 4 3,5 GHz 3,7 GHz 15 MB 2400 9,6 135 W 996 USD
Xeon E5–2630 v4 10 2,2 GHz 3,1 GHz 25 MB 2133 8,0 85 W 667 USD
Xeon E5–2630L v4 8 1,8 GHz 2,9 GHz 25 MB 2133 8,0 55 W 612 USD
Xeon E5–2623 v4 4 2,6 GHz 3,2 GHz 10 MB 2133 8,0 85 W 444 USD
Xeon E5–2620 v4 8 2,1 GHz 3,0 GHz 20 MB 2133 8,0 85 W 417 USD
Xeon E5–2609 v4 8 1,7 GHz 20 MB 1866 6,4 85 W 306 USD
Xeon E5–2603 v4 6 1,7 GHz 15 MB 1866 6,4 85 W 213 USD
Xeon E5–2658 v4 14 2,3 GHz 2,9 GHz 35 MB 2400 9,6 105 W 2040 USD
Xeon E5–2648L v4 14 1,8 GHz 2,5 GHz 35 MB 2400 9,6 75 W 1544 USD
Xeon E5–2628L v4 12 1,9 GHz 2,5 GHz 25 MB 2133 8,0 75 W 1364 USD
Xeon E5–2618L v4 10 2,2 GHz 2,4 GHz 25 MB 2133 8,0 75 W 779 USD
Xeon E5–2608L v4 8 1,6 GHz 20 MB 1866 6,4 50 W 441 USD
Xeon E5–2687W v4 12 3,0 GHz 3,5 GHz 30 MB 2400 9,6 160 W 2141 USD

Jak je zvykem, modely s „L“
v názvu značí úsporné verze, „W“ je model pro pracovní
stanice a čipy se sedmičkou na konci čísla preferují vysoké
takty před počtem jader (u zbytku je to spíš naopak). Čipy
končící na osmičku doporučuje Intel pro úložiště
a síťovou/komunikační infrastrukturu. Ceny se v některých
případech nemění, u některých modelů se ale zvýšení počtu
jader odrazilo ve zdražení (zhruba do 10 %).


Broadwelly-EP na nerozřezaném waferu (Zdroj: ComputerBase)

Zdroje: ComputerBase,
AnandTech,
 Intel

Autor článku

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Kvíz týdne

Tyto konektory zná každý. Ale víte, co jejich zkratky doopravdy znamenají?
1/9 otázek