Intel má 48jádrové procesory Xeon. Cascade Lake-AP jsou MCM slepené ze dvou čipů

21

Jak asi víte, Intelu se poněkud zkomplikovaly plány budoucích procesů kvůli zpožděné dostupnosti 10nm procesu. Nedávno se dokonce objevily zvěsti, že musel být kompletně zrušen, které ale firma hned popřela. První 10nm produkty proto musely být nahrazeny dalšími 14nm čipy, což se kromě PC (teď s osmijádry Coffee Lake Refresh) týká i serverů. Intel byl problémem s 10nm procesem přinucen k neobvyklým řešením, takže nyní přichází s něčím, co dosud nepraktikoval – vícečipovými („MCM“) procesory.

 

Cascade Lake-AP: lepidlo nyní i od Intelu

Jako konkurenci pro současné či asi hlavně nadcházející 7nm procesory AMD Epyc oznámil polovodičový gigant procesory Cascade Lake „Advanced Performance“ (Cascade Lake-AP). Ač ještě před rokem firma MCM řešení v prezentacích pro média shazovala jako „slepenou“ náhražku, která je horší než monoliticky čip, nyní toto řešení aplikuje také. Xeony Cascade Lake totiž budou přesně jako Epyc slepené z více čipů v jednom pouzdře.

Cascade Lake-AP budou ovšem na rozdíl od Epyců zřejmě tvořené ne čtyřmi, ale jen dvěma čipy (takže srovnatelné to bude spíše s dřívějšími Opterony řady 6000). Motivace je patrně taková, že na 14nm procesu už by kvůli velikosti křemíku Intel nebyl schopen přidat další jádra v dostatečném počtu. Dvojčipový Cascade Lake-AP ovšem bude mít až 48 jader. Tedy 24 na čip. Ale jelikož asi používá stejný 14nm křemík Cascade Lake-SP jako příští generace standardních Xeonů (má opět obsahovat 28 jader), asi by zde ještě mohla být rezerva ke zvýšení až na 56 jader. Ovšem Intel ji nemusí využít, je možné, že 2 × 24 jader bylo shledáno jako optimum kvůli spotřebě.

12kanálové paměti

Výhoda plynoucí ze „slepence“ bude, že procesor bude moci použít paměťový řadič obou křemíků. Cascade Lake-AP bude totiž mít 12kanálový řadič pamětí DDR4, tedy asi 12 nebo 24 slotů DIMM na jeden socket. Měly by tedy podporovat dvojnásobek paměti RAM proti dnešním Xeonům Scalable (Skylake-SP) pro platformu LGA 3647. Na jeden socket by to bylo 3 TB se 128GB moduly nebo 6 TB s novými 256GB moduly.

Toto logicky znamená, že musí být použitý jiný socket, v zákulisních zprávách se objevilo označení LGA 5903. Rozměr pouzdra by tak asi mohl být hodně velký. Procesor je podle všeho ekvivalentem dvou standardních Xeonů v jednom, čipy jsou uvnitř propojené sběrnicí UPI běžící substrátem CPU. Je to tedy řešení velmi podobné tomu od AMD, není použito nějaké pokročilejší zapouzdření s interposerem ani technologie EMIB. Jeden Xeon Advanced Performance je tak ekvivalentem dvousocketového serveru. Zřejmě to také znamená, že maximální konfigurací bude asi 4S sestava (místo 8S u Xeonů Platinum). V materiálech, které Intel ukázal, se mluví o 2S (dvousocketových) serverech s těmito MCM procesory, které se reálně budou chovat jako 4S. Konfigurace 2S by asi mohla být nejčastější.

Cascade Lake-AP: dva čipy v jednom pouzdře dávají procesor s až 48 jádry
Cascade Lake-AP: dva čipy v jednom pouzdře dávají procesor s až 48 jádry

Výkon 48jader Cascade Lake-AP by měl podle Intelu být velmi vysoký. Dvouprocesorová sestava (tedy s dvěma dvoučipovými procesory) s celkem 96 jádry má proti dvousocketovému serveru s Epycy 7601 (což je nejrychlejší model od AMD s 32 jádry) mít až 3,4× vyšší výkon v Linpacku (HPC floating point výpočty s využitím AVX-512) a až 1,3× vyšší výkon v Stream Triad.

Proti nejrychlejšímu jednočipovému Xeonu Platinum 8180 má Cascade Lake-AP být rychlejší 1,21× v Linpacku, v Stream Triad pak 1,83× (tento benchmark by měl testovat efekt paměťové propustnosti, tedy zde dvojnásobného počtu kanálů paměťového řadiče). Protože architektura Cascade Lake má nové instrukce pro vyšší výkon v operacích strojového učení, mají Cascade Lake-AP v těchto úlohách být až 17× rychlejší než Xeon Platinum 8180 (Skylake-SP). Cascade Lake má jinak také opravené některé bezpečnostní díry, z čehož bude verze AP samozřejmě také profitovat.

Architektura Cascade Lake je sice refresh serverových jader Skylake-SP, ale přináší některé opravy zlepšení a nové instrukce pro strojové učení
Architektura Cascade Lake je sice refresh serverových jader Skylake-SP, ale přináší některé opravy zlepšení a nové instrukce pro strojové učení

Výzvy: spotřeba, cena, velikost

Více podrobností a parametrů zatím Intel nesdělil. Zatím tedy těžko říct, jak vysoká například bude cena, ale také zůstává tajemstvím TDP. Spotřeba bude asi docela zásadní, protože už jednočipové Xeony Platinum mohou mít TDP i přes 200 W. Cascade Lake-AP bude tedy buď mít hodně velký příkon na socket, nebo snížené takty, což by ale také snižovalo výkon.

Kromě toho bude také zajímavé vidět, jak rozměrné bude pouzdro. Už socket SP3 pro Epycy dělá výrobcům desek problémy, je zdá se hodně náročné na jednu serverovou desku dostat dva sockety a dvakrát 16 slotů DIMM pro paměti, aby byly možnosti řadiče DDR4 plně využity. Zde bude 2S server potřebovat 2×24 kanálů a prostor vyhrazený pro CPU bude možná ještě větší. Je možné, že 2S servery budou realizovány dvěma propojenými deskami, nebo u nich bude nutné osazovat jen 12 slotů pro RAM na socket (tedy jen jeden DIMM na kanál). Bude asi docela zajímavé vidět, jak si výrobci desek a Intel s návrhem pouzdra a PCB poradí.

Velké ryby už mají vzorky

Reálné uvedení na trh nastane u těchto CPU až příští rok (2019), dnešní oznámení je tedy jen papírové. Vydání by mělo nastat ve stejný den, jako u standardních Xeonů Cascade Lake-SP. Ovšem vzorky a rané verze těchto procesorů již existují, Intel sdělil, že privilegovaní velcí zákazníci typu Amazon/Google už v rámci raného přístupu procesory Cascade Lake-AP dostávali již v třetím čtvrtletí.

Intel má 48jádrové procesory Xeon. Cascade Lake-AP jsou MCM slepené ze dvou čipů

Ohodnoťte tento článek!
5 (100%) 17 hlas/ů

21 KOMENTÁŘE

    • Na druhej strane AMD to lepi s 8 jadrovich CPU a intel s orezanich 28 jadier. Tak že Intel len obrovske monoliti dal do kopi a cena 6000-8000 € ? Tu AMD ktore chce 1600€ za 32 jadro sa zda že ako keby ich zadarmo predavalo 😀

      • Myslim si, ze to je spis zacatek, prvni vlastovka Intelu, pokud je to poskladane ze 2xCPU. Uvidime co ukazou v dalsich generacich.
        AMD melo tu vyhodu, ze zacalo kompletne od piky s timhle MCM navrhem. Byl to risk, ale zatim se zda ze jim to vyslo vyborne.

      • Ono si myslim ma Intel docela z AMD serveru druhe generace docela bobek, aby jim nevzali cast marketshare. Zaznelo to to tenkrat neprimo i ve vyjadreni Krzanicha. Tahle oznameni rok dopredu to docela i podporuji.

    • No, C2Q (nebo Pentium D) už jsou přece jenom docela daleko. Legrace je, že tehdy to bylo přesně naopak, AMD mu to hanilo že to není „nativní“. Holt marketing vždycky chválí/tvrdí to, co se zrovna hodí.
      Jinak si teda myslím, že to jednodušší a levnější nebude, spíš opravdu nemají jinou možnost protože třeba 1000mm2 čip udělat nejde.

            • TLB bug měla revize B2, modely končící na 50 už to nemají. Za nízké frekvence to nemohlo (byla to logická chyba, výkon snížilo deaktivování toho TLB při stejném taktu), ty byly zaviněné asi taky 65nm procesem. To se projevilo i u Athlonů 64 (K8), které taky měly nízké frekvence a výkon, AMD mělo nejrychlejší K8ky až do konce jenom na 90nm procesu, kde se dostali na 3,2 GHz. 65nm modely se ze začátku dostaly jenom asi na 2,7 GHz a trvalo rok, než se to nějak vyřešilo (3,0-3,1 Ghz měly K8ky na 65nm až někdy v půlce roku 2008).

      • Je ovšem třeba připomenout, že tehdejší jádra v Intel CPU mezi sebou komunikovala přes FSB, tedy přes centrální sběrnici, která se sdílela se všemi komponenty, jako RAM, VGA atd., a už tehdy v té komunikaci bylo „našlapáno“. Dnes mají procesory jak AMD, tak Intel pro jádra CPU vlastní nezávislou sběrnici, což je dost rozdíl

  1. To porovnání výkonu, co Intel udělal, je úplně mimo mísu. Jejich 48 jádrový slepenec nemá HT (kvůli spotřebě), a proto na AMD platformě taky vypnuli HT 🙂 Což je samozřejmě blbost, protože nejsilnější Epyc má už z továrny konfiguraci 32C/64T, a ne 32C/32T. Takže uměle snížili výkon konkurence, aby jim vycházely vyšší čísla.