Intel před vydáním procesorů Alder Lake odhalil detaily hlavního, velkého jádra procesorů Alder Lake, architektury Golden Cove. A my máme pro vás rozbor toho, co je v něm nového a proč je to jedna z největších událostí v x86 procesorech za dlouhou dobu.
Procesory Intel Alder Lake budou asi největší hardwarová událost letoška. Jsou ještě přes dva měsíce daleko, ale už jsme dostali snad nejvíc očekávané info: Intel odhalil architekturu jader těchto CPU. Ta slibuje velké navýšení výkonu – půjde o jeden z největších architektonických skoků v x86 procesorech. Například poprvé přináší šest paralelních dekodérů a další posílení IPC, čímž Intel jde podobou cestou jako účinná jádra Applu.
Architektura Golden Cove: historicky nejvýkonnější frontend u x86
Už delší dobu je známé, že Alder Lake přechází na koncepci „big.LITTLE“, kombinující výkonnější a slabší (ale úspornější) jádra. Intel zveřejnil jak informace o tzv. „velkém jádru“, tak o „malém“, které mu bude asistovat pro vyšší mnohojádrový výkon (případně jako více energeticky efektivní jádro pro provoz méně náročných úloh na pozadí a podobně).
Nejdřív se ale budeme zabývat tím velkým. Intel mu nyní oficiálně říká „Performance Core“ neboli P-Core (jeho dřívější kódové označení je Golden Cove) a jeho rolí je dosáhnout co nejvyššího jednovláknového výkonu, což je parametr určující výkon mnoha běžných aplikací a potenciálně responzivnost systému.
Golden Cove by mohlo konečně uspokojit ty, kterým se zdálo, že Intel už dlouho nepřinesl něco opravdu nového a jednotlivá jádra od Sandy Bridge z roku 2011 jsou pořád podobná. Golden Cove přináší architekturu, která sice z jejich DNA vychází (tak to dnes ale chodí u všech architektur), ale jeho základní bloky byly předělány a v podstatných parametrech je výsledkem mnohem větší a silnější jádro. Výrazně rozšiřuje a prohlubuje out-of-order engine směrem k vyššímu IPC a skok ve výkonu by měl být velmi velký. Podle Intelu má dokonce jít o největší upgrade mikroarchitektury jádra za poslední dekádu, což by Golden Cove (a procesory Alder Lake) stavělo na úroveň předělu, jakým byla právě ta architektura Sandy Bridge.
Golden Cove funkčně navazuje na předchozí 10nm „velké“ jádro Sunny Cove/Willow Cove, funkčně je podobné včetně toho, že podporuje HT, tedy současné zpracování dvou vláken na jednom jádru. To dovoluje v mnohovláknovém kódu zlepšit výkon díky tomu, že se lépe využijí výpočetní prostředky jádra. Jádro by také mělo dosahovat podobné nebo vyšší frekvence, jaké jme viděli v čipech Rocekt Lake nebo Tiger Lake, používá se pro něj totiž dokonalejší výrobní proces Intel 7 (dříve označovaný jako 10nm Enhanced SuperFin).
Tip: Intel ukázal plán výrobních procesů: 7nm, 4nm, 3nm, 20A a 18A technologie – s pomocí přečíslování
Celkově Golden Cove přidává a zvětšuje většinu věcí v jádru a zjednodušeně by se architektura dala přirovnat ke koncepci, kterou sleduje Apple, včetně zvýšení počtu ALU v jádru. Ovšem ALU samotné jsou ve fungování procesoru až spíš na konci procesu, popis architektury začneme místo toho v tzv. Frontendu, kde pouť instrukcí/výpočtů začíná.
Jádro bořící mýty o fundamentálních limitech architektury x86?
Právě Frontend je možná místo nejzásadnější nebo možná nejsymboličtější změny. Golden Cove zvětšuje „šířku“ jádra, znamenající, kolik instrukcí se může paralelně zpracovat za jeden cyklus, hned zde na začátku. Od architektury Conroe/Core 2 měla jádra Intelu pořád čtyři dekodéry, a tedy dokázala zpracovávat až čtyři instrukce za takt. Sandy Bridge k tomu před víc jak deseti lety přidalo μOP cache pro již dekódované instrukce, která umožňuje dekodéry obejít, pokud jádro nalezne potřebné instrukce již v této cache (jednak to zvyšuje výkon, druhý účel je snížení spotřeby), ale jinak čtyři dekodéry zůstaly – až doteď.
U Golden Cove Intel rozšířil počet dekodérů na šest, takže jádro je odteď „6-wide“ a bude schopné dekódovat až šest instrukcí za cyklus. Širší dekódování už má jen Apple, u kterého je jádro Firestorm v čipech M1 a A14 už 8-wide, naproti tomu Zen 3 od AMD je pořád 4-wide. Schopnost Golden Cove dekódovat šest instrukcí bude asi mít některá omezení, kdy tzv. komplexní instrukce budou mít tuto propustost sníženou, protože je budou zpracovávat jen některé z dekodérů („complex decoder“), zatímco většina („simple decoder“) by mohla zpracovávat jen obyčejnější instrukce. Komplexní instrukce jsou typicky ty, které produkují více než jeden μOP v dalším zpracování.
Cenou za rozšíření dekodérů je zřejmě prodloužení pipeline o jeden přidaný stupeň, který asi pomohl toto rozšíření realizovat (protože se dekódování rozložilo do více pipelinovaných kroků). Toto je vidět na údaji, že postih za chybně odhadnuté větvení se zvýšil – ze 16 na 17 cyklů.
Architektura x86 víc než čtyři dekodéry neumožňuje…
Toto je zajímavé i proto, že v kontextu ARM procesorů Apple s velmi širokým jádrem (ale nízkými frekvencemi) se v poslední době hojně vynořovaly názory, že podobná architektura je možná jen s ARMem a u procesorů x86 nikoliv kvůli tomu, že jejich instrukce mají variabilní délku a některé další komplexnosti. Zvlášť vyhraněné názory to podávaly rovnou tak, že víc jak čtyři dekodéry u x86 jsou takřka nemožné.
Toto téma asi je tak populární i proto, že jádra x86 se od ARM liší právě ve frontendu do fáze dekódování, po ní už se rozdíly stírají. „Limitace x86“ ve fázi dekódování proto byla brána jako argument pro to, že architektura x86 nemá budoucnost a je třeba přejít na ARM. Vypadá to ovšem, že Intel teď svým použitím šesti dekodérů/6-wide v architektuře Golden Cove tuto argumentaci zkomplikuje. I když si zatím musíme počkat, než uvidíme výsledek a zda zde přece jenom ty komplikace x86 nejsou nějak relevantní, například zda 6-wide nevede k neúměrné spotřebě.
Spolu s posílením dekódování Intel rozšířil i předcházející fázi zpracování, tzv. Fetch, která čte kód (tj. proud instrukcí) z instrukční L1 cache procesoru a předává ho do dekodérů. I zde měl Intel dlouhou dobu další významné omezení, ještě od Pentia Pro četl Fetch maximálně 16 bajtů za cyklus, ne víc. Některé instrukce x86 přitom mohou být hodně dlouhé (třeba až 8 bajtů), takže toto mohla být někdy limitace i pro 4-wide jádro (který ovšem stejně jako dekódování obchází μOP cache). V Golden Cove je Fetch poprvé dvojnásobný a dodává 32 bajtů kódu za cyklus.
Je třeba říct, že podle profilování typicky výkon jádra (respektive IPC) v aplikacích typicky vůbec nedosahuje ty čtyři instrukce za cyklus. Často jsou obvyklé programy blíž v průměru jedné instrukci za cyklus než čtyřem nebo zde šesti. Je to kvůli větvení, čekání na data z paměti nebo proto, že závislosti jedné instrukce na druhou znemožňují vykonat větší počet instrukcí najednou. Jen čtyři dekodéry v předchozích CPU proto nemusely být takový drastický omezovač výkonu, jak by se mohlo zdát. Ale rozšíření této části umožní zvýšit výkon v těch případech/momentech v kódu, kde potenciál pro větší instrukční paralelismus je. Pro navýšení IPC nad určitou úroveň se k tomuto rozšíření asi jednou přikročit musí – Intel zřejmě rozhodl, že je vhodná chvíle teď.

μOP cache,instrukční L1 cache
Instrukční L1 cache nechal Intel stejně velkou jako mají starší jádra (nebo AMD Zen 2/3), má jen 32 KB – oproti 192KB kapacitě v jádru Apple Firestorm. Byl ale zlepšen L1 TLB (Translation Look-Aside Buffer) pro instrukce, jenž má 256 místo dřívějších 128 položek a 32 místo 16 položek pro velké (2MB/4MB) stránky paměti. Také je vylepšený prefetch do L1 instrukční cache.
Ruku v ruce s posílením dekodérů ale je posílená i μOP cache pro již dekódované instrukce. Stále totiž platí, že architektura jádra počítá s tím, že většinu času nebudou instrukce k vykonávání proudit přes dekodéry, ty mají podle Intelu typicky být 80 % času neaktivní (vypnuté) pro úsporu energie díky tomu, že se potřebné instrukce (již dekódované na μOPy) najdou místo toho v μOP cache. Předchozí jádra Intelu (nebo Zen/Zen 2 od AMD) uměla z μOP cache dodávat až šest instrukcí za cyklus, což Golden Cove rozšiřuje na 8 μOPů za cyklus (stejný počet dodává μOP cache AMD Zenu 3).
Zároveň byla také zvětšena kapacita, takže se zvyšuje šance (hit-rate), že procesor zde instrukce najde a nebude muset zapnout dekodéry a do cache se vejdou i výrazně delší smyčky kódu. Zatímco Skylake mělo kapacitu 1500 instrukcí a Sunny Cove/Willov Cove/Cypres Cove to zvýšilo na 2250, jádro Golden Cove posiluje kapacitu rovnou na 4000 (v tomto parametru bylo AMD trošku napřed, tuto kapacitu měl již Zen 2, u Zenu 3 je nezměněná).
Fronta μOP Queue vycházejících z μOP Cache byla také mírně prohloubena, má 72 místo 70 položek pro každé ze dvou vláken, které může architektura zpracovávat (Golden Cove podporuje HT neboli SMT a jedno jádro zpracovává dvě vlákna najednou). Nová by ale měla být schopnost tyto separátní fronty pro každé vlákno spojit do jedné o 144 místech, pokud procesor zpracovává jen jedno vlákno místo dvou.
Po frontě μOP Queue následuje fáze Allocation a Rename, v níž se alokují pro operace jejich pracovní registry, případně se pro eliminaci konfliktů architektonické registry přejmenovávají (substituují za jiný z fyzického souboru registrů). Také tato fáze zpracování umožňuje zpracovat šest operací (μOPů) za cyklus, zatímco předchozí architektury Intelu uměly maximálně pět. Zde je vidět, jak byly pro vyšší IPC v tomto jádru upraveny prakticky všechny fáze zpracování.
Výkon by mělo dále zlepšit posílení schopností procesoru v této fázi řešit konflikty eliminovat více instrukcí, které dále už nemusí jít do výpočetních jednotek a jsou vyřešeny již zde. V této fázi CPU provádí eliminaci MOVů (v Alder Lake by snad opět měla fungovat, zatímco v Ice/Tiger/Rocket Lake měla erratum a musela být vypnutá) a dalších instrukcí, která nevyžadují použití výpočetní jednotky. Další případ eliminovaných instrukcí jsou například operace jako XOR registru se sebou samým k jeho vynulování (protože tato operace není závislá na předchozí hodnotě registru), jejíž eliminaci už procesory umí delší dobu. Jak se přesně v tomto směru zlepšily schopnosti jádra Golden Cove, Intel ovšem neříká.

Výrazně vylepšená predikce větvení
Ještě než se podíváme na další část jádra, kde dochází k out-of-order optimalizování pořadí instrukcí a poté jejich vykonávání, je potřeba zmínit prediktor větvení, který je ve frontendu a v procesu zpracování instrukcí přichází na řadu velmi brzy.
Tato část procesoru je architektonickými týmy laděna kontinuálně, takže by měla doznávat zlepšení v každé nové generaci CPU, pokud v ní není beze změn „refreshované“ jádro z generace předchozí. V Golden Cove má však být predikce hodně vylepšená. Přesnost (úspěšnost) prediktorů je sama o sobě lepší, současně mají také ale k dispozici o hodně víc paměti, což by mělo dále predikci vylepšit, protože prediktor má k dispozici víc dat/informací. L2 Branch Target Buffer (BTB) má nově kapacitu 12 000 položek proti 5000 u předchozí generace architektury (Zen 3 by měl mít 6500).
Článek pokračuje na další stránce.
Nemůžu si pomoct, ale Alděro mi čím dál tím víc připomíná Čapkovu pohádku Jak pejsek s kočičkou dělali dort.
Big jádro vypadá impozantně, ale bude tak i fungovat? Výsledky benchmarků jsou jedna věc, reálné aplikace druhá. K tomu ta patálie s Little jádry, nutnost interního scheduleru bude pro spoustu stávajících aplikací asi docela problém. Prostě mi to přijde, že si u Intelů prošli jak to dělají u konkurence, vyzobali si to nejlepší a „upekli“ dort. Tak jsem zvědavý, jestli z toho někdo dostane břichabol. 😀
Prijde mi to podobne, hlavne co se tyce podpory a ruznych nechtenych prekvapeni u pouzivaneho SW.
Pokud je pravda, ze AMD prijde u Zen5 taky s konceptem B+L, tak to aspon Intel do te doby ‚prohackuje‘ 😉
Nicmene koncept nekolika velkych a bambilionu malych jader mi prijde trochu ujety. Chapal bych to spis naopak, kde by to davalo smysl aspon z hlediska spotreby, ale tak tyhle ‚jadyrka‘ jen duplikuji praci velkych jader, ktere nejspis vyr. proces Intelu ma problem ‚utahnout‘.
Hlavně nechápu to s tím průměrným výkonem, jak jako v nějaké aplikaci 0,8 ? To jako má Alder Lajk v nějakých aplikacích menší výkon, než dnešní procáky ? Takže si pustíte nějakej Half-Life 2 a pojede vám s 15ti FPS ? To jako nechápu. A nechápu jako ty cykly, místo toho aby je zkracovali a zpracovávali paralerně, tak jako ještě přidají a prodlouží cestu aby to bylo ještě delší a program čekal na výsledek ještě dýl ? Připomíná mi to rozdíl mezi první a druhou oktávkou, první oktávka, sice nic moc, ale 5 hrnek s turbem trhalo asfalt, přitom všechny komponenty logicky uspořádaný a servis na pohodu. Dvojková oktávka, přesnej opak, všechno co mohli to zašantročili, čidlo otáčení hřídele narvaný kdesi zespod bloku motoru, kde musíš napřed odšroubovat půl podvozku aby ses k němu dostal apod. Říkám tomu renaultizace, kdy prostě schválně přidělávají složitost a přístup k obsluze motoru, aby to bylo jakože komplikovanější, aby to mohli dělat jen autorizované servisy se speciálním vybavením a pak si za to mohli patřičně připočítat normohodiny. Prostě jak kdyby se chtěli podrbat pravou rukou za levým uchem. Takže fakt nechápu to IPC kde chtějí aby se to zrychlovalo, přitom se to zpomaluje ? Mám takový dojem, že tohle bude teprve testovací sada a testovat se to bude na zákaznicích jako nVidia testovala RT jádra a až další řada procáků ukáže jestli to mělo smysl a kde přidat a kde ubrat. Jako ještě zvážím, jestli nepočkat na vylepšenou tack verzi – asi raptor lajk.
„A nechápu jako ty cykly, místo toho aby je zkracovali a zpracovávali paralerně, tak jako ještě přidají a prodlouží cestu aby to bylo ještě delší a program čekal na výsledek ještě dýl ?“
Jestli myslíte ten přidaný stupeň pipeline behěm dekódování a o jeden cyklus horší postih za špatně odhadnuté větvení, to není nic nad čím by se bylo třeba pozastavovat.
Ten procesor je pipelinovaný jako všechny, takže přidaný stupeň v pipeline znamená, že to má o ten jeden cyklus delší latenci, než jedna pomyslní operace proleze z úplného začátku zpracování na úplný konec. Pokud je ta hloubka třeba 17, tak se během fetche, dekódování, všech těch řazení, pak přiřazení do jednotek a vykonání postupně posouvá těmi stupni pipeline a každý ji trvá jeden cyklus. Současně jde ale o jeden cyklus pozadu hned další instrukce (a paralelně s ní mohou jít také další instrukce ve stejném stádiu, samozřejmě). V jednom okamžiku má ten procesor rozpracované najednou instrukce ve všech těch 17 stupních zpracování.
Přidání supňů do pipeline neznamená automaticky, že se tím snižuje výkon na 1 MHz. Pokud se predikce větvení dostatečně vylepší, aby absorbovala větší postih při mispredikci, tak ve výsledku nevadí, že je pipeline hlubší.
Je pravda, že je výhoda mít pipeline o míň stupních, může to pomáhat IPC, ale zase to sníží frekvenci, kterou to CPU může dosáhnout.
Ano takto jsem to pochopil a právě proto se mi to zdá nelogické.
Aspoň to ženie vyvoj ku predu, cca o štvrť roka pride AMD s ZEN3+ na 6nm a aj oni slubuju nejakych 19% narast, tak že aj ked by bola pravda čo piše intel, ale ani to možno nebude stačiť. Druha vec je spotreba, nejak sa Intel nechvali žeby efektivita bola väčšia a spotreba nižšia…
se na to podívej, co měl skylajk osm, tak alder má mít 12, s tím chcou udělat díru do světa? WTF, pokud měl skylajk něčeho 8, tak alderlajk měl toho mít 16+ aby to trhalo asfalt a žralo AMD procesory jak drtička odpadu. Tady jen kosmeticky přidali další fíčury, který jsou ve finále pro nás neužitečný, nebo dokonce snižují výkon. WTF LOL !!!
„Intel Alder Lake má historicky nejvyspělejší x86 jádro. Rozbor CPU architektury Golden Cove“
název zní skutečně bombasticky, ale dosažený výsledek vzbuzuje spíše rozpaky. IPC vzhledem k velikosti jader, množství tranzistorů, širokému front-endu vlastně spíš podprůměrné… už jen to že je IPC srovnáváno se starší generací Cypress Cove / Rocket Lake a nikoliv Willow Cove nezní dobře, výkon je náháněn kombinácí vysokých taktů ( daní za vysokou spotřebu ) a zapojením „malých“ jader Gracemont pro pěkné výsledky v Cinenebenchi a nižší spotřebu ….
konkurence je potřeba, ale zdá se že AMD je stále lepší volbou . Alder Lake si dá k obědu už Zen3 a verze c V-cache to jen umocní a až vyjde Zen4 Raphael, tak bude vymalováno .-)
PS: bylo by fajn, kdyby se všechny ty „revoluční“ změny v jádrech Golden Cove promítnuly do výsledného výkonu, ale což, zákazníky si to určitě najde a když nic jiného, tak je co číst a aspoň není nuda 😀
bude stejný článek i malých jádrech v AL ?
cit. z článku “ V následujících dnech se podíváme i na architekturu tohoto „malého“ jádra, předběžně se ale už dá říci, že tato jádra by mohla k výkonu velkých jader Golden Cove přidávat o dost víc výkonu, než se většinou očekávalo.“
Nezájem, co bude krmit word a excel mě nezajímá.
Parádny rozbor, domnievam sa, že aj rôzny docenti a pod. fajnšmekri veľkých jadier si prídu na svoje…
Už sa teším v nasledujúcich dňoch aj na tunajší rozbor mikroarchitektúry malých „atómových“ E-jadier Gracemont, ktoré sú pre mňa v celom koncepte big.LITTLE na rozdiel od väčšiny tie zaujímavejšie avšak spoločne a nerozdielne s veľkými P-jadrami Golden Cove zmenia konečne paradigmu jednej dekády „jednojakosti“ vo svete x86.
Tá zmena“jednoakosti“ bude zrejme nevyhnutnosť s blížiacimi sa limitmi kremíkovej éry. Dôležitejšia otázka ako kedy to nasadiť, je v akom pomere to nasadiť. Osobne sa nazdávam je počet veľkých a malých jadier, by mal byť maximálne 2:1 alebo 3:1 v prospech veľkých jadier a nie opačne ako sa to bude snažiť robiť Intel …ten to robí preto lebo musí, lebo nemá čiplety zatiaľ a pridávanie jedného veľkého jadra by mu dvíhalo plochu čipu rovnako ako pridanie 4 malých jadier a tie budú mať v multi-core vyšší výkon ako jedno veľké jadro. To ale nič nemení na tom, že malé jadrá sa majú starať o OS a aplikácie na pozadí a veľké jadrá majú podávať výkon v hlavných aplikáciách a hrách. Aj veľké jadrá vedia v nečinnosti byť úsporné a takmer sa úplne vypínajú, žravé obludy z nich robí iba pracovná frekvencia, ktorá je vyhnaná za optimálnu úroveň (veľakrát až „na krv“ vybičovaná). Preto Intel porovnáva Alder Lake a Rocket Lake na 3.3Ghz, lebo veľké jadrá na 5Ghz a 10nm+++ superFin (pardón Intel 7) to bude zrejme iné peklo.
A ruku na srdce Intel 10+nm 10++nm a 10+++nm (Intel 7) je nedostatková a … a áno aj to je jeden z dôvodov z pred pár rokov poznajúc svoje limity litografie a hľavne jej/ich konzervatívny výhľad prečo za spoločný stôl sadli teami big.LITTLE.
Uvidíme ako Intel namiešal alchímiu P-jadier a E-jadier v big.LITTLE pretože po veľmi dlhej dobe je to od Intelu naozaj veľmi slušných kus R&D ruku v ruke so zmenou paradigmi v microarchitektúre x86.
INTEL GRACEMONT MICROARCHITECT DETAIL
zdroj: https://www.youtube.com/watch?v=lBwYdoQp8B0
INTEL GOLDEN COVE MICROARCHITECT DETAIL
zdroj: https://www.youtube.com/watch?v=e5LEpkJbqeI
Ahoj chlapci, Intel odviedol skvelú prácu.
Alder Lake bude bezpochyby predajný hit…
Veľmi príjmne prekvapila dispozícia malých
jadier a technológia Intel Thread Director,
teda koniec obavám o prideľovanie úloh
procesorovým jadrám hybridnej technológie.
Bezkonkurenčná vyspelosť veľkých jadier
pojednávaná v profesionálne spracovanom
článku je vskutku interesantná.
Začína nová desktopová éra, zbrusu nová
platforma a špičkové procesory rodiny AL.
Takže, kto plánuje nový počítač, voľba je
jasná, Alder Lake prichádza…
Tu by som si až taky isty nebol, vela veci (podstatnych) je v tom članku vynechanych.
Za prve bude o 19% vykonejši na rovnaky takt, ale zabudli povedať že keby nahodou bol vyrabany 10nm od Intelu tak ten sa neda až tak vysoko taktovať, tu sa max takty daju očakavať kolo 4,5GHz a nie 5,3GHz.
Môže sa velmi lahko stať že jeho vykon neprekona terajšiu Intel generaciu a ked len o par 2-4 %
Jasna volba Intel o tom trochu pochybujem, hlavne ked bude spolu s Intel CPU vydane aj AMD ZEN3+ na 6nm ešte vyšie IPC ešte vyšie takty a ešte uspornejšie. Ako Intelu fandim a tiež mu prajem vysoky vykon nech 16 jadrove CPU od AMD ZEN3+ 6950 stoji 300€ max 🙂 ale zatial to vyzera na tych 900€ bez konkurencie 🙁
snajprik, kde ty na tie čísla chodíš…
Článkov na tému Alder Lake je už spústa, lepšie
bude, ak si zopár prelistuješ a nebudeš vypisovať
múdrosti o maximálnej frakvencii 4.5GHz, poťažmo
2-4% navýšení výkonu…
No ber to tak, že ak bude „Alder Lake“ musieť dodržiavať 125W TDP (či už z voľby výrobcu zostavy, alebo túto voľbu urobí užívateľ), tak zrejme métu 4,5Ghz vo full load nikdy nedosiahne. Ak to bude unlimited, tak zrejme tých 5,1-5,3GHz zrejme dosiahne na pár jadrách, otázne je na ako dlho. Zo zmenšujúcimi sa procesmi, bude frekvencia ubúdať (pri all-core záťaži), či už priamoúmerne, alebo nepriamoúmerne s nárastom tranzistorov…a nie kvôli tomu, že by to nešlo, ale kvôli spotrebe.
Bude to imho podobne jako ted. Kdyz tomu nechas poradne napapat, tak ten vykon v MT tam bude. Otazka je, co se stane v momente, kdy to priskrtis na nejakou rozumnou hranici, nebo dokonce na udavane TDP. Taky muze byt zajimave, jakou to bude mit spotrebu ve hrach, pokud to pojede na velkych jadrech. Trochu se obavam, aby to nebyla ‚kopie‘ RL s 2x spotrebou oproti AMD.
Meritum je procesor Alder Lake, aké frekvencie
budú dosahovať budúce výrobné procesy je
mimo AL.
V prípade opomenutia snajpríkových hausnumeros, neni žiadny dôvod, aby
pár jadier Alder Lake neboostovalo +5GHz
v rámci PL1 125 W…
Viděl jsi tento obrázek?
https://www.cnews.cz/wp-content/uploads/2021/08/Performance-Core-procesor%C5%AF-Alder-Lake-architektura-Golden-Cove-09.png
90% výkonu co tu už byl ? ufff to se mi nelíbí.
Těch pár subtestů, která mají míň jak 100% výkonu Rocket Lake, můžou být případy, kde Rocket Lake výrazně profitovalo z AVX-512, které Alder Lake nemá. Takže pokud by se u Rocketu deaktivovalo také, tak by se nejspíš Golden Cove ukázalo být v základu silnější.
Kromě toho to je obvyklá variabilita, výjimky se můžou stát, důležité je, že to v průměru vychází líp.
opravdu jen pár … tři ze sedmdesáti … pak někde má alder třeba jen 5% navíc, někde i 60 … Crha se na ten graf dívá „tak nějak po bolševicku“ …
Takty ještě Intel neprozrazuje, ale podle úniků prý budou stejně vysoké jako u Rocket Lake. Jestli se to potvrdí, tak to IPC se tím pádem celé promítne do zvýšení absolutního výkonu.
Jsem rád, že zdejší Sibyly již vyvěštily výkon z kávové sedliny a není tak o čem diskutovat.
Honzo, jestli to budeš mít odvahu číst, drž se.
Někteří z nás si pamatují např. Itanium. Takže místo juchání nadšených budovatelů modrých zítřků si ponecháváme zdravou skepsi. Až se ukáže, že to je opravdu reálně dobré, nebudu mít problém s tím to uznat.
Diskutovat klidně můžeš, ale ty se moc neprojevuješ, asi se bojíš jít s kůží na trh?
Moje modus operandi se od roku 92 nemění. Počkám na reálné testy, zhodnotím trh a podle svých potřeb a potřeb staveb dalším lidem se zařídím.
Na značky naprosto s*ru. Zajímá mě pouze price/perf a adekvátní spotřeba. Jestli to má modrý, červený nebo fialový pruhy je mi naprosto u zadele. Vždycky bylo, vždycky bude. Ani když mi bylo 14 jsem neřešil značky, přišlo mi to stupidní už tehdy. Z toho benefitujou jen ty značky, nikoliv ty.
Líbí se mi jakýkoliv market disruptor – Intel v GPU, AMD v CPU/GPU, Nvidia v procesorech atd. Cokoliv je benefitní pro zákazníka a ignoruje share holders konkrétních značek.
Nelíbí se mi přístupy typu Intel Skylake a AMD Zen 3.
Takže k Alder Laku fakt nemám co dodat, protože leaky jsou leaky a reálný výkon uvidíme za pár měsíců, tak co tu řešit v diskuzích, když de facto není co. Je to nová hybridní architektura, pokud to fungovat nebude, Intel to zařízne a bude hledat jinou cestu. Pokud to fungovat bude, je dost možné, že AMD se vydá podobným směrem, koneckonců ARM a Apple už tím směrem jdou dlouhodobě a o smrti x86 se píše už nějaký ten pátek.
Pravda je, že pokud bude špatná efektivita jako naznačují power req u AL desek a první rumory ohledně Zen 4 / AM5, tak další zastávka bude až Quantum Computing, protože x86 velmi brzy narazí na své limity.
Paradoxne ma viac zaujímajú tie „malé“ jadrá. Aj keď bude Adler Lake výkonnejší ako Ryzen, tak to Intel zabije cenou a spotrebou.
Ale zaujímalo by ma, aký by malo výkon, spotrebu a cenu 4-jadro s iba malými jadrami v porovnaní napríkad so 4-jadrom Skylake.
Výkon malých jadier poznáme len na ich súčasných predchodcoch Tremont na platforme Jasper Lake. Uvidíme, kam sa posunú Gracemonty s vyšším IPC a frekvenciami pričom ja na rozdiel od Intelu na základe nižšie uvedeného som konzervatívnejší a predikujem IPC ~Haswellu (~Centaur CNS).
● Vzostup malých jadier
zdroj: https://www.youtube.com/watch?v=SnRe7lcKOV8
● Malé jadrá od Intelu sú rýchlejšie, ako sa očakávalo
zdroj: https://www.golem.de/news/jasper-lake-atom-im-test-intels-kleine-cpu-kerne-sind-schneller-als-gedacht-2108-158364.html
P.S. a niečo mi hovorí, že Jan k tomu o pár dní pridá ešte jednu konzolovú šmakocinku postavenú na malých jadrách…
Pokud takhle Intel půjde dál, tak x86 proškrtá a zjednoduší až na úroveň ARMu. Ku*vit velká jádra kvůli malým, to jsme to dopracovali.
Ďalšie aktuálne informácie z prebiehajúceho HOT CHIPS 2021:
Intel Alder Lake P-Core & E-Core Detailed: Golden Cove Offers 50% Higher Single-Threaded & Hybrid Design Offers 50% Higher Multi-Threaded Performance
zdroj: https://wccftech.com/intel-alder-lake-p-core-e-core-detailed-golden-cove-offers-50-higher-single-threaded-hybrid-design-offers-50-higher-multi-threaded-performance/%5B/size%5D
Ani neumíš postnout odkaz bez UTM bordelu:
404 — Not Found
Sorry, we couldn’t find that page. You may have followed a bad link or the content you requested may have been deleted.
oprava:
https://wccftech.com/intel-alder-lake-p-core-e-core-detailed-golden-cove-offers-50-higher-single-threaded-hybrid-design-offers-50-higher-multi-threaded-performance/
Osobně si myslím, že to žádný zázrak nebude, ale třeba budu příjemně překvapen… ale asi spíše ne 🙂
Perfektní práce. A nemyslím tím Intel, ale myslím tím autora článku. Opravdu článek, který jsem si rád přečetl, i když to bylo kvůli pracovnímu vytížení na několikrát.
Tohle je přesně typ článků, za které bych byl ochotný platit. Prakticky žádné spekulace, detailní technický popis vycházející z nějakých oficiálních materiálů, přežvýkaný pro obyčejného člověka.
Jen tak dál. Už se těším na článek o těch E-jádrech.
A proto mam cnews z tech zdejsich „platku“ nejradeji.
Mam to podobne a take jsem se k clanku dostal az ted. Skvela prace, @JO!
Intel vsadil s technológiou big.LITTLE na správneho koňa,
naopak AMD môže už v blízkej budúcnosti za ignoráciu
v desktope škaredo doplatit :
Alder Lake 16 jadier 8C + 8c
Raptor Lake 24 jadier 8C + 16c
Arrow Lake 40 jadier 8C + 32c
…a toť otázka, čo postaví AMD proti 40 jadrovému Intelu…
24C/48T bude stačit.
V provedení Threadripper nebo Epyc lze zakoupit už teď.
Kdy bude k dostání ten zázrak od Intelu?
Neboj se, domnívám se, že se stihnu dožít uvedení toho mnou předpověděného 128C / 256T procesoru Crha Lake.
jj už vidím, jak BFU prodává auto a chatu, aby si pořídil epyc a stejně mu nezbude na desku … Maršálek píše o běžných desktopech …
Pokud to vezmu podle (typického) počtu jader
notebook < desktop < HEDT/Workstation < server
tak to dříve nebo později "probublá" z těch výkonnějších kategorií do těch nižších.
Jak je to dávno, kdy výkonnostní mac v notebooku Intel Core i7 byl 2C/4T ?
Teď můžete pořídit 8C/16T a už "brzy" (podle C.K. Kašpárka "už teď") i 24 core CPU.
Spekulace o tom, že AMD přidá na destičku třetí čiplet už taky kolují nějakou dobu. I jdyž se je AMD snaží (zatím) vyvracet jako nepotvrzené.
Mimochodem, kdo pamatuje počítačový "pravěk" v zemích česko-slovenských, tak může potvrdit, že cena IBM PC XT byla několika-násobek ceny Śkoda 120
vždyť ten xeon si můžeš koupit taky …
Oprava chyby v článku: bylo špatně napsané srovnání s počtem AGU a load/store operací za cyklus u Zenu 3
Ten má jen 3 AGU a může tedy udělat jen maximálně tři operace za cyklus: tři čtení, nebo dva zápisy a jedno čtení, nebo dvě čtení a jeden zápis, kdežto Golden Cove má 5 AGU umí 3 čtení a zároveň 2 zápisy.