
V generaci Zen 3 zrušilo AMD levnější Threadrippery s čtyřkanálovými pamětmi a nechalo jen drahou platformu Pro. Ale se Zenem 4 se prý dostupnější HEDT platforma vrátí a opět bude jak osmikanálová, tak čtyřkanálová verze.
Zhruba touto dobou před rokem se postupně rozplývaly naděje, že by mohly vyjít procesory Threadripper 5000 s architekturou Zen 3 pro relativně levnější highendovou platformu TRX40. Vypadá to ale, že by se mohly vrátit v příští generaci založené na Zenu 4. AMD prý opět chystá dražší osmikanálovou a levnější čtyřkanálovou platformu, což by mohlo znamenat návrat dostupnější HEDT platformy.
Podobně jako AMD vydalo nový socket AM5 pro desktopové procesory, by měl přijít nový socket a nová platforma také pro highendové procesory Ryzen Threadripper. O té teď přinesl informace leaker s přezdívkou chi11eddog. Je to ta osoba, která vypustila před měsícem frekvence a ceny 65W Ryzenů, které se nyní zřejmě potvrdily únikem oficiálního slajdu, takže asi stojí za to věnovat jí pozornost.
Podle chi11eddoga má Threadripper s architekturou Zen 4 kódové označení Storm Peak a ve skutečnosti půjde o platformy dvě, kdy jedna bude asi následovat ve šlépějích platformy WRX80, ale druhá má být levnější a zřejmě by se mohla podobat TRX40.
Následník WRX80 a Threadripperů Pro pro pracovní stanice
Dražší platforma má mít podobnou výbavu jako dnešní WRX80 – osmikanálový řadič pamětí DDR5 a 128 linek PCI Express, ale nyní již generace 5.0. Doplňkově pro pomalejší periférie pak ještě 8 linek PCI Express 3.0. Toto se podobá 1S desktopové platformě Epyc 9004, ale AMD nepoužilo plný 12kanálový řadič pamětí. Pro desky desktopového formátu by možná už bylo 12 nebo 24 slotů DIMM pro paměti příliš.
Procesory samotné by ale mohly pořád mít až 96 jader. Je pravděpodobné, že bude použitý fyzicky stejný socket SP5 jako u procesorů Epyc 9004, ale procesory a desky nebudou kompatibilní na úrovni firmwaru a některé piny i mohou být použity jinak.
Leaker ještě k této platformě uvádí, že je zřejmě určena čistě pro segment pracovních stanic. Nebude podporovat přetaktování CPU ani pamětí (nebo to aspoň není nyní plánováno). Není řečeno, zda je zvažována dvouprocesorová verze, jakou plánuje Intel s procesory Sapphire Rapids (na druhou stranu, AMD může pro takové účely také prostě používat serverovou platformu jako takovou, jen se speciálními deskami).
AMD Storm Peak
September 2023
HEDT: 4 channel, 64 pcie gen5 lanes, 8 pcie gen3 lanes, support OC
WS: 8 channel, 128 pcie gen5 lanes, 8 pcie gen3 lanes, no OC for CPU&MEM— chi11eddog (@g01d3nm4ng0) December 19, 2022
HEDT a návrat „běžného“ Threadripperu?
AMD sice letos oznámilo, že chce highend sjednotit na jen jedné platformě, a proto je normální Threadripper zrušen, ale teď svítají naděje, že mezitím toto rozhodnutí začalo litovat a přehodnotilo. Podle chi11eddoga totiž Storm Peak bude obnášet i separátní platformu, která je opět namířena do segmentu highendového desktopu („HEDT“).
Tato platforma bude mít jen čtyřkanálový paměťový řadič, takže bude podporovat jen čtyři nebo osm slotů DIMM pro paměti DDR5. Linek PCI Express 5.0 bude jen 64, ale k tomu opět bude dalších pomocných osm linek PCI Express 3.0. A tato platforma bude podporovat přetaktování.
Nabízelo by se, aby se s touto platformou vrátily na trh obyčejné (a levnější) Ryzeny Threadrippery „ne-Pro“, i když nevíme, zda se opravdu budou takto jmenovat. AMD by jim teoreticky pořád mohlo říkat Threadripper Pro. Je pravděpodobné, že procesory pro obě platformy se budou lišit a nebudou kompatibilní s oběma. Pravda, teoreticky by je šlo navrhnout tak, aby měly všechny plnou konektivitu PCIe 5.0 a osm kanálů DDR5 s tím, že by se to v levnější platformě prostě nevyužívalo, ale to by prodražovalo výrobu.
AMD už před časem oznámilo, že chystá levnější verzi serverových procesorů Epyc 9004 s architekturou Zen 4, která má označení Siena. Tato CPU by prý mohla mít jen šestikanálový paměťový řadič a také asi menší maximální počet jader – maximum bude údajně 64 jader Zen 4. Procesory Epyc Siena měly mít i vlastní socket SP6.

Vyloženě to svádí k domněnce, že ona druhá sekundární platforma levnějších Threadripperů bude odvozená od této levnější serverové platformy se socketem SP6 (ale jen se čtyřmi využitými kanály DDR5). Opět ale asi nebude kompatibilita, nejspíš bude převzato stejné mechanické provedení, ale využití pinů se bude lišit.
Příchod až koncem léta 2023
Vydání těchto Threadripperů Pro 7000 (a Threadripperů 7000?) s architekturou Zen 4 je ještě poměrně vzdálené. AMD je podle chi11eddoga má vydat nebo odhalit až v září roku 2023. Vyjdou tím o pár až několik měsíců později než nové HEDT a pracovněstaniční platformy Intelu. Ten tím pádem bude mít trh chvíli pro sebe, nicméně později vydané platformy od AMD by po svém příchodu mohly mít nad Intelem výkonnostně navrch díky vyššímu počtu jader a 5nm výrobnímu procesu.
Zdroje: chi11eddog, VideoCardz
Tak známej si kdysi Threadripper koupil a byl z toho nakonec dost zklamanej, ne teda že by byl procák špatnej, ale podpora aplikací byla slabá.
Naprostá většina aplikací zjistil, je schopna škálovat do 12 jader a potom jde efektivita tvrdě dolu.
Prostě tyhle mnohojádrové procesory mimo servery moc smyslu nedávaly, ale jestli se situace změnila nevim, já to nesleduju.
To je vždy problém nových řešení. Vzpomeňte co to dalo práce než si vývojáři zvykli programovat mutithreading.
Jenže otázka je, jestli to nové řešení má i nějaký smysl.
To samé bys totiž mohl napsat i o Intel bigLittle, je to v desktopu nové řešení a tak nefunguje úplně optimálně. Ale je to také inovativní řešení, které dává smysl?
Není, je to jen další slepá ulička Intelu!
Ale smysl to má ale možná máme na mysli každý něco jiného. Já píši o muti-threadingu z pohledu aplikační úrovně (rozbiji aplikaci na thready které běží paralelně a vzájemně se synchronizují zastavují, předávají si řízení, …). To je v dnešní době zaplať pánbůh standard.
No právě.
A do toho ta malá jádra hází vidle: jiná (nižší) rychlost, jiné (vyšší) latence.
Když pak potřebujete mít ta vlákna synchornizovaná, tak se to celé musí přizpůsobit těm mrňousům. Ergo kladívko pokles výkonu.
Teoreticky by ta malá jádra házet vidle neměla ale po praktické stránce to nejsem schopen posoudit.
V případech, kdy každé jádro dostane vlákno s víceméně nezávsilou činností, to pojede dost dobře. Viz CB 23
Pokud ta vlákna potřebují mezi sebou komunikovat, projeví se efekt „přesunu kolony“ – kolona se pohybuje rychlostí nejpomalešího prvku.
Mozna není tak zcela náhodou, že výkon dvou vláken obsluhovaných P-jádrem s HT zhruba odpovídá výkonu dvou vláken obsluhovaných dvěma E-jádry. Na druhou stranu kolik synchronních MT úloh škáluje na 32 vláknech (i9 13900K).
melkor 21.12.2022 at 6:23
PetebLazar 21.12.2022 at 8:37
oboje je zajímavé. Rád jsme si to přečetl.
Ten „standard“ je o hodně složitější než si myslíš, napsat MT aplikaci kvalitně není jednoduché, často to není ani potřeba, naprostá většina úloh si bohatě vystačí s jedním jádrem. Úloh běží desítky/stovky naráz, takže to musí scheduler rozdělovat. K pokroku došlo v oblasti jako jsou enginy, kde se dají škálovat různé výpočty, které dokážou dostatečně dlouho běžet samostatně, aby režie kolem vláken byla zanedbatelná. MT jsou různé komprimační, konverzní algoritmy, kde se ta úloha dá jednoduše rozdělit na bloky, které lze rozházet mezi vlákna. Ale MT aplikací je stále minimum, není důvod psát třeba kalkulačku ve windows jako MT aplikaci, byla by horší.
Otázkou spíše je, kolik aplikací jejichž algoritmy jsou schopny významně profitovat z MT do nich ještě nebylo přepsáno? Možná jich dnes není zase tolik.
Ano málo programátoru umí psát MT (MultiThreading) aplikace. To že aplikaci stačí jedno jádro je bohužel doklad neschopnosti programátorů začít psát MTově. Každou aplikaci by totiž měli psát jako MTovou.
bigLittle je potreba pro vykonovou a energetickou skalovatelnost. Neni cesta zpet. To, ze AMD s homogenim CPU valcuje Intel s heterem neznamena nic okrem teho ze Intel je procesne dost v ….
Pokud chcete dobry bigLittle podivejte se na Apple a pak kritizujte. Jo a srovnejte taky s AMD at mate radost. 🙂 — predpokladam, ze se ozvete, ze nelze srovnavat generacne jine procesy no a ja bych rekl, u intelu/amd to delate tak co?
Naopak, big.LITTLE je kompromisní řešení. Vyspělejší je škálovatelnost výkonu toho daného jádra.
Tak daleko, aby jádro v závislosti na zátěži měnilo fungování, nebo vypínalo v danou chvíli nepoužívané jednotky, ještě nejsme a je to dost složité.
Neřekl bych že je to nutně míň vyspělé. Práce při vývoji to v mnoha ohledech může dát i víc.
A teoreticky když na stejném výrobním procesu máme k dispozici určitý maximální příděl plochy čipu, tak s big.LITTLE hybridem asi můžeme dosáhnout vyšší maximální mnohovláknový výkon. Možná i vyšší jednovláknový výkon díky tomu, že se na něj velké jádro bude moci víc specializovat.
Dalo by se to považovat i za pokročilejší řešení.
Záleží samozřejmě na konkrétních implementacích. Samozřejmě i na nasazení (když si třeba kupuju 32jádro s cílem provozovat 16 VM, tak asi hybrid nebude ideální, na druhou stranu myslím, že většina úloh spíš hybridu vyhovovat bude než nebude).
Ano Apple BL funguje, protože má pod palcem celou platformou, kdy systém i aplikace věci na čem mají běžet, tak to dává smysl. Když se mi ale 10c12t AL sotva hýbe a reálný výkon je poloviční oproti o tři roky staršímu 4c8t WL nebo o čtyři Zenu…
Buď to ty thready hází zcela náhodně, nebo spíš trotluje protože slibovaných 4,4GHz jsem tam snad ještě neviděl…
Ne, Apple funkcnost bigLittle je proste dana a neni tim, ze ma pod palcem Apple vsechno. Apple nema pod palcem TSMC! A kdyz si jako dukaz nainstaluju Linux na Mx a jede paradne, tak Apple nema pod palcem Linux. Cili Apple ma pod palcem jen firmware (UEFI) a hardware. A jede jako z praku. Proc? Bo skvele TSMC a bo skvely navrh cipu.
Multithreading je výmysl micro$softu, který nezvládal (dostatečně dobře a dostatečně rychle) provozovat plnohodnotný multitasking.
Workstation je pro ty, co vědí, na co to potřebují.
Nemyslím, že by tohle vymyslel Microsoft. Mám na mysli tohle https://cs.wikipedia.org/wiki/Vl%C3%A1kno_(informatika)
Přiznám se, že jsem ani po googlování nenašel otce takového multi-threadingu.
Multithreading byl v Unixu jeste v drevnich dobach MS DOSu. Multithreading a multitasking jsou metody jak vyuzit zdroje CPU. Obe ale jsou na opacnych polich z pohledu prace s daty. Multithreading (data sdilena), multitasking (procesy/data izolovana). Apod. Dle toho co potrebujete si pak vyberete patricny programovaci model.
Multithreading používají kromě AMD a Intelu taky IBM Power, procesory SPARC architektury (výrobců je víc) objevily se u prototypů MIPS (když ještě fungoval Silicon Graphics), ARM (tehdy se ještě v mobilech nepoužíval) a nikdy nevydané variantě DIGITAL ALPHLA EV8 (firma byla prodána a následně pod vedením HP bylo vše zrušeno) Myslím že jich není úplně málo. Vše začalo krátce před rokem 2000.
Chce to ještě trochu dál do minulosti.
Já psal o tom, co se dostalo na trh, nebo k tomu mělo blízko. Teorie sahá tuším až do 60. let 20. století.
Nemichejte jabka s hruskama. Melkor psal o softwarovem multithreading. Vy tady pisete o hardwareovem multithreadingu! To je neco dost jineho!
Viacjadro sa dá použiť na viac app, nie len na jednu. Asi si to nevedel.
Tak v mé branži (3D rendering), jsou tyhlety Threadrippery k nezaplacení. Čím víc jader, tím lépe.
Dát za procesor 70 tisíc mě vždycky přišlo zbytečně hodně, ale kolega si ho pořídil a náramně si ho pochvaluje. Dneska už ho trochu dohání obyčejný 7950X, který má provozní vlastnosti a výkon na jedno jádro někde úplně jinde, než starší Threadrippery, ale holt vývoj nezastavíš…
Prušak sa na TR 1950X nesťažoval. Problém mal až s TR 2990X, ale u toho bol problém v tom, že Windows prehadzoval záťaž zle.
Vypada to pekne. Dalsi dukaz, ze Intel konecne po letech zase prijde s necim jako HEDT. AMD si samozrejme nechce nechat kadit do sveho hnizda takze musi prijit s reakci. Za mne dobre.
Jo jen ať se perou, ať z toho máme užitek.
Kdyby tam bylo napsáno září 2024 byl bych tomu ochoten trochu věřit.
Kdo bude toužit po 8-channel DDR5 nechá si v mezidobí postavit WS na bázi Epyc Genoa.
Nech neblbnú a zdvojnásobia počet jadier v bežnom desktope inak ich Intel v ďalšej generácii nechá v prachu s miliónom malých jadier.
U HEDT trhu nezáleží pouze na maximálním MT výkonu, ale i na výkonu při relativně omezeném počtu jader a samozřejmě na širokém/rychlém IO a přístupu do RAM. Nemluvě o případných dopadech velikostí omezených cache u E-jader.
A celkově o konektivitě, proto tolik PCIe linek. Zas to připomíná možnosti pracovních stanic RISC / UNIX.
Akorát to u X399/TRX40 kazil počet a dislokace slotů na MB (ctyři max). Zvlášť v kontextu dnešních „slotových otesánků“ (chladičů GK). HEDT platformy minulosti X99/X299 měly modely MB vyššími počty slotů, byť při podstatně nižším celkovém počtu linek (Asrock X299 WS, asus X99-10g ws). V době PCIe 4.0(5.0) se asi nelze moc spoléhat na úspěšnou záchranu(využití) chladičem překrytého(překrytých) slotů pomocí riseru.
AMD může, má v pouzdře prostor na třetí čiplet s jádry. Takže až 24. Zatím to nebylo potřeba, ale v další řadě se asi dočkáš.