Možná, že se zase otevírá cesta k použití v pamětí HBM2/3 v mobilních GPU nebo v APU, kde se bez nich těžko dá dosáhnout vysoký grafický výkon. V tento týden odhaleném Instinctu MI200 má totiž premiéru technologie, která by mohla HBM o dost zlevnit.
AMD tento týden představovalo novinky nebo plány pro serverový trh a oblast HPC. Vedle procesorů Milan-X s 3D V-Cache, serverové roadmapy Zenu 4/4c a 6nm GPU Instinct MI200 stojí vypíchnout ještě jednu věc.
Aldebaran/Instinct MI200 používá paměti HBM2E. To by nebylo nic světoborného, zvlášť u GPU od AMD, ale tentokrát přichází inovace v konstrukci. Předchozí grafiky AMD s HBM nebo HBM2 používaly notoricky známý křemíkový interposer. Nevýhoda je, že pro výkonná GPU musí mít velmi velkou plochu, přitom ale musí být vyráběný jako plnohodnotný, byť primitivní čip. To je i na nějakém starým, třeba 180mm procesu pořád značná rána ve výrobních nákladech (a dnes, když je všech čipů nedostatek, je i spotřeba waferů na velmi starém procesoru značný problém).

Jako třešinka na dortu pak je, že se do interposeru musí vyrábět díry a v nich pak tvořit TSV vodiče pro napojení horního čipu na kontakty substrátu, což vyžaduje další kroky při výrobě (které mohou asi i zvyšovat náročnost a riziko zmetků). Kvůli tomuto jsou GPU a procesory s pamětí typu HBM drahé na výrobu a AMD je eventuálně muselo v segmentu herních grafických karet opustit, přičemž tato technicky zajímavá epizoda možná Radeonům a jejich tržnímu podílu spíš uškodila, než pomohla.

Elevated Fanout Bridge 2.5D
Intel už má nějakou dobu alternativní technologii EMIB, která používá jen malé křemíkové můstky, velké akorát tak, aby provedly vodiče mezi čipem GPU a pouzdrem HBM2, které jsou hned vedle. Toto je mnohem levnější a tím EMIB otevírá cestu pokročilým pamětem (nebo pokročilému propojení jiných čipů) v širším portfoliu produktů – Intel díky tomu mohl mít paměti HBM2 v procesorech Kaby Lake-G. Instinct MI200 přináší poprvé něco podobného také u AMD.
V Aldebaranu už není použitý křemíkový interposer plné velikosti (který by měl asi dost přes 1000 mm²), ale také takové malé a levné křemíkové můstky. Technologie se jmenuje Elevated Fanout Bridge 2.5D a patří patrně jedné z pouzdřících firem, s nimiž AMD spolupracuje (možná by to prý mohlo být SPIL).
Proti EMIB první generace je tato alternativa možná dokonce lepší (ale Intel své technologie dále rozvíjí, takže to neberte tak, že by zde byl předstižen). Zatímco EMIB je zahloubený do substrátu, který tak musí být speciální, Elevated Fanout Bridge 2.5D se osazuje nad substrát, jenž nemusí být nijak přizpůsoben a může být zcela běžný. Je to vcelku jednoduchý trik: můstek, který zajišťuje přemostění dvou čipů, se položí před osazením těchto čipů na substrát (můstek má kontakty nahoře). Protože vyčnívá z plochy, musí čipy být osazené výš než v jeho rovině.
To se provede pomocí měděných pilířů tvořících vycpávku volného prostoru mezi kontakty hlavních čipů a kontakty na substrátu. Tam, kde by normálně byly jen kuličky pájky, jsou tedy jakési sloupky a pájka je na nich. Toto není u AMD nové, měděné sloupky se použily již u procesorů Ryzen 3000 a Epyc 7002, kde ale toliko vyrovnávají rozdíly ve výšce (a v rozměrech kuliček pájky) 12nm a 7nm čipletů.

Přijdou paměti HBM2 konečně i do levnějších GPU nebo APU?
Tato technologie je pořád složitější a dražší než obyčejné zapouzdření běžného monolitického čipu na substrát. Ale měla by už být výrazně levnější a jednodušší než jiné alternativy umožňující osazení pamětí HBM2/2E a také levnější a jednodušší i než ona původní verze EMIB od Intelu. Tudíž tato technologie možná může umožnit tyto rychlé paměti použít ve více i levnějších produktech, i když pomůže jen z části, protože i cena pamětí samotných je vyšší než u DDR4/DDR5 nebo GDDR6.
Z HBM2e nebo budoucí HBM3 by mohla hodně profitovat GPU pro notebooky (tyto paměti mají nižší spotřebu než GDDR), ale také APU/procesory s výkonnou integrovanou grafikou. Pokud by Intel nebo AMD chtěli vyrobit čipy s podobně výkonným iGPU, jaké teď vyprodukoval Apple díky tomu, že se nemusí ohlížet na výrobní náklady, HBM2 by k tomu mohla být cesta.
Více: Apple uvádí procesory M1 Pro a M1 Max: nejrychlejší notebookové CPU, obří integrované GPU
Lék na nevýhody čipletů?
Možná ještě zajímavější ale je, že by se tyto můstky možná mohly použít pro propojení CPU nebo GPU čipletů mezi sebou a mezi IO čipletem a jimi. To by dovolilo zvýšit rychlost takových propojení, možná trošku i latenci. A také by pak komunikace mezi čipy nemusela stát tolik energie navíc. Dnešní čipletové procesory AMD, kde komunikace probíhá přes obyčejný substrát, asi trpí určitou ztrátou výkonu a naopak postihem ve spotřebě, který by provedení těchto propojek skrze můstky Elevated Fanout Bridge 2.5D mohlo zmírnit.

Ostatně, Intel takto hodlá použít EMIB (u procesorů Sapphire Rapids). Tudíž AMD by mohlo z této technologie v procesorech dost benefitovat. Jen nevíme, zda ji tam zkusí nasadit. V poslední době firma preferovala vše dělat hlavně levně a na inovace tohoto typu málokdy vsadila – zřejmě to při objemu výroby nebylo tak rentabilní, jak by bylo třeba, možná šlo i o negativní zkušenost z neúspěchu s Radeony „Fiji“ a „Vega“. Ale kdo ví, třeba teď firma bude schopná tuto inovaci rozšířit i do procesorů Ryzen.
Samotné GPU Aldebaran snad můstky pro komunikaci mezi oběma poloviny GPU ale také ještě nepoužívá, zřejmě jsou použité jen a pouze pro HBM2E. Zde tedy teprve uvidíme, kdy se AMD pokusí otestovat i propojení výpočetních čipletů. U Zenu 4 to asi nebude, protože dosavadní úniky tvrdí, že ten bude ještě mít klasický substrát bez elegantnějšího pokročilého pouzdření (škoda).
Galerie: AMD Instinct MI200 (Aldebaran)
Zdroje: AMD, Tom’s Hardware, AnandTech
„Jako třešinka na dortu pak je, že se ještě interposer musí provrtávat, protože přes něj jdou pomocí TSV kontakty do substrátu. “
provrtávat ? No to snad ne … To zní jako by měli používat vrták nebo co
https://avs.scitation.org/doi/10.1116/6.0000026#
http://emlab.uiuc.edu/ece546/appnotes/tsv/Yokohama_paper.pdf
https://anysilicon.com/semipedia/through-silicon-via-tsv/
Spíš se to asi leptá? Já tam dám „vytvořit díry“, ať je to vágní 🙂 Vrtat opravdu nebylo dobře.
Navrhuji krásné české slovo perforovat 😀
A co deflorovat ? 😉
Dědku jedna ušatá 😉
trefa Prokope … ten dědkův výraz se opravdu používá jen v jedné rovině …
Pánové když se podívám na ten link tak se v souvislosti se slovem deflorace vybaví znechucení a slovo pedofilie. Poněkud „zvláštní“ způsob uvažování.
Bidena opravdu nemusím ale v této souvislosti ho uvádět mi připadá poněkud přes čáru.
what? Možná bys měl zvážit vyřazení alkoholu ze svého konzumačího portfolia
V rámci prostupu mezi vrstvami se v odborné terminologii, aspoň co já pamatuji ze své praxe, obvykle používá slovo „průchod“. Díra je zase až moc vaginální, pardon, vágní 😉
možná by mohli použít postup jako Italové při výrobě sýra Casu marzu 😀
TSMC na TSV používa klasický litho-etch proces. Aký postup používa Intel prekvapivo a opäť, nieje úplne jasné.
Inak samozrejme vŕtať státisíce dier keď je medzi nimi rozostup len desiatky um je nerealistické. Navyše vŕtanie implikuje, že sa jednotlivé via robia postupne… keď na jednom interposeri ich sú státisíce… Z toho možno autor článku dostal mylný dojem, že EMIB je univerzálne lepšia technológia…
Inak TSV aj ne-TSM prístupy majú svoje výhody aj nevýhody.
ono existuje i něco jako „foveros direct“ …
Dostal jste mne pane Olšane. Normálně články o těchto zařízeních nečtu ale když jste dal do nadpisu chiplety tak jsem se chytnul přečetl a nelituji toho. 🙂
Tá technológia vyzerá na Cowos-L, alebo Info-L. Respektíve niečo prispôsobené pre AMD.
A inak, je potvrdené, že tam nebudú tie TSV? TSMC ich totiž podporuje aj na týchto „rozsekaných“ interposeroch. Dokonca myslím že aj Intel niekde spomínal, že v budúcich verziách EMIB budú TSV podporovať.
Takže celá tá hra o tom, ako sú EMIB skvelé a ako sú TSV predražené mohli byť len kecy Intelu, aby zakryli fakt, že ich nedokážu vyrábať…
EMIB „je skvělé“, protože potřebuje jen malinké kusy křemíku vs. placka velká tak, aby se na to vešlo GA100 nebo Fiji a k tomu ještě HBM/HBM2. Tudíž EMIB musí logicky být o dost levnější a líp škálující věc, podobně jako tahle věc popisovaná v článku.
To s tou skepsí k Intelu nejspíš přeháníte. TSV jsou myslím použité v tom jejich FOVEROS, a fungovat to asi funguje, používá to Lakefield.
Jako procesor byl sice špatnej (10nm proces před SuperFinem), ale demonstrovalo to použití compute čipletu na I/O čipletu. Skrz ten I/O čiplet jdou TSV do substrátu.
https://www.cnews.cz/mf-galerie/hybridni-big-little-procesor-intel-lakefield-deska-cip-benchmarky-fotogalerie-2-2/galerie-196957-6/
To je tak geniálne až to je retardované. Ako to, že to nenapadlo aj ostatních, keď to je tak jednoduché a skvelé? Však TSMC robí MCM riešenia už oveľa dlhšie. Prečo to nepoužili v spolupráci s AMD, však AMD to použilo v Kaby-G (zatiaľčo Intelovo CPU tam išlo paradoxne cez substrát). Viete to vysvetliť?
Iba že by to nebolo univerzálne skvelé riešenie, ale malo by to aj nevýhody.
Napríklad presnosť substrátu, fixovanie častí, tepelná rozťažnosť… …power delivery.
Pretože IO časti spotrebujú väčšinu energie a EMIB ich efektívne zablokuje.
https://images.anandtech.com/doci/13124/IF%20Power%20EPYC.png
Ono sa o tom až tak nevravelo, pretože to bol veľmi okrajový produkt, ale AMD muselo pridať ďalšiu kovovú vrstvu len aby priviedli napájanie nad EMIB časť (plus IO signály tam/späť). Takže to čo ušetrili na mostíku bolo úplne irelevantné, keďže zložitejší routing a ďalšia kovová vrstva stojí rádovo viac ako ušetria na malom interposeri bez TSV.
Ten problém si Intel veľmi dobre uvedomuje, len v marketingovej „propagande“ sa držia niečoho iného
https://images.anandtech.com/doci/15877/ISSCC2020-page-013.jpg
Lakefield sa tak celkom nedá brať do úvahy. Opäť veľmi okrajový produkt s krátkou životnosťou a technicky totálny FAIL.
Hlavne nemôžete to porovnávať s riešeniami ktoré sú v produkcii. Intel len urobil pár waferov (nejaké minimálne množstvo), ktoré rozsekal na pár tisíc (desatisíc) čipov ktoré rozoslal influencerom…
To je skoro ako keď IBM demonštrovalo 2nm test čip. To že majú pár waferov nezanmená že sú technologicky 4 roky pred foundy a 8 rokov pred Intelom. Skôr je otázka, či ten proces bude skutočne tak dobrý, ako tvrdia, a či to budú vedieť vyrábať. Čo ste tam zhodnotili správne, pretože tam nemáte taký BIAS ako v prípade Intelu.
Inak logiku môžete použiť až keď máte nejaké znalosti v problematike, inak vás to dovedie k blbým záverom 😀
však ty jsi taky mistr demagogie, znalosti možná máš, ale od objektivity hooodně daleko … jestli takhle pošleš do prdele i Stacha? Pokud ano, pak jen jednou …
„Ono sa o tom až tak nevravelo, pretože to bol veľmi okrajový produkt, ale AMD muselo pridať ďalšiu kovovú vrstvu len aby priviedli napájanie nad EMIB časť (plus IO signály tam/späť). Takže to čo ušetrili na mostíku bolo úplne irelevantné, keďže zložitejší routing a ďalšia kovová vrstva stojí rádovo viac ako ušetria na malom interposeri bez TSV.“
Pochybuju že ta kovová vrstva navíc, pokud je to vůbec pravda, stojí víc, než použití interposeru. Už proto, že v tom čipu je jich beztak tak 8-15, takže kdyby jedna stála jako interposer, který *je drahá věc* a všichni o tom ví, nikdo to nezpochybňuje (kromě vás?), tak by typickej obyčejnej procesor (dejme tomu 10 kovových vrstev) stál od 500$ nahoru a ne od 50$ nahoru…
I interposer má taky v sobě kovovou vrstvu/vrstvy, takže se mi fakt nechce věřit, že tamto co popisujete byla neuvěřitelná finanční darda, kdežto 800-1000mm2 interposer stojí nula nula nic.
Fakt myslím že to je jednostranný pohled na věc příliš ovlivněný a priori přesvědčením, že všechno od Intelu je špatný.
Tak to mě teda interposer.
😀 😀 😀
„Jako třešinka na dortu pak je, že se do interposeru musí vyrábět díry…“
A výrobkem tedy je … díra 😀