Uvnitř Threadripperů nejsou žádné atrapy, všechny čtyři čipy jsou zcela reálné

9

Ještě v červenci před oficiálním uvedením jsme tu měli zprávu o snímcích procesoru Ryzen Threadripper s odstraněným rozvaděčem tepla. V případě tohoto highendového CPU se sice již víceméně vědělo, že nebude mít uvnitř pastu ale pro teploty vhodnější pájku, ovšem rozborka odhalila jiné překvapení: uvnitř pouzdra nejsou jen dva čipy, ale rovnou čtyři. Threadripper by měl podle oficiálních údajů vždy používat jen dva, takže vyvstala otázka, co dělají uvnitř dva další a zda jsou pravé. Na druhou polovinu této otázky máme nyní odpověď.

Stejný nadšenec, přetaktovávač či Youtuber (tedy Roman Hartung alias Der8auer) totiž podnikl s Threadripperem nový a hloubkovější pokus. CPU bylo tentokrát zakoupené v běžné distribuci a tedy by mělo plně odpovídat tomu, co byste dostali sami – což teoreticky nemusí platit u vzorku od AMD. Hartung tento nešťastný procesor (Threadripper 1950X) opět rozpitval, ale tentokrát kompletně. Po odstranění rozvaděče vytrhal z pouzdra i jednotlivé čipy, obrousil je, aby byly vidět struktury v křemíku a vyfotil je. Metoda obnažování byla stejná, jakou používá fotograf Fritzchens Fritz (viz jeho snímky Ryzenu 3). Postup můžete vidět na Hartungově videu.

Proč je toto zajímavé? Poté, co se první fotografie odhalující čtyři čipy pod rozvaděčem rozlétla do světa, totiž některé hardwarové weby přišly s vysvětlením, že přebytečné destičky v pouzdru jsou ve skutečnosti jen „vycpávky“, nikoliv skutečné čipy. Přítomné jsou proto, aby se zachovala pevnost pouzdra a rozvaděče tepla, které počítají se čtyřmi křemíky (protože je vyvinuto pro čtyřčipové procesory Epyc). Například podle AnandTechu měly tyto podpěry být kusy křemíkového waferu, které neprošly normálním opracováním.

To ale evidentně není pravda. To, co Roman Hartung po obroušení všech čtyř křemíků dostal, jsou čipy, které mají ve všech čtyřech případech stejnou komplexní duhovou strukturu, typickou pro čipy obecně. To však znamená, že musely normálně projít litografickým procesem, jinými slovy, jde o kompletní čipy se vším všudy, nikoliv o nějaké atrapy.

Čtyři čipy vypreparované ze sériového Ryzenu Threadripper 1950X. Po obroušení jsou na všech vidět struktury tranzistorů, jde tedy o zcela regulérní čipy. Křemík vpravo dole má ještě kovovou vrstvu s kontakty (Zdroj: Der8auer)
Čtyři čipy vypreparované ze sériového Ryzenu Threadripper 1950X. Po obroušení jsou na všech vidět struktury tranzistorů, jde tedy o zcela regulérní čipy. Křemík vpravo dole má ještě kovovou vrstvu s kontakty (Zdroj: Der8auer)

Mohou být čipy navíc funkční?

Ona zásadní otázka tedy nyní není, zda jsou třetí a čtvrtý čip reálné, ale zda třeba nejsou funkční. Má AMD možnost otestovat kousky křemíku na chyby předtím, než je osadí na pouzdro? Pokud ne, pak by na výrobu Threadripperů mohlo používat ty vyrobené Epycy, kde jeden nebo čipy nefungují – ovšem jen tehdy, pokud jsou ve dvou pozicích, které desky pro Threadripper nemají zapojené (tyto pozice jsou pevně dané, nelze si čipy „vybrat“ při bootu nebo při výrobě CPU). Takovýto způsob výroby by ale byl dost neekonomický. V řadě případů by byl v Threadripperu kromě zmetku zbytečně zašantročen i fyzicky funkční čip navíc. A pokud by zmetek byl v jedné z aktivních pozic, pak by se naopak celý procesor musel vyhodit, protože by se ani pro Threadripper, ani pro Epyc nedal upotřebit.

Ještě plýtvavější by pak byla varianta, že by AMD na výrobu Threadripperů prostě bralo hotová pouzdra úplně funkčních Epyců a deaktivovalo v nich polovinu křemíku. Zní to nesmyslně, ale asi ani tato varianta se vyloučit nedá. Historie zná případy, kdy se kompletně funkční čipy z různých důvodů prodávaly deaktivované (není to v jádru zas tak odlišné od jídla vyhazovaného ze supermarketů nebo mléka vylévaného do kanálů).

Pouzdro zničené extrakcí čipů (Zdroj: Der8auer)
Pouzdro zničené extrakcí čipů (Zdroj: Der8auer)

Lepší možnost je, že AMD jednotlivé ještě nenapájené čipy testovat a třídit umí a v Threadripperech s nimi tedy nemusí plýtvat. Proč by pak ale byly pro výztuhu používány reálné čipy, když nikdy nejsou aktivní? Vysvětlení by mohlo být, že jde o zmetky, které nelze kvůli chybě nebo špatné kvalitě použít v žádném CPU. AMD by po rozřezání waferů vždy nějaké takové kousky měly zůstat a teoreticky by jich mohlo být dost pro to, aby uspokojily potřebu pro výrobu Threadripperů, které nejsou žádná masová záležitost. Podstatné je, že tyto zmetky jsou reálně mnohem lepší volbou pro úlohu „podpěr“, než domnělé speciální vycpávky, o nichž se spekulovalo. Ty by totiž bylo třeba zvlášť vyrobit, kdežto zmetky jsou coby odpad k dispozici a zadarmo.

Není také třeba řešit detaily jako to, že ony atrapy by musely mít stejnou výšku jako reálný křemík a zespodu plošky pro napájení na substrát, které u čipu vznikají při výrobě kovových vrstev čipu. Zmetky toto vše automaticky splňují a replikovat tyto rysy na nějakém nezpracovaném křemíku by bylo zbytečně komplikované a stálo by peníze. Popravdě, s přihlédnutím k této logice teorie o speciálních atrapách vlastně nikdy nedávala smysl. Tedy za předpokladu, že Threadripper nebude nikdy tak populární, že by úplně vyčerpal zásobu nepoužitelného křemíku, což je rozumná podmínka. I pokud by bylo jednou nutné kvůli nedostatku zmetků ničit funkční čipy, bude možné vzít ty horší a stále musíme pamatovat, že ani pomyslné atrapy nejsou zadarmo.

Ryzen Threadripper v socketu TR4 (foto: Ars Technica)
Ryzen Threadripper v socketu TR4 (foto: Ars Technica)

To, že jsou v pouzdru procesorů Threadripper pro socket TR4 čtyři reálné čipy, má zajímavé důsledky. Nevím, zda je pouzdro čipů Threadripper nějak odlišené (vzpomeňme si, že vývoj tohoto CPU byl veden tak, aby implementace vyžadovala jen minimální změny), ale pokud by šel Threadripper vložit do socketu SP3, pokusila by se deska oživit všechny čtyři čipy? Ty by v některých případech teoreticky mohly fungovat, protože propadnutí při testování nemusí být vždy úplně fatální chyba, jak dosvědčovaly občasné úspěchy odemykání jader u Phenomů. Podle fotek AMD v pouzdru u vadných čipů neosazuje součástky na substrátu, ale někdo zručný by je možná dokázal doplnit. V praxi by ale asi byl problém v BIOSu, který by nejspíš CPU nerozpoznal a patrně by se vám nepodařilo nabootovat.

Aktualizace (19. 9. 2017):

James Prior z AMD na Twitteru prohlásil, že třetí a čtvrtý čip v Threadripperu postrádají zapojení do systému, a není tedy možné je nijak odemknout nebo jinak oživit. Zajímavé je, že podle něj procesor má také odlišný substrát od Epycu (tedy desku rozvádějící kontakty z čipů mezi nimi a do kontaktů pro socket). Je sice možné, že zde míní právě ony neosazené součástky a nikoliv přímo PCB samotné, ale v socketu SP3 by tím pádem Threadripper ani teoreticky nemohl fungovat.

Uvnitř Threadripperů nejsou žádné atrapy, všechny čtyři čipy jsou zcela reálné

Ohodnoťte tento článek!

9 KOMENTÁŘE

  1. pokud by čipy napájeli a zjistili, že je to zmetek, pak co? Urvat ho, naplácat jako podložku … nevím. Pravděpodobnější je, že AMD umí testovat před napájením. Pak to ale s tou výtěžností asi až taková sláva nebude, protože EPYC taky nejsou jen 32 jádrové a těch zmetků by mělo být dost pro Threadripper i EPYC. Nebo naopak, výtěžnost je vynikající a výroba levná, pak na tom nezáleží a cena čipu zaplatí i funkční čipy coby podložky …

    • Já tomu rozumím úplně jinak, ale podívejte se na napájené SMDčka na té základně. Věřím tomu, že před osazením čipy jsou schopni nějak lehce otestovat jestli jsou částečně nějak funkční, poté je osadit. Poté je otestovat naplno. Ty které běží v pořádku jsou EPYCY, ty které mají jedno nebo dvě CPU napadrť, tak odpájí ty SMD rezistory a tím ho přemění na theardripepper. Nedomnívám se že je v tom nějaká záhada.

      • Všechny čipy se dají testovat, už když jsou na waferu. V momentě, kdy je wafer dokončen, proběhne testování, kdy se podrobně testují všechny čipy na daném waferu (zjišťují nejen funkčnost čipu, ale v případě chybi i její umístění – takže přesně ví, jestli je chyba v paměťovém řadiči nebo v L3 cache nebo v jádrech). Pokud je vysoké % čipů vadných, wafer se hodí do koše. V opačném případě wafer postupuje dál ve výrobním procesu (rozřezání a pouzdření). Informace z testů o vadách jednotlivých čipů jsou pečlivě logovány, takže po rozřezání se dobře ví, co hodit do koše a co nechat zapouzdřit.
        Opravdu nehrozí, že by AMD hrálo loterii a při vytváření EPYCu/Threadripperu nevědělo, který čip je funkční a který ne. Už jen to, že v každém Threadripperu jsou aktivní čipy pokaždé stejně umístěny (myslím že je to pravý dolní a levý horní, ale nejsem si jistý) značí, že AMD už před pájením ví, které čipy jsou aktivní a které ne.
        Pokud si dobře pamatuju, tak každý EPYC (i to nejslabší osmijádro) má osmi kanálový řadič, takže v EPYCu musí být každý z těch 4 čipů aspoň trochu funkční (každý čip má 2 kanály, takže pro 8 kanálů je potřeba 4 funkční paměťové řadiče).

    • Je to tak, ale je to marketing, vždycky tam může být nějaký kreativní výklad faktů. Třeba Nvidia tvrdí, že vývoj čipu GV100 stál 3 miliardy dolarů, což je evidentně ptákovina (z ekonomických důvodů) a nejspíš je legenda taková, že započítali postupně náklady na RD všech předchozích GPU, které Voltě evolučně předcházely, nebo tak něco (prachy investované TSMC do vývoje 12nm procesu?).

      Ono statisticky bývají čipy z prostředku waferu kvalitnější, nebo asi existují i nějaké indikátory kvality celého waferu. Takže asi existuje určitá byť nepřesná možnost vytipovávat teoreticky lepší čipy i bez jejich testování. A ta by se pak dala použít jako podklad pro takový marketingový canc o tom, jak pro ten produkt vybírají nej čipy. Ale samozřejmě schopnost je fakt testovat dává mnohem větší smysl – otázka je, jestli na ní ta firma má technologii/peníze.

      • V momentě, kdy je dokončen wafer, tak jsou všechny čipy na daném waferu otestovány na vady (a při testu jsou schopni zjistit, kde přesně vada je). Vady se podrobně logují, aby byly později k dispozici. Pokud má wafer příliš vysoké % vad, tak se hodí do koše. V opačném případě pokračuje ve zpracování dál (rozřezání, pouzdření).
        Až se čipy rozřežou, tak se vytřídí, co jde do koše a co na linku. Po zapouzdření následuje druhé kolo testování, kdy se už netestují vady (ty jsou podrobně známy z předchozího testu), ale testuje se kvalita čipů (při jakém V dosáhnou určitých taktů, měří se spotřeba). Podle toho se rozřadí, co jde do mobilních čipů, co do desktopu, co bude sloužit jako výběrové čipy (ty se darují významným redaktorům na recenzi/overclockerům pro nějaký světový rekord, nebo se používá pro prémiové čipy jako je ThreadRipper). Po tomto kroku se čipy pájí a přilepí/přiletuje se IHS.

      • Jak psal dom324, vůbec bych nepochyboval o tom, že se jádra testují už na waferu, dříve se to dělalo kontaktními sondami, dnes už to jde i bezdrátově. Otázkou není, jestli to AMD dělá, ale kterou z těchto metod používá pro jádra ZEN. Osobně bych tipoval, že už tu druhou.
        Další selekce probíhá po ukotvení na podkladní PCB, kde se dají prověřit i tepelné charakteristiky a maximální takty, proto jsou v prodeji minimálně dvě a více výkonových konfigurací pro každý jeden typ pouzdra/patice. V případě Threadripperu je to plně šestnáctijádrový 1950X a dvanáctijádrový 1920X. Výběrovost jader v Threadripperech pak nejspíš znamená, že jádra jsou plně funkční při testování na waferu a omezení velikosti cache nebo počtu jader je nejspíše proto, aby splnily nároky na takt a TDP. Odemčením 1920X by uživatel nejspíš získal plnohodnotné a funkční šestnáctijádro, ale s vyšší spotřebou nebo nižšími stabilními takty. Do Epyců a Ryzenů pak mohou putovat i částečně defektní kusy křemíku, kterým se dají nejen snížit takty, ale i cíleně vypnout několik jader, bloky instrukčních sad nebo kus cache.
        Co se zbývajících dvou křemíků v Threadripperech týká, pak nejpravděpodobnější vysvětlení je, že se jedná o defektní části zpracovaného waferu, které by se jinak vyhodily, ale jejich použití je výhodnější než dělat speciální distanční kousky, s přesnou výškou, které by se daly ukotvit v jednom kroku zároveň s funkčními jádry. PR kecy za tím vším pak budou o tom, že se teoretická výtěžnost waferů z GF o pár procent zvýší i o tyto jádra a firma se pak může honosit tím, že je jejich výrobní proces výhodnější/kvalitnější při jeho prodeji třetím stranám.