Odpovídáte na názor k článku Křemík Radeonů RX 9000: Detaily a novinky architektury AMD RDNA 4. Názory mohou přidávat pouze registrovaní uživatelé.
Který z bodů zlepšuje efektivitu?
1 2 4 6 9 13 14 by efektivitu zelpovat přinejmeším mohly (nemůžu od stolu říct, že určite budou).
3) Vyhodili shadery jednotky, které uměli FP32
To se v Blackwellu ale nestalo (nebo mi uniká, jak to bylo míněno?). V architekturách Ampere a Ada bylo v každém bloku SM celkem 128 shaderů, 64 z nich specializovaných na FP32. Druhých 64 umí FP32 a zároveň celočíselné operace. Je to proto, že většinou v softwaru dominují ty FP operace takže se předpokládá, že ta část shaderů specializovaná na FP32 se vždycky uplatní, takže INTE nemusí umět. A stačí, aby INT uměla ta druhá část (ale ta umí i FP32, aby nebyla na ocet, když INT instrukce chybí a FP operací je v kód většina).
Teď prostě Nvidia udělala to, že jsou obě poloviny SM symetrické a obě umí i ty FP32, i ty INT operace. Motivace asi bylo, nahnat trošku výkonu i v těch vzácných případech, kdy by běžící kód měl víc jak 50 % INT operací. Nebo pro zjednodušení kompilátoru shaderů a snazší optimalizaci? Každopádně regrese ve výkonu tam nikde nebude.
Jediná potenciální nevýhoda je, že to asi stojí víc křemíku (plochy na čipu). Ale možná, že k tomu přikročili právě proto, že cena nebyla bůhvíjak vysoká.