Blíží se chvíle, kdy AMD – letos v druhé polovině roku – vydá procesory s novou architekturou Zen 5, které by měly být největším skokem od prvního Zenu. Okolo jejich výkonu je to ale dost nejasné – na jednu stranu materiály AMD mluví o zvýšení výkonu na 1 MHz o 10–15 % nebo o něco víc. Ale současně se objevují zvěsti hovořící o 30% nebo teď dokonce 40% navýšení výkonu. Čemu z toho tedy věřit a na co si dát pozor?

Pokud jde o první konzervativnější údaj, ten pochází z docela dobrých zdrojů. Uvádí to dokument AMD, který sice ukázal youtuber Moore’s Law is Dead, ale architektonické detaily byly mezi tím oficiálně potvrzeny a obecně tyto slajdy vypadají reálně, takže bychom o pravosti moc nepochybovali. Tento dokument uvádí, že Zen 5 má mít proti Zenu 4 vyšší IPC (tedy výkon při stejné frekvenci) o 10–15 %+. Ono plus indikuje, že jde o konzervativní číslo a realita může být lepší, tedy například i 18 %, firma si nechává nějakou rezervu pro případ, že se na jádru něco pokazí.

I pokud ale bereme onu rezervu v potaz, je to stále v rozporu s druhou skupinou neoficiálních zpráv a drbů, které mluví o tom, že by výkon a/nebo IPC měly jít nahoru třeba o 30 %. Teď čerstvě například leaker Kepler_L2 uvádí (na fóru AnandTech), že výkon na jedno jádro má u Zenu 5 stoupnout o víc jak 40 % proti Zenu 4. To je od oněch „10–15 %+“ hodně vzdáleno.

O těchto vysokých číslech asi lze říct, že pravděpodobně nepůjde o „IPC“ (tedy navýšení výkonu na úrovni architektury izolovaně od frekvencí) a asi ani o nárůst jednovláknového výkonu, tak jak ho obvykle definujeme, tedy v obvyklých uživatelských programech běžících v jednom vlákně. Zen 5 totiž asi o moc nepřekoná (pokud vůbec) maximální boostové frekvence procesorů s jádry Zen 4, které jsou mezi 5,0–5,7 GHz.





Proč +40 % výkonu v mnohovláknových testech neznamená 40% zlepšení v jednom vlákně

Je tedy vůbec možné, aby někde vycházel výkon vyšší o 40 % „na jedno jádro“? Patrně ano, ale je třeba vzít v úvahu, že toto číslo asi platí pro serverové procesory. Má konkrétně jít o nárůst výkonu na jedno jádro v benchmarku SPEC CPU 2017, přesněji asi SPECint, tedy celočíselné části (nikoliv floating-point). Důležité je, že jde o mnohojádrový benchmark „rate“, kde je pak celkové skóre vyděleno počtem pracovních vláken nebo jader, čím se teprve dostává zmiňovaný výkon na jedno jádro. Přes to, že se hovoří o výkonu na jádro, jde tedy o skóre z testu mnohovláknového výkonu.

Toto právě si může být důvod, proč je nárůst výkonu údajně tak velký, ačkoliv by IPC mělo stoupnout jen o něco přes 15 %. Také jde nejspíš o údaj pro serverový procesor Epyc se Zenem 5 (ten má kódové označení Turin) srovnávaný s Epycem 9004 Genoa, ne o nárůst výkonu na Ryzenech. Je několik věcí, které mohou 40% nárůst výkonu při méně než 20% zlepšení IPC vysvětlovat.

To, co vás asi napadne jako první, je že Zen 5 bude v zátěži dosahovat vyšších taktů než Zen 4, což by mohlo v mnohovláknových úlohách (na rozdíl od jednovláknových) na serverových procesorech asi nastat, protože jejich pracovní takty nejsou blízko maxima. Nicméně podle leakera toto není důvodem, nebo ne hlavním, takty asi budou plus minus stejné. Tak jako tak ale striktně jednovláknovému výkonu desktopových a notebookových procesorů Ryzen 9000 tento faktor nebude moci pomoct, protože tam už asi Zen 5 výš než Zen 4 o moc nepůjde.

Ryzen 7 7700X s architekturou Zen 4 Autor: Ľubomír Samák

Lepší škálování, ne přímo lepší výkon jádra?

Hlavním faktorem zde je asi to, že je řeč o mnohovláknovém výkonu, byť rozpočítaném na jedno jádro. To znamená, že se může projevovat lepší tzv. škálování z jednoho na více vláken, které vůbec nemusí znamenat, že naměříte lepší výkon, i pokud použijete vlákno jediné.

Zen 5 má výrazně širší jádro s šesti ALU (+ 50 %), což ale pravděpodobně znamená, že při typickém zpracovávání jednovláknového programu zůstane víc nevyužitých výpočetních prostředků. Tyto nevyužité prostředky zužitkovává SMT díky zpracování dvou vláken současně. Toto znamená, že Zen 5 by mohl mít lepší výkonnostní zisk při použití SMT – pokud například na Zenu 4 typicky SMT přidává 10–15 % mnohovláknového výkonu, pak by to u Zen 5 mohlo být třeba 15–25 % (čísla jsme si vymysleli jen pro ilustraci). Zde je ale důležité, že tento výnos ze SMD se projeví jen v mnohovláknové úloze, ne v jednovláknových programech. Tudíž může přispět k tomu, že v jednovláknovém programu vám vyjde IPC lepší o 15 %, ale celkově procesor se stejným počtem jader a vláken dá o 40 % lepší výkon.

Epyc bude mít výhodu rychlejších pamětí, Ryzen ne

Další takovou věcí je propustnost pamětí, která obvykle nelimitujete výkon v jednovláknovém programu, ale mnohovláknové obvykle omezuje dost. A nedávné úniky ukazují, že serverová verze Zenu 5 zřejmě bude oficiálně podporovat paměti DDR5–6000, což znamená o 25 % lepší propustnost pamětí proti Zenu 4 (serverový Epyc 9004 podporuje jen DDR5–4800) a tím pádem potenciál pro zlepšení mnohovláknového výkonu.

Tento faktor ale asi nepomůže desktopovým a notebookovým Ryzenům 9000 s jádry Zen 5, které již takto rychlé paměti používají přes XMP profily a desktopový Zen 5 nejspíš asi ani podporu pamětí o moc nezlepší (možná z DDR5–5200 na DDR5–5600). Tak jako tak toto asi víceméně nehne s výkonem jednovláknovým aplikací.

Ryzen 9 7950X Autor: Ľubomír Samák

Je třeba říct, že obecně může lepší škálování výkonu na mnoho vlákno jako v testu SPECint rate být způsobeno různými zlepšeními, která budou aplikována jen do serverové verze procesorů, a nikoliv do desktopových Ryzenů. Ty určitě používají stejný IO čiplet (zatímco u serverové verze to tak jisté není), propojovací logiku a paměťový řadič jako Zen 4. Onen větší výnos SMT by ale mohl nastat i u Ryzenů.

AVX-512?

Je také možné, že test SPEC 2017 těží hodně z implementace AVX-512 jádrem Zen 5. To bude mít plně 512bitové pipeline vykonávající tyto instrukce, takže při jejich použití může narůst výkon v určité dílčí části nějakých algoritmů až o 100 %. A to může ohnout nárůst výkonu v SPECint až na těch 40 %, přestože ve většině programů se budeme bavit jen o těch 15–20 %. Alespoň by ale mohlo platit, že tyto zisky z AVX-512 budou u SPEC 2017 vidět i na desktopových (a notebookových) procesorech. Tedy pokud nebudou podmíněné současným zlepšením propustnosti pamětí DDR5…

Jak tedy vidíte, ony zprávy o 30–40% zlepšení výkonu na jádro, nebo dokonce o takto vysokém zlepšení IPC (při měření v mnohovláknových aplikacích!) klidně mohou být pravdivé. Ale přitom to vůbec nemusí stejně vypadat v jednovláknovém výkonu, který nejvíc sledujeme v recenzích PC procesorů, tedy v testech jako je Geekbench (ST), Cinebech ST, CPU-Z nebo v testech herního výkonu. Tam klidně může nastat zlepšení výkonu jen o těch 15 % plus třeba něco málo.

Tudíž při vyhlížení Ryzenů 9000 zachovejte chladnou hlavu a nemějte nějaká přehnaná očekávání. Ta hodně často vedou ke zklamání (jak ví třeba ti, kdo očekávali enormní skoky v IPC od procesorů Apple M3 a od telefonního A17 Pro).

Zdroj: VideoCardz, AnandTech (fórum)