Nová generace GPU Intel je nejrychlejší integrovanou grafikou. Co přináší architektura Xe3?

12. 10. 2025

Sdílet

Grafiku Xe3 v procesorech Panther Lake sice Intel ještě nezařadil do budoucí rodiny Celestial, ale ve skutečnosti má novou architekturu se značnými vylepšeními proti Xe2 „Battlemage“.

Intel ve čtvrtek odhalil novou generaci procesorů Core Ultra 300 „Panther Lake“, které jsme se již věnovali v tomto článku. Ponechali jsme ale stranou to, že Panther Lake přináší novou architekturu integrovaného GPU jménem Xe3. Ta je vlastně nejrozsáhlejší novinkou procesorů vedle 1,8nm výrobního procesu, jelikož architektury jader CPU zdá se moc změněné nejsou. Xe3 je dosud nejpokročilejší GPU Intelu a podíváme se na něj v tomto článku.

To nejlepší, co může Intel nabídnout: Detaily procesorů Core Ultra 300 „Panther Lake“ odhalené Přečtěte si také:

To nejlepší, co může Intel nabídnout: Detaily procesorů Core Ultra 300 „Panther Lake“ odhalené

Nová architektura GPU Arc: Celestial?

Panther Lake přináší jako první třetí generaci GPU architektur Intel, které jsou považované za „herní“ (oproti starším méně pokročilým architekturám, kterých předtím firma vyprodukovala mnoho). Tou první (Xe1) byly samostatné grafiky Arc „Alchemist“ (či „A-Series“) a použitá je i v procesorech Meteor Lake a Arrow Lake. Druhá (Xe2) přišla v procesorech Lunar Lake a samostatných grafikách Battlemage (Arc „B-Series“, tedy karty B570 a B580).

Efektivita a silný ray tracing. Detaily nové architektury Xe2 v grafikách Arc „Battlemage“ Přečtěte si také:

Efektivita a silný ray tracing. Detaily nové architektury Xe2 v grafikách Arc „Battlemage“

Panther Lake má architekturu Xe3 a Intel tvrdí, že jde o plnotučnou novou generaci. Nicméně firma ji ještě neoznačí jako generaci Celestial (C-Series). Intel sdělil, že jméno Celestial bude použito až pro budoucí vylepšenou verzi Xe3, která nese interní označení Xe3P. Navzdory tomu, že Xe3 by jako nová architektura asi nárok mělo, budou grafiky procesorů Panther Lake formálně přičleněné k předchozí generaci grafik Battlemage.

Důvody asi nejsou technického rázu. Lze se domnívat, že Intel chce Celestial uvést s větší slávou v momentě, kdy bude mít nějaká výkonnější GPU této architektury. Nebo může jít o to, že firma stále plánuje vydat další samostatné GPU generace Xe2 / Battlemage – totiž karty Arc B770 s čipem BMG-G31. Jejich marketingu by neslušelo, kdyby Intel tyto karty vydal pod značkou Battlemage, ale už vedle nich měl integrovaná GPU rodiny Celestial, chápaná jako o generaci novější.

Roadmapa GPU architektur Intel Xe3 (říjen 2025)

Roadmapa GPU architektur Intel Xe (říjen 2025)

Autor: Intel, via: ComputerBase

Intel během odhalení Panther Lake prezentoval svou roadmapu grafických architektur, která oficiálně architekturu Xe3P slibuje. Má podle ní vyjít jako „příští generace Arc“, což sice neříká doslova, že bude označena jako Celestial, ale po „B-Series“ je příští na řadě „C-Series“, takže nic jiného nezbývá. Roadmapa nicméně neříká, kdy grafiky Celestial/Xe3P přijdou na trh – může to být příští rok, nebo přespříští, nevíme. A Intel také zatím veřejně nepotvrzuje, že v generaci Celestial budou samostatná GPU. Teoreticky může jít pouze o integrovaná GPU a samostatné grafiky Arc mohou být zrušené.

Je možná dobré dodat, že tato terminologická šaráda kolem grafik Arc není nějaké zoufalé taktizování z poslední doby. Zdá se, že toto bylo naplánováno už nějaký rok zpátky, ne-li déle. Už minulý rok totiž leaker Kepler_L2 upozorňoval na to, že samostatná GPU Celestial nebudou mít architekturu Xe3 a ta bude použitá jen v integrovaných GPU Panther Lake. To tehdy mohlo vést k závěrům tvrdícím, že jsou samostatné Celestialy zrušené, ačkoliv ve skutečnosti možná jen použijí o číslo novější architekturu. Tehdy jsme mysleli, že to bude Xe4, nicméně tato stará informace evidentně už loni v prosinci mluvila o tom, co teď bylo oficiálně sděleno o architektuře Xe3P.

Rozbor architektury Xe3

Po tomto úvodním exkurzu se už ale přesuňme přímo k tomu, co přináší Xe3 nyní (respektive za pár měsíců, až procesory s ní vyjdou). Celkové schéma vypadá podobně jako v Xe2, nezměnily se počty a poměry jednotek v základním stavebním bloku Xe Core. Intel ale zlepšil jejich schopnosti.

Každé Xe Core coby základní jednotka obsahuje osm vektorových jednotek XVE (Xe Vector Engine), v nichž jsou samotné shadery pro grafické a obecné výpočty. Jedna jednotka XVE zpracovává 16 hodnot najednou (jde o SIMD16 jednotky, čili užší, než které používají GPU Nvidie a AMD, tam je dnes standard SIMD32). Celkem tedy jádro Xe Core dává 128 shaderů. Součástí XVE jsou dále jednotky XMX (Xe Matrix Extensions) pro akceleraci umělé inteligence. Přítomná je vždy jedna XMX na jedu XVE, čili 8 XMX na jedno Xe Core.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake

Autor: Intel, via: ComputerBase

Ke každému Xe Core přísluší jedna sada (Sampler) texturovacích jednotek s 8 TMU a jedna jednotka RTU (Ray Tracing Unit) pro raytracingovou grafiku. Jednotky ROP jsou složené do tzv. Pixel Backendů, kde každý by měl obsahovat zřejmě 8 ROP.

Lepší využití shaderů

Zatímco počty jednotek (a tím teoretický výkon na jeden shader při dané frekvenci) se nemění, architektura by měla ze stejného teoretického výkonu ve FLOPS dostávat lepší reálný výkon v praxi.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake

Autor: Intel, via: ComputerBase

Vylepšení Xe3 proti Xe2 v obecných výpočetních jednotkách (shaderech v rámci XVE) spočívají ve schopnosti variabilní čili pružnější alokaci registrů. Toto by mělo zlepšit využití výpočetních prostředků („occupation“) v čase, jinými slovy dostat z nich více reálného výkonu, jednotky totiž nemusí tak často „vylévat“ registry do paměti. Podle grafů ukázaných Intelem je variabilní alokace registrů jedním z hlavních zdrojů zlepšení architektury Xe3. Zdá se, že jde o podobný směr, jakým jde architektura RDNA 4 od AMD, kde byla novinkou dynamická alokace registrů.

Srovnání výpočetních časů snímku v integrovaných grafikách architektury Xe2 (Lunar Lake) a Xe3 (Panther Lake)

Srovnání výpočetních časů snímku v integrovaných grafikách architektury Xe2 (Lunar Lake) a Xe3 (Panther Lake)

Autor: Intel, via: ComputerBase

Běžící úlohy také budou moci využít větší cache – L1 Cache a sdílená lokální paměť (SLM), které jsou společné vždy pro jedno Xe Core (tedy pro 8 XVE a 8 XMX), narostly o 33 % proti architektuře Xe2.

Výpočetní jednotka by měla být schopná udržovat v běhu více vláken najednou – až o 25 % více. GPU potřebují mít více aktivních vláken, aby dokázala udržovat jednotky vytížené například tehdy, když chybí data kvůli čekání na čtení z paměti.

Akcelerace AI

Jednotky XMX zdá se nemají velké změny. Podporují výpočty s 32bitovými hodnotami TF32, 16bitové FP16 a BFloat16 a celočíselné hodnoty INT8, INT4 a INT2. Zdá se, že se nezměnil hrubý výkon – jedno Xe Core (8 jednotek XMX) dokáže provést 1024 výpočtů na 32bitových, 2048 výpočtů na 16bitových a 4096 výpočtů na osmibitových hodnotách. Výkon s INT4 a INT2 je 8192 operací za cyklus (4bitové datové typy tedy ještě zdvojnásobují výkon, ale dvoubitový INT2 už ne, jeho efektem je jen úspora paměti zabrané AI modelem).

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake

Autor: Intel, via: ComputerBase

Zdá se, že zatím na jednotkách XMX chybí podpora výpočtů v FP8, kterou AMD zavedlo v architektuře RDNA 4 grafik Radeon RX 9000 a využívá ji pro AI upscaling FSR4. Nvidia podporuje FP8 u GeForce RTX 4000 / architektury Ada Lovelace a GeForce RTX 5000 / architektury Blackwell. Intel uvádí, že Xe3 podporuje dekvantizaci FP8, ale samotné maticové výpočty patrně ještě ne. Je ale možné použít výpočty s INT8, které budou mít stejný výkon, ovšem celočíselné hodnoty mají určitou nevýhodu v kvalitě výstupu AI. To proto, že jim chybí dynamický rozsah floating-point čísel.

Ray tracing

Jednotky RTU byly vylepšeny. Jejich základní hrubý výkon by měl být stejný. Mají tři pipeline pro analýzu průsečíků paprsků s BVH, které celkově zvládnou až 18 průsečíků za cyklus (hodně vysoký počet) a dvě pipeline pro zpracování průsečíků s trojúhelníky, které by asi měly umět zpracovat dva trojúhelníky za cyklus.

Intel uvádí, že architektura Xe3 by v nějakém druhu microbenchmarku měla zvládat 2× průsečíků s trojúhelníky, ale není jasné, co se tím míní. Buď to znamená, že každá z pipeline nyní umí dva trojúhelníky za cyklus (takže RTU jako celek čtyři), nebo to také může být o výsledek měření v nějaké reálné zátěži, který ukazuje, že reálně dosažený výkon se zlepši, ačkoliv teoretická kapacita jednotek je stejná.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake

Autor: Intel, via: ComputerBase

Byla ale přidána schopnost dynamické správy analyzovaných paprsků pro použití při asynchronního zpracování ray tracingu. Opět tedy zlepšení spočívají v tom, aby GPU dokázalo dostat ze stejného teoretického výkonu větší prakticky realizovaný výkon ve hrách.

Další zlepšení

Vylepšený byl také výkon v různých fixních funkcích grafické pipeline. Xe3 má až 2× lepší výkon v anizotropním filtrování textur a až 2× lepší výkon pro operace stencil test. Jde zřejmě o oblasti, u kterých analýzy ukázaly, že v předchozích architekturách byly limitující pro celkový herní výkon.

Intel také do architektury přidal nový manažer URB (Unified Return Bufferu) – bloku, který zpracovává výsledky grafických operací a předává je dalším částem GPU. Zlepšení spočívají v tom, že data v tomto bufferu je nyní možné aktualizovat částečně bez toho, aby se před zápisem musel buffer při každém přepnutí kontextu vyprázdnit od předchozích dat. Toto byl potenciální limit výkonu při vzájemné komunikaci různých součástí GPU, který by teď měl být eliminován nebo zmírněn.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake

Autor: Intel, via: ComputerBase

Na straně softwaru také přijdou různá zlepšení. Intel například zavádí do ovladačů schopnost stahovat hotové předkompilované shadery her z cloudu (tedy jen pokud jste online), místo aby je hra musela kompilovat lokálně na počítači. To zrychlí nahrávání hry při prvním spuštění nebo po aktualizacích.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake – Předkompilované shadery

Autor: Intel, via: ComputerBase

XeSS 3 s multisnímkovým generováním

Intel také spolu s Panther Lake a grafikami Xe3 oznámil novou generaci technologie upscalingu a generování snímků – XeSS 3. Ta nyní nově umí generovat více snímků po vzoru DLSS 4 od Nvidie. Intel potvrdil, že bude dostupná ve všech hrách, které už podporují jednoduché generování snímků pomocí XeSS 2. V takových bude ovladač schopen automaticky zapnout i XeSS 3. O této technologii jsme psali zde:

Intel dohání Nvidii: Herní technologie XeSS 3 přináší multi generování snímků pro grafiky Arc Přečtěte si také:

Intel dohání Nvidii: Herní technologie XeSS 3 přináší multi generování snímků pro grafiky Arc

Základní verze GPU: 4 Xe Core

Jak jsme již psali v předchozím článku, Intel pro procesory Panther Lake navrhl dvě různá integrovaná GPU s architekturou Xe3. V levnějších procesorech a těch určených ke spárování se samostatným GPU bude čiplet vyráběný 3nm procesem Intelu se 4 Xe Core.

Tato varianta je složená ze dvou tzv. Render Slice, kde v každé jsou dvě Xe Core. Celkem tedy toto GPU má 512 shaderů, 32 XMX pro akceleraci umělé inteligence a 4 RTU pro ray tracing. Texturovacích jednotek je 32 (čtyři Samplery) a jednotek ROP 16 (dva Pixel Backendy), geometrická pipeline je jedna. Toto GPU má pro své potřeby 4MB L2 cache.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake: Verze s 4 Xe Core

Autor: Intel, via: ComputerBase

Podle některých odhadů by toto GPU mohlo být příští rok použito také ve většině procesorů Nova Lake (včetně desktopových). Šlo by opět o ty modely procesorů, které nepotřebují výkonnější GPU, takže „recyklace“ dává smysl.

Výkonná verze GPU: 12 Xe Core

Výkonnější verze integrované grafiky, která bude zajímavá pro herní notebooky a handheldy, je složená také ze dvou Render Slice, ale v každé z ní je 6 jader, celkem tedy 12 Xe Core. To tedy dává 1536 shaderů (96 XVE), 96 XMX a 12 RTU. Texturovacích jednotek je 96 (12 Samplerů). Intel také tomuto GPU dal dvojici geometrických pipeline a čtyři Pixel Backendy, což by mělo znamenat 32 jednotek ROP.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake: Verze s 12 Xe Core

Autor: Intel, via: ComputerBase

Tato verze GPU používá 3nm proces TSMC (N3E), který pravděpodobně je lepší než 3nm technologie Intelu použitá u levnější verze (bude mít lepší energetickou efektivitu a dosažené takty).

Grafika s 12 Xe Core má poměrně velkou 16MB L2 cache, což je asi největší kapacita, jaká v integrovaném GPU zatím byla vidět (s výjimkou Strix Halo od AMD). Toto by měl být jeden z potenciálních trumfů. Výkonná integrovaná GPU obvykle hodně narážejí na propustnost operační paměti, kterou využívají místo vyhrazené VRAM a která jim brání dosáhnout vyšších výkonů. Větší kapacita cache ale dokáže tento deficit zmírnit tím, že vykryje přístupy k nejčastěji používaným datům.

Mimochodem, Lunar Lake mělo pro své GPU s 1024 shadery (8 Xe Core) L2 cache o kapacitě 8 MB, v Panther Lake jde tedy o posílení nad rámec prostého procentuálního škálování dle počtu výpočetních jednotek.

L2 cache proti úzkému hrdlu propustnosti pamětí

Pro připomenutí: velké GPU Panther Lake používá paměti LPDDR5X-9600, které poskytnou propustnost 153,6 GB/s. Podle testování Intelu dokáže 16MB L2 cache tohoto GPU snížit potřebu propustnosti hlavní paměti až o 36 % proti hypotetické alternativě s jen 8MB cache.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake: Redukce I/O do paměti díky 16MB L2 cache

Autor: Intel, via: ComputerBase

Toto číslo je ze hry Black Myth Wukong, v Cyberpunku 2077 s ray tracingem je redukce nároků na propustnost o 19 % nebo 27 % při zapnutí ray tracingu a upscalingu XeSS současně. V 3DMarku Steel Nomad je benefit o něco nižší, jen –17 % spotřebované propustnosti.

Frekvence by mohly stoupnout

Zatím nejsou jasné frekvence, kterých bude architektura Xe3 dosahovat. Intel v prezentaci zmiňuje, že by Panther Lake – pravděpodobně ve variantě s 12 Xe Core – mělo dodávat až 120 TOPS AI výkonu (pravděpodobně jde o číslo pro výpočty s přesností INT8) na jednotkách XMX. Intel uváděl 67 TOPS pro Lunar Lake s jeho Xe2 grafikou o 1024 shaderech na taktu 2,05 GHz. Pro grafiku Panther Lake s 1536 shadery by 120 TOPS snad mělo odpovídat frekvenci cca 2,45 GHz.

Mohlo by to svědčit o tom, že se Intelu podařilo takty navýšit (což by bylo dobře, protože předchozí architektury byly pozadu za konkurencí ve výkonu na jednotku plochy a vyšší takty to mohou zlepšit). Pokud tedy někde nemáme chybu v odhadu. Je otázka, zda nejde spíš o efekt nastavených TDP nebo toho, jaký takt se zvolí pro napsání do specifikací. Architektura Xe2 ve formě samostatného GPU je totiž také schopná vyšších taktů než v Lunar Lake (frekvence grafiky Arc B580 ve hrách by měla být 2,85 GHz).

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake: Mikrobenchmarky ukazující nárůst výkonu architektury Xe3 proti Xe2 při nezměněné frekvenci. Jde ale o testy izolovaných funkcí, které neukazují přímo růst výkonu v celé hře nebo 3D aplikaci

Autor: Intel, via: ComputerBase

Nejvýkonnější (z běžných) iGPU?

Intel zatím ukazuje jen velmi základní naznačení výkonu. V následujícím grafu můžete vidět srovnání křivek ukazujících výkon při určité spotřebě pro integrované grafiky generace Xe1 / Alchemist (procesory Arrow Lake-H s 1024 shadery v GPU), Xe2 / Battlemage (procesory Lunar Lake s 1024 shadery v GPU) a Xe3 v Panther Lake, což by měla být grafika s 1536 shadery.

Xe3 by mělo dosahovat výrazně vyššího absolutního výkonu než obě starší generace. Je sice vidět, že maximální spotřeba je vyšší než u Arrow Lake-H, nemluvě o úsporném Lunar Lake, ale poměr spotřeby a výkonu je lepší (výkon by tedy měl narůst o větší procento). To by podle Intelu mělo platit na celé křivce, tedy pro každé konkrétní nastavení spotřeby.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake

Autor: Intel, via: ComputerBase

Například maximální výkon grafiky v Arrow Lake-H je možné u Xe3 grafiky (při jejím podtaktování) dosáhnout se spotřebou o 40 % nižší. Nicméně je to s lepším procesem: GPU čiplety Arrow Lake-H jsou vyráběné 5nm procesem TSMC, zatímco GPU čiplet Panther Lake s 12 Xe Core používá 3nm proces TSMC (ve vylepšené verzi N3E).

Nejvyšší absolutní výkon grafiky v Panther Lake pak má být na nejvyšším bodě křivky více než o polovinu (50 %) vyšší, než jaký má grafika v Lunar Lake. To znamená, že verze grafiky s 12 Xe Core, pro kterou jsou tyto údaje, by měla s přehledem porazit integrovanou grafiku v Ryzenech AI 300 „Strix Point“ od AMD, která má pouze 1024 shaderů (architektury RDNA 3.5). Lunar Lake je jí velmi blízko (pokud ovladače dobře fungují, je i o něco rychlejší), takže 12 Xe Core architektury Xe3 bude určitě o dost napřed prakticky vždy.

GPU architektura Intel Xe3 v procesorech Panther Lake

GPU architektura Intel Xe3 v procesorech Panther Lake

Autor: Intel, via: ComputerBase

Výkon se zřejmě nedostane na úroveň procesorů Strix Halo (Ryzen AI Max), ale oy jsou už trochu jiná kategorie jak ve výkonu, tak v komplexitě s 256bitovou pamětí, což je ve světě PC pořád poněkud experiment a AMD má problém přesvědčit výrobce notebooků, aby tato „Halo“ čipletová APU používali.

Panther Lake s 12 Xe Core by mohlo pořád být relativně mainstreamový procesor, který by se mohl dostat do většího množství notebooků a který je více srovnatelný s běžnými APU Ryzeny AI 300 „Strix Point“. V této kategorii x86 procesorů zřejmě bude Panther Lake procesor s nejvýkonnější integrovanou grafikou, až bude začátkem roku 2026 vydán. AMD bude mít šanci odpovědět až zřejmě s vydáním další generace procesorů pro notebooky založené už na Zenu 6 – čipletových APU Medusa Point. Ty ale nejspíš vyjdou nejdříve v druhé polovině roku, možná dokonce až začátkem roku 2027. A ani jejich grafický výkon ještě není moc jistý, podle některých informací totiž možná ještě nebudou mít novější architekturu GPU a stále by v nich mohla být použitá RDNA 3.5.

Zdroje: Intel, ComputerBase, Tom’s Hardware

Autor článku

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Kvíz týdne

Tyto konektory zná každý. Ale víte, co jejich zkratky doopravdy znamenají?
1/9 otázek