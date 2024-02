Dlouho to tu nebylo, ale zdá je tu zase incident, kdy je objevena nestabilita u některých procesorů, které jinak vypadají jako plně funkční, v nějaké konkrétní aplikaci. U procesorů Intel Core 13. a 14. generace byly nahlášené problémy ve hrách používajících Unreal Engine 5 a jednu konkrétní knihovnu pro kompresi dat. Je možné, že tento kód odhalil slabé místo architektury, které nezachytila validace a testování CPU při výrobě.

Na začátek je třeba říct, že není úplně jisté, zda je opravdu problém přímo v procesorech Intel, protože by na vině mohla být i agresivní nastavení základních desek. Problém se také zřejmě týká jen malé části z vyrobených čipů, takže zatím to nevypadá na nějaké velké důvody k panice.

Pády v Oodle a kompilaci shaderů

Problémy, o kterých je řeč, jsou hlášené ve hrách, založených na Unreal Enginu a nastávají při dekompresi dat z formátu Oodle od RAD Game Tools (což je od roku 2021 část Epicu) během kompilace shaderů. Dekomprese na nejvyšších modelech procesorů Raptor Lake podle zjištění vývojářů vytváří takovou zátěž, že procesor přestane být stabilní a hra spadne s hláškou, že dekomprese selhala, nebo nastane tzv. nepředvídatelné chování (které může způsobit i pádem nebo zamrznutím OS).

Tyto problémy vedle samotných RAD Game Tools coby autorů tohoto softwaru hlásí také autoři her Darktide a Vermintide 2. Her takto postižených pády během kompilování shaderů ale může být víc mezi různými tituly používajícími Unreal Engine a Oodle (například Fortnite, Remnant 2, Hogwarts Legacy).





Proč nastane pád právě při kompilování shaderů a jejich dekompresi pro potřeby kompilování? Tato úloha asi používá všechna jádra CPU a vytíží je na maximum, takže se CPU dostává na své maximální spotřeby, může se velmi rychle ohřát a zároveň náhlý nárůst proudového odběru může asi destabilizovat napětí, takže nastává riziko přechodného poklesu napětí pod kritickou úroveň, kdy CPU ztratí stabilitu nebo provede nějaké instrukce chybně. Jinými slovy kompilace shaderů ve výsledku funguje jako jakýsi stress test (ovšem praktickou aplikací) podobný třeba Prime95.

Podle RAD Game Tools se nezdá, že by šlo o chybu v samotném softwaru a pravděpodobně jde o projev nestability hardwaru, která může při zpracovávání kódu Oodle nastat na procesorech Raptor Lake s vysokou spotřebou a frekvencemi. Intel u Core 13. a ještě více Core 14. generace posunul frekvence hodně vysoko. Největší problémy mají zdá se procesory Core i9 řady K a KF (i9–13900K/KF, i9–14900K/KF), menší pravděpodobnost problémů je u i7–13700K/KF a i7–14700K/KF.

Core i7–13700K Autor: Použito se svolením autora: Ľubomír Samák

Jako řešení problému pro majitele těchto procesorů (pokud se u nich nestabilita projeví, což se děje jen u nějakého zlomku procesorů) je doporučeno zrušit všechny formy přetaktování, které by mohly způsobit nestabilitu, a to i různá výchozí nastavení základních desek, které u CPU často odemykají či zvyšují limity spotřeby nebo vyřazují omezení boostu (například limity dle počtu zatížených jader, teplotní kritérium u Thermal Velocity Boostu, různé Multicore Enhancement funkce, které nastavují na všech jádrech takt jednovláknového boostu).

Na platformě Intel jsou podobné formy přetaktování na deskách často zapnuté i ve výchozím stavu, takže uživatel může přetatkovávat, aniž by o tom věděl. V případě těchto pádů ve hrách je doporučeno natavit v BIOSu desky ofiicálně doporučené hodnoty limitu spotřeby (253 W).

Autoři her doporučují při problémech podtaktovat o 100–200 MHz

Podle RAD Game Tools to ale vypadá, že ne za všemi výskyty problému stojí přetaktování. Jako jedno z řešení, pokud nepostačí deaktivovat různé formy přetaktování, je uvedeno snížení maximálních frekvencí procesoru o 100 až 200 MHz (toto doporučují autoři her Vermintide 2 / Darktide a Nightingale).

Ještě asi bude třeba prověřit, zda některé procesory skutečně chybují až do snížení frekvencí, což by znamenalo reálnou hardwarovou chybu, respektive to, že u nich Intel nastavil takty výš, než křemík zvládne. Je možné, že se nakonec ukáže, že všechny tyto případy byly nakonec kvůli přetaktování CPU, nebo RAM.

A reportedly successful workaround for many people is to use Intel XTU and lower the Performance Core multiplier from x55 to x54 or x53.

Vedle snížení taktů je doporučováno vyzkoušet nastavit v BIOSu volbu SVID Behaviour na „Intel’s Fails Safe“, přímo zvýšit lehce napětí jádra, dokud stabilita nepřestane, nebo použít vyšší nastavení CPU Vcore Loadline Calibration. Cílem všech těchto nastavení je zlepšit stabilitu procesoru při maximální zátěži a frekvencích. RAD Game Tools uvádí v dokumentu k problémům, že problémy způsobující nestabilita by se měla dát detekovat také stress testem s instrukcemi AVX2 v aplikaci Intel XTU.

Intel se k těmto problémům zdá se ještě nevyjádřil. Uvidíme, zda tak učiní a třeba rovnou neohlásí, že byla nalezena prvotní příčina a je plánovaná oprava.

Chyba by snad měla být opravitelná

I pokud se potvrdí, že Raptor Lake je s dekompresí Oodle nestabilní, pravděpodobně to nebude znamenat, že procesory budou na vyhození. Chyby by se měly dát odstranit pomocí aktualizace mikrokódu (obvykle asi prostřednictvím nového BIOSu pro desku). Řešení by mohlo spočívat ve vkládání nějakých cyklů „na vydechnutí“ mezi AVX2 instrukce, které budou identifikovány jako původci těchto pádů, případně může být upraveno řízení napájení, aby v těchto kritických situacích procesoru zvýšilo napětí. Každopádně by měly existovat způsoby, jak tyto procesory zastabilizovat pomocí updatu BIOSu desky, takže by neměla být nutná reklamace nebo dokonce nějaké stahování trhu.

Možná, že by situace mohla být podobná chybám prvních Ryzenů spojeným s instrukcemi FMA3, kdy také docházelo k přílišné zátěži procesoru a problém byl opravený pomocí aktualizace mikrokódu.

V komentářích k této zprávě se objevily dohady, zda třeba tyto chyby nemohou ukazovat, že procesory kvůli vysokým frekvencím, na které je Intel vyhnal, časem degradují a ztrácejí stabilitu i při natavení výchozích parametrů. Toto by byla asi nejdramatičtější a nejproblémovější možnost, doufejme, že se o degradaci nejedná.

Zdroje: RAD Game Tools, Fastshark, Sebastian Castellanos, Reddit