Intel má bug v procesorech Skylake. Při použití AVX může počítač zamrznout

0

Zdá se, že v reji okolo veletrhu CES 2016 poněkud zapadla s ním nesouvisející, ale významná hardwarová událost. Stejně jako u softwaru mívá i hardware své chyby a zejména u CPU je při jejich dnešní komplexitě nemožné se jim vyhnout. Jen málokdy se ovšem taková chyba projeví až u uživatelů. Zdá se, že jeden takový problém byl v koncem loňského roku odhalen v procesorech Skylake. Jedná se podle všeho o hardwarový nedostatek, který se může projevit při běhu programů používajících instrukce AVX.

Chyba se v praxi ukázala u programu Prime95, který asi znáte jako prostředek pro ověřování stability PC, ovšem jeho původním účelem je distribuované hledání tzv. Mersennových prvočísel (projekt GIMPS). Problém byl objeven v testu FFT o velikosti 768K. Postiženy by měly být všechny verze Prime95 používající AVX, s možnou výjimkou poslední verze (28.7), která u Skylake běží na instrukcích FMA3, čímž se chybě (minimálně někdy) vyhne. Chyba se neobjeví automaticky, výskyt může nastat až za několik hodin, takže se zdá, že v ní hraje jistou roli náhoda a spustí ji souběh složitých faktorů v procesoru – což je nejspíš důvod, proč tato nestabilita prošla interním testováním.

BGA verze procesorů Skylake: Core M, řada U a řada H s externím čipsetem

Chybu se údajně podařilo zopakovat řadě uživatelů a nyní ji již potvrdil i Intel. Nastává nejen po přetaktování, ale i při výchozích taktech. Problém podle hlášení chyby minimálně v některých případech vede nejen k chybě ve výpočtu, ale také zamrznutí systému. To potvrzuje i Intel a uvádí, že se jedná o problém potenciálně se týkající všech Skylaků, při němž se za určitých složitých okolností procesor zasekne nebo se dostane do nepředvídatelného (nestabilního/nekoherentního) stavu.

 

Aktualizace mikrokódu je na cestě

Naštěstí byly podle Intelu již příčiny identifikovány a firma má k dispozici opravu (pravděpodobně formou aktualizace mikrokódu pro CPU). Ta bude distribuována skrze BIOSy základních desek. Intel s jejich výrobci údajně spolupracuje na tom, aby potřebnou aktualizaci zabalili do BIOSů pro jednotlivé desky a zpřístupnili uživatelům, tento proces nicméně může nějakou dobu trvat. Doufejme, že se dostane na všechny modely včetně těch levných, které nemají tolik péče jako „vlajkové lodě“, a také na všechny notebooky či mini PC. Pokud máte počítač stouto generací CPU Intel, každopádně dostupnost nových BIOSů (respektive UEFI) sledujte.


Core i7-6700K, jedno z CPU zasekávajících se v Prime95

Bohužel zatím nevíme, zdali oprava bude mít nějaké dopady na výkon procesoru. Jak ukázal například bug v TLB u úvodní revize 65nm Phenomů (Agena/Barcelona), opravy i velmi vzácně se vyskytujících problémů mohou vést k reálné degradaci výkonu. Nicméně zde nemusí jít o problém v tak kritické části a je možné i to, že se Intelu podaří rizikovým situacím zabránit jen s malým či nepatrným postihem. Na druhou stranu, některé chyby se nedají obejít snadno, viz například nefunkční instrukce TSX u Haswellu, které musely být aktualizací zcela vyřazeny z provozu.

 

 

Pokud se chcete v Prime95 pokusit o zreprodukování této chyby, přímá cesta vede přes položku „test“ v podmenu „advanced“. Do kolonky „Exponent to test“ vyplňte číslo 14942209 a úlohu spusťte. Počítač by měl po nějaké době, která může zabrat minuty, ale i hodiny, zamrznout. Tento pokus tudíž provádějte jen pokud současně nepracujete a nemáte nějaká důležitá neuložená data, která by kolaps a nestandardní vypnutí systému mohl ohrozit.

Zdroje: GIMPS, Intel