Prohlížeč Firefox začal kontrolovat, jestli počítač nemá vadnou paměť. Výsledky vývojáře šokovaly

Sdílet

DDR4 moduly Corsair Vengeance LPX Autor: Corsair
DDR4 moduly Corsair Vengeance LPX
Aniž bychom o tom věděli, naše počítače můžou být nestabilní a nepozorovaně dělat chyby, kvůli kterým ztratíme data nebo rozdělanou práci – bohužel je to mnohem častější, než si myslíte.

Když vám občas spadne webový prohlížeč nebo hra, nejspíš to budete považovat za chybu v tomto programu. Ve skutečnosti ale můžete mít vadnou nebo nestabilní operační paměť, aniž byste o tom věděli. Na rozdíl od HDD nebo SSD nejsou totiž data RAM chráněná proti porušení. A vypadá to, že nestabilní paměť může v počítači nepozorovaně dělat neplechu mnohem častěji, než si myslíme, a třeba tím i ohrozit vaše cenná data.

Nepozorované hnití dat v paměti existuje a může ti ublížit

Vývojář prohlížeče Mozilla Firefox Gabriele Svelto teď zveřejnil docela znepokojující data o tom, jak často může operační paměť počítače dělat problémy. Řešil totiž problém, že někdy hlášení o pádech, která Firefox může zaslat vývojářům při problémech, neukazují na žádnou zjevnou příčinu, která by k chybě mohla vést a je u nich podezření, že uživatel mohl mít prostě nestabilní počítač (čímž se myslí, že výpočty probíhají chybně nebo se právě samovolně mění data v paměti).

Svelto kvůli tomu napsal kód, který se spustí po pádu Firefoxu na počítači a rychle otestuje, zda se v operační paměti samovolně nepoškozují uložená data, tedy zda se nestává, že se občas změní hodnota nějakého bitu (přihodí se tzv. bit-flip), což může rozbít kód programu a vést k pádu nebo jinému nesprávnému chování. Bit-flip v kódu programu je ještě ta lepší možnost. Protože pokud se vám přehodí bit třeba ve fotografii nebo jiném souboru s vašimi daty, která pak uložíte na disk, po opětovném otevření až příliš pozdě zjistíte, že je soubor pokažený a o data jste částečně nebo úplně přišli.

Jde jen o rychlý test, zkouší jen 1 GB paměti po dobu maximálně třech sekund. Nicméně po jeho nasazení se ukázalo, že i tak zachycuje nečekaně velké množství případů, kdy zřejmě prohlížeč spadl kvůli nestabilní paměti nebo jiné závadě hardwaru (protože primární příčinou nemusí být paměťový modul, ale třeba i základní deska nebo špatně fungující zdroj napájení).

Chyby způsobené RAM mohou za velké množství pádů aplikací

Svelto uvádí, že za týden systém telemetrie nashromáždil asi 470 tisíc hlášení o pádech Firefoxu z nejrůznějších příčin (přičemž Firefox se před odesláním hlášení ptá na souhlas, takže ve skutečnosti nejde o všechny pády, ke kterým dojde). Z těchto hlášení bylo díky testovacímu kódu v okolo 25 tisících případech rozpoznáno, že paměť počítače je nestabilní (dochází k ní k bit-flipům), a je tak pravděpodobným důvodem pádu. Protože detekce je jen rychlá a jednoduchá, je to téměř jistě jen hodně podhodnocená spodní hranice. Podle Svelta lze konzervativně hádat, že ve skutečnosti asi je špatnou pamětí způsobeno 10 % nebo možná i víc ze všech pádů.

Paměti DDR4 v modulech DIMM

Paměti DDR4 v modulech DIMM

Autor: Crucial

Ve skutečnosti je to asi ještě víc, protože prohlížeče webu dnes díky otevírání většího množství záložek často padají na vyčerpání volné kapacity RAM (poznámka: děje se to, pokud máte omezenou velikost stránkovacího souboru, což se dřív často doporučovalo; musíme upozornit, že dnes si tím zaděláváte na problémy, takže raději nechte velikost stránkovacího souboru spravovat Windows automaticky – stabilitě vašeho PC to prospěje). Podle Svelta po odečtení případů, kdy dojde paměť, nejspíš procento pádů, které podle tohoto testovacího nástroje způsobuje nestabilní paměť, nejspíš vycházelo vyšší než 15 %.

Mnohem větší problém, než se předpokládá

Vývojáři ale každopádně při nasazení tohoto nástroje předpokládali, že podíl bude mnohem nižší, že jsou nestabilní paměti tak rozšířený problém, vůbec nečekali. Většina postižených uživatelů asi netuší, že mají počítač nestabilní. Může to být proto, že provozují přetaktovaný procesor nebo paměti (což může být teoreticky i použití XMP a Expo profilů u pamětí, které se tváří, jako by bylo „zaručené“, ale nemusí být vždy stabilní se všemi deskami a procesory).

Někdy může být přímo chybový samotný hardware i bez přetaktování, takže by měl být reklamován. Bohužel používat standardně dostupné programy pro testování stability dnes zdaleka není jistota, Memtest86+ vám často hlásí, že je všechno v pořádku, i když vám kvůli nějaké nestabilitě nebo nekorektnímu chování pamětí počítač padá nebo zamrzá. Přetaktovávači a ladiči výkonu asi často podceňují to, jak zákeřná nestabilita CPU a pamětí může být, a provozují PC s parametry, které vedou k nenápadným chybám.

Svelto mimochodem uvádí, že chybující paměti RAM tento nástroj zdaleka nenachází jenom na počítačích s Windows. Spousta hlášení je údajně i ze současných notebooků Apple s jeho vlastními Arm procesory řady M, které mají paměť integrovanou na pouzdru (tzv. on-package-memory). Není to tedy tak, že by díky úzké integraci procesoru a paměti u Macbooků byla stabilita zaručená.

U všech notebooků s pamětí osazenou napevno je její nestabilita samozřejmě dost vážný problém, protože ji nelze jednoduše vyměnit. Čipy osazené u PC notebooků přímo na základní desce lze s dobrým vybavením vyměnit (odpájet a nahradit), byť to není nic, co by šlo běžně dělat amatérsky. V případě notebooku Apple s pamětí na pouzdru čipu už to asi bude obtížnější a asi se nevyhnete tomu, že budete muset opravu zadat oficiálnímu servisu Applu.

Apple M3

Apple M3, procesor s pamětí osazenou přímo na substrátu procesoru místo na základní desce

Autor: Apple

Chybující paměť samozřejmě neovlivní jen Firefox, uživatel takového počítače bude na nestabilitu nebo skryté problémy trpět i v ostatních programech. A nestabilní pak může být i jeho operační systém. To, když už kvůli chybě zkolabuje Firefox a nástroj pro hlášení pádů ji zachytí a nahlásí, je tak jen špička ledovce.

Bohužel jde o problém, který zatím nemá snadné řešení. Standardem v osobních počítačích i v mobilech se bohužel staly operační paměti bez ochrany dat ECC, která by dokázala chyby detekovat a částečně i opravit. Právě proto ani moc netušíme, jak často se tyto problémy v počítačích dějí a riskujeme kvůli nim, že přijdeme o práci nebo data. Bránit se tomu lze jen částečně tím, že nebudete přetaktovávat, příliš agresivně „ladit“ výkon, případně i nepoužívat nadšenecké paměti a procesory, které jsou vyhnané na extrémní frekvence na hranici stability; také asi pomůže dbát na dobré chlazení a nenechat hardware jít na hraniční teploty.

Pomůže paměť DDR5, nebo potřebujeme regulérní ECC?

Je otázka, zda třeba většina těchto případů nejsou počítače se starším typem paměti DDR4. Technologie pamětí DDR5 totiž přišla s částečnou ochranou ECC, která by teoreticky mohla pomoct. Problém je, že tzv. on-package ECC zavedená standardem DDR5 pracuje jenom interně v čipech a modul nijak nepředává procesoru a přes něj operačnímu systému informaci o tom, že paměťový modul při provozu generuje chyby. Ty mohou být pomocí této ochrany opraveny, ale také ne, pokud s vyskytne chybových bitů víc a redundantní algoritmy je nezvládnou opravit.

Paměti DDR5 Kingston Fury Beast

Paměti DDR5 Kingston Fury Beast

Autor: Kingston

Kromě toho je tu ten problém, že není chráněn přenos dat z paměťových čipů do procesoru a zpět, a právě při něm asi často vznikají chyby potichu kazící přenášená data. Je to možná i pravděpodobnější než to, že se hodnota nějakého bitu změní přímo na čipu, protože současná paměťová rozhraní běhají na velmi vysokých rychlostech a jsou extrémně citlivá na kvalitu signálu a rušení.

školení AI

Z těchto důvodů má nejspíš on-package ECC v DDR5 modulech jen omezený efekt a nemůže nahradit plnohodnotné ECC moduly, jaké se používají v serverech a pracovních stanicích. Bez nich na PC asi úplnou spolehlivost nikdy mít nebudeme. Snad se v některé z budoucích generací RAM stane ECC standardem…

Zdroj: Gabriele Svelto

Autor článku

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Kvíz týdne

Tyto konektory zná každý. Ale víte, co jejich zkratky doopravdy znamenají?
1/9 otázek