Je to už nějakou dobu, co u WD vypukla kauza okolo magnetických disků s tzv. šindelovým záznamem SMR. Ty mají horší výkon než konvenční (tzv. CMR) pevné disky a firma čelila velkému odporu, když je zkusila prodávat v řadě Red určené pro NAS. Byla pak nucena vrátit do NAS řad běžné plotny. Problémy s výkonem samotné by ale neměly znamenat, že by SMR HDD měla být nespolehlivá – ideálně. Nicméně v tomto ohledu se teď problémy vynořily.
SMR HDD od WD mohou mít vrozené problémy s poruchovostí
V poslední době se objevily zprávy, že pevné disky se záznamem SMR od Western Digital mají zvýšenou šanci odejít a vzít sebou uživatelská data. Hlásí to některé firmy zabývající se obnovou dat po selhání úložišť, například německá 030 Datenrettung Berlin, Attingo a Data Reverse, které potvrdily existenci problémů či podezření na ně webu Heise.
Nemá ovšem jít o úplně nové zjištění, firmy zabývající se touto činností údajně pozorují vyšší výskyt poruch těchto HDD už od let 2021 a 2022.
Pozor na SMR disky od WD s kapacitou 2 až 6 TB
Problematické by měly být disky řady Red a Blue s kapacitou 2 TB až 6 TB. Původně zprávy mluvily také o discích řady Purple, ale to bude zřejmě omyl či chyba v komunikaci, jelikož ty SMR záznam nikdy neměly. Každopádně tato 2–6TB HDD se údajně objevují se zvýšenou frekvencí v laboratořích pro záchranu dat po selhání, které se často ohlásí ve formě rytmického klapání hlaviček ozývajícího se z disku, zatímco HDD odmítá pracovat.
Podle 030 Datenrettung Berlin bylo zjištěno, že u zmíněných disků nejde o obvyklou příčinu, kterou bývá náraz hlaviček do plochy ploten (což je pro HDD katastrofální selhání). V 95 % případů prý firma zjistila, že samotný hardware je v pořádku a stále funkční a že tato HDD patrně „ničí“ v podstatě softwarový problém v jejich firmwaru.
Pozor, pokud používáte tato HDD. Modely disků WD, které mají mít problematický firmware podle 030 Datenrettung Berlin. Zdá se ale, že zaražení modelů Purple na seznam může být chybou a nejsou coby CMR HDD postižené. Naopak ale mohou být postižená externí HDD s kapacitou 2 až 6 TB zde nejmenovaná, která mají uvnitř dotyčný disk WD
To ovšem v případě ztráty dat není útěcha. Proto pokud máte jeden z těchto disků, raději je přestaňte používat na důležitá data a jejich obsah si zazálohujte. Ztráta dat, na kterých vám záleží, je jedna z nejhorších věcí, které vás s počítačem můžou potkat, takže je dobré být v takovýchto případech opatrný.
Problémy s tabulkami dat na disku
V čem problém spočívá? HDD využívají stejně jako SSD tabulky mapující fyzické sektory na disku na logické adresy, které vidí „zvenku“ počítač a jeho operační systém. Tabulky s tímto mapováním jsou proto kritické po nalezení uložených dat.
Šindelový záznam SMR je problematický v tom, že kvůli překrývajícím se stopám vyžaduje časté načítání a opětovné zapisovaní již uložených dat, a to znamená i přepisování tabulky mapující logické adresy na fyzické sektory disku. Nejhorší je to při malých přepisech ve více oblastí, kdy každý může vést kaskádovitě k mnoha aktualizacím mapování.
Podle 030 Datenrettung Berlin postižené disky zřejmě odcházejí na sekvenci událostí, která vznikne při aktualizování tabulek a způsobí jejich poškození. Pravděpodobně by mohla být zapříčiněna třeba chybami při pokusech o korekci detekovaných chyb, nebo situací, kdy nějaká „soft“ chyba způsobená například vibrací nebo jiným přechodným faktorem přesvědčí firmware, že mapovací tabulka je chybná, a firmware se ji pokusí opravit, čímž ji ale ve skutečnosti uvede do chybného stavu.
Zdá se, že jde o obecnou chybu či slabinu v logice firmwaru a ověřování korektnosti operací, která teoreticky může nastat i u běžných HDD, pokud by na nich běžel stejný ovládací kód. Ale záznam SMR způsobuje, že tabulka mapování je aktualizována mnohem častěji (firma uvádí, že za některých situací může jeden drobný přepis vést až k 1000 aktualizacím), takže výrazně zvyšuje riziko, že se tyto slabiny projeví.
Pokud dojde k porušení integrity tabulek mapování, problémy se pak nabalují, protože proces, kterým vznikla chyba, vede k další „propagaci“ a ve finále může dojít až k situaci, kdy disk nedokáže najít ani svá vlastní servisní data a přestane fungovat.
Firma 030 Datenrettung Berlin uvádí, že disky, které takto selhaly, dlouho vzdorovaly pokusům o obnovu dat, ale byl vyvinutý postup, jak přečíst přímo fyzický obsah a obejít porušené tabulky, po čemž pak následuje pokus nějak logické sektory zrekonstruovat, je však komplikovaný a pomalý.
WD zprávy vyšetřuje
Společnost Western Digital už v říjnu webu Heise potvrdila, že problém analyzuje a tato zjištění bere vážně. Týmy inženýrů začaly zkoumat, o jak velký problém se jedná a podrobnosti toho, co se s HDD děje.
WD nicméně upozorňuje, že problém by se měl týkat jen starších HDD, která již nejsou ve výrobě – pokud někde ještě nezůstaly zapomenuté staré zásoby. Kapacity větší než 6 TB by měly být v pořádku, stejně jako všechna HDD, který používají záznam CMR a nemají překrývající se šindelové stopy.
Jde zřejmě o problém konkrétních disků, ne nutně celé technologie SMR
Podle toho, co WD uvádí, by také nemělo jít o fundamentální vadu technologie SMR jako takové, novější SMR disky jsou patrně považovány za spolehlivé (nepostižené). Tato informace tak zatím neznamená, že by SMR HDD automaticky měla být riziková, stejně tak se tyto zprávy o náchylnosti k poruchám netýkají SMR disků ostatních výrobců (Seagate, Toshiba). To je dobrá zpráva – jiná SMR HDD než ta zmiňovaná výše tedy asi zatím není třeba „řešit“.
Popis problému nicméně ukazuje na to, že SMR je technologií komplikovanější, než je běžný záznam, a tedy klade vyšší nároky na spolehlivé zvládnutí. A tím i vzniká větší prostor pro to, že se někde něco nepovede. Takové riziko ale je u všech možných technologií, včetně SSD, která také občas trpí na problémy se ztrátami dat zase z jiných příčin.
Zdroje: 030 Datenrettung Berlin, Heise (1, 2)
