SSD selhávají skoro stejně často jako HDD, naznačuje nová statistika Backblaze. Zálohujte!

26
Ilustrační foto: SSD v provedení modulu M.2
-
Zdroj: Kingston

Nejnovější statistika Backblaze naznačuje, že spolehlivost SSD nemusí vůbec být výrazně lepší než u pevných disků (HDD).

V květnu jsme tu měli zprávu o studii firmy Backblaze, která zveřejňuje statistiky poruchovosti pevných disků, provozovaných její službou. Když Backblaze začala uvádět také statistiky poruch SSD, které používá jako systémové disky serverů, vypadalo to nejdřív, že vykazují řádově lepší výsledky. Teď ale přichází nová čísla, podle kterých je to o dost horší a vypadá to, že nakonec úmrtnost SSD může být skoro stejná jako u HDD.

Na první pohled se může zdát, že SSD jsou o dost spolehlivější, jak uváděla předchozí zpráva od Backblaze (a náš o ní pojednávající článek). Backblaze například má statistiku, dle které je celková úmrtnost HDD, která tato firma provozuje ve svých serverech jako bootovací disk, 6,41 % v přepočtu na jeden rok. Tedy za rok může odejít až 6,5 % instalovaných disků. U SSD používaných jako bootovací disk je zatím statistika porouchaných zařízení jen 1,05% úmrtnost v přepočtu na jeden rok.

Backblaze má v datacentrech 1666 systémových SSD a 1607 systémových HDD, takže podíl je prakticky padesát na padesát. Ale je tu jistý metodický problém, který může zkreslovat poruchovost SSD a činit ji mnohem růžovější, než ve skutečnosti. Firma začala SSD nasazovat pozdě, až někdy od roku 2018, kdy začaly být malé kapacity (240–256 GB) velmi levné. Průměrný věk SSD je proto jen 14,2 měsíce (nejstarší mají 33 měsíců), naopak HDD jsou všechna z předchozích let a mají 52,4 měsíce neboli skoro 4,5 roku v průměru (tj. mnohá budou ještě starší). I ta vůbec nejméně stará HDD už mají vždy aspoň 27 měsíců.

Roční poruchovost HDD a SSD za celou dobu provozu
Roční poruchovost HDD a SSD za celou dobu provozu (Zdroj: Backblaze)

Ona úmrtnost je na první pohled u HDD velká, těchto 6,41 % ročně znamená celkem 619 vyhozených disků za dobu, kterou statistika pokrývá. Je to ovšem za 3 523 610 odsloužených dnů. SSD „exlo“ v Backblaze zatím jenom 17, což z ní ve srovnání jako strašně dobré číslo, ale je to za 591 501 dní běhu. Kratší doba provozu je v číslu uvádějícím „anualizovanou“ (na jeden rok přepočtenou) úmrtnost sice normálně zohledněná, ale toto počítání pořád ignoruje důležitou věc: u HDD totiž velká úmrtnost přibývá s dlouhým věkem, disky se unavují nepřetržitým provozem v serveru (přičemž Backblaze pro tuto úlohu nevyužívala serverové modely určené pro 24/7 provoz).

Tím, že jsou ve statistice hlavně stará HDD, ale naopak relativně nová SSD, se jak uvidíte může srovnání hodně vychýlit. Backblaze mimochodem uvádí, že někdy v budoucnu uvede také studii o tom, jak moc věk zhoršuje spolehlivost HDD, což bude asi hodně poučné čtení.

Stejně stará SSD a HDD mají poruchovost podobnou

Každopádně pro lepší srovnání zkusili v Backblaze vzít data o poruchovosti HDD jen za dobu, kdy byl jejich průměrný věk podobný, jako nyní u SSD, a srovnat s tímto obdobím. Šlo období do Q4 roku 2016, kdy dosáhla systémová HDD průměrný věk 14,3 měsíce, bylo jich ve flotile 1297 kusů a měly dohromady naběháno 659 526 dne. A pro toto období najednou vychází úplně jiná charakteristika spolehlivosti: za tuto dobu disků umřelo jenom 25 a jejich poruchovost vychází jen na 1,38 % ročně.

Poruchovost HDD a SSD pokud se srovnávají zhruba stejně staré disky
Poruchovost HDD a SSD, pokud se srovnávají zhruba stejně staré disky (Zdroj: Backblaze)

Najednou je to tedy vlastně řádově stejná hodnota: pokud jsou HDD a SSD stejně stará a nacházející se v prvních dejme jednom až třech letech života, odumírají ve vcelku stejném počtu. Zhebavost 1,38 % je sice o třetinu víc poruch HDD než 1,05 % selhání ročně u SSD, ale je tu jedna věc, která naopak trochu hraje do karet HDD. Porucha HDD v této statistice znamená buď náhlou celkovou smrt (kdy ztratíte všechna data), nebo také preventivní vyřazení HDD, které Bakblaze dělá podle varovných signálů v parametrech SMART (vadné/realokované sektory, ale i další). V těchto případech je HDD ještě funkční a minimálně většina dat se dá přečíst, což je méně závažná forma poruchy. U SSD zatím toto preventivní odstavování firma z důvodu nedostatečných zkušeností nedělá a všechny zaznamenané poruchy SSD jsou tedy nejhorší případ totálního náhlého odchodu (kdy už tedy nešla přečíst data ze SSD). Ani jedno ze selhání SSD v této statistice jinak prý nebylo kvůli vyčerpání zapisovací životnosti NAND.

Poruchovost značně roste u několik let starých HDD

Pro ilustraci toho, jak na věku záleží, má Backblaze následující graf, kde je modře vyznačená úmrtnost HDD s postupujícím časem provozu a oranžově úmrtnost SSD. Jak vidíte, až na tu dejme tomu o třetinu lepší spolehlivost SSD (když pomineme určitou možnost statistické chyby a předchozí odstavec) se křivky na začátku hodně podobají. Pokud by se HDD nepoužívala pořád dál navzdory jejich rostoucímu věku, nevycházela v roce 2014 až 2017 o tolik hůř než SSD v letech 2018 až 2021. A vypadá to, že i u SSD by se mohla začít s věkem poruchovost trošku zvyšovat. Zatím je otázka, zda by při vysoké zátěži dokonce nemohlo někdy dojít i na vyčerpání životnosti přepisů, pokud by se používala několik let?

Vývoj poruchosti HDD a SSD s jejich věkem
Vývoj poruchovosti HDD a SSD s jejich věkem (Zdroj: Backblaze)

Data Backblaze tedy zatím ještě nelze použít k výroku, že by byla SSD řádově (nebo aspoň 6×, jak to říkalo číslo citované v úvodu) spolehlivější. Velká otázka ale je, jak se bude poruchovost SSD vyvíjet dál. Statistika Backblaze totiž končí zrovna tam, kde se koleno u HDD ohlo nahoru. Za H1 2021 (ještě ne celý rok) je u SSD vidět určité zhoršení, které ale možná nemusí být signifikantní a mohlo by jít jak o statistickou chybu, tak o začátek trendu zhoršující se poruchovosti. Zda křivka bude kopírovat opravdu výrazně se zhoršující vyhlídky HDD, ukáže až příští rok až dva.

Ponaučení: SSD není záruka ničeho, důležitá data vždy zálohujte

Co si z toho vzít teď? Osobně bych asi byl mírným optimistou a nepředpokládal, že se se stářím bude poruchovost SSD zhoršovat přesně tak zle, jako je to u té modré křivky HDD. Pořád je pravda, že SSD díky absenci mechanických částí přece jen jsou na určité věci méně choulostivé a i když je zde ona hrozba omezené životnosti zápisu, riziko všech možných modů selhání je u těchto úložišť celkově asi opravdu nižší. Je jen asi dát pozor na to, že v SSD je mnohem větší množství výrobců, včetně hodně pofidérních značek z Číny, zatímco jen tři výrobci HDD mají asi všichni relativně vyšší standardy kvality. Tato prakticky „no name“ SSD mohou být tak nekvalitně navržená a zpracovaná (jak co do firmwaru, tak hardwaru), že mohou mít extrémně zhoršenou poruchovost nebo zkrácenou životnost.

Ale zatím jednoduše nevíme jistě, jaká reálná poruchovost starých SSD vyjde. Je docela možné, že místo té 6× lepší spolehlivosti SSD vyjde už jenom třeba trojnásobná, nebo dokonce jenom dvojnásobně lepší spolehlivost. Ovšem třeba pořád okořeněná tím, že když už SSD odejde, tak to většinou bude odchod způsobem „cihla“ se stoprocentní ztrátou dat, zatímco u HDD je poměrně časté, že HDD vyhodíte, když se množí vadné sektory nebo máte varovný SMART status, ale máte pořád čas si data zachránit.

Ilustrační foto (Zdroj: Cnews.cz)

Závěr je takový, že byste neměli přeceňovat spolehlivost SSD. Nečekejte, že tato úložiště nemohou ze dne na den přestat fungovat. I s těmito disky tedy dbejte na to, abyste měli data vždy bezpečně zálohovaná. Vše, co je důležité a nesmíte nebo nechcete o to přijít, tedy musíte mít nějak uložené nezávisle (nastudujte si zásady zálohování a pamatujte, že třeba „bezpečné“ pole RAID 1 může selháním hardwaru nebo softwaru být zničeno celé naráz, takže data nacházející se na něm nejsou náhrada zálohy).

Je jasné, že když máte dat hodně, nemusí být ekonomicky snadné mít od všeho někde druhou kopii. I pokud u některých věcí budete ochotni (nebo nuceni) akceptovat riziko, vždy byste si ale měli ujasnit okruh opravdu důležitých a případně citově cenných dat a tuto část si nějakým způsobem zálohovat. (Tímto vám přejeme, ať se vám selhání disků vyhýbají a nemusíte ztrátu dat řešit.)

Zažili jste selhání SSD nebo HDD? Co je častější?

Zdroj: Backblaze

SSD selhávají skoro stejně často jako HDD, naznačuje nová statistika Backblaze. Zálohujte!
Ohodnoťte tento článek!
5 (100%) 15 hlasů

26 KOMENTÁŘE

  1. tak černě bych to neviděl … jediný problém ssd je, že když odejde, data odejdou s ním … potřeba zálohovat žádnou novinkou nekončí … poslední dva roky kupuji jen Samsung, různých ssd, jak sata tak nvme mám doma v compech 11, některé už mají dávno po záruce, nejopotřebovanější je jeden OCZ na 66% životnosti … jinak vše klape … v šuplíku mám 7 nefunkčních HDD, jeden (skyhawk) funkční v compu třetím rokem, jeden datový(hybrid) v notebooku …

    • Jenže jsou to právě SSD , které mají konečný počet zápisů a teoreticky se dá předpokládat , že poruchovost SSD časem poroste exponenciálně .
      Nikdo nikdy nemluvil o tom , že SSD mají být konkurencí plotnovým diskům právě v životnosti .Naopak u SSD se počítá s postupnou degradací a jediné co SSD přináší je rychlost …..

  2. Statisticky chcípají více HDD, a to proto, že je používají běžní uživatelé, kteří s PC za provozu dělají (mechanicky) neuvěřitelné věci. Disky v serverovnách, NASech apod. jsou na tom o poznání lépe. Pár SSD jsem už zcepenět ale viděl taky.

    Obecně platí, že když disk neumře do 2 měsíců po nasazení, tak už pak vydrží leta.

  3. 10 let starý Intel Serie 510 120GB používaný jako systémový jede bez chyb stále, jen teď v notebooku. Samsungy též bez problémů, jediný SSD co mi prošel rukama a bylo po něm byl nejlevnější Kingston, co cpou do sestav. Kamarád ho používal na vše, takže filmy, hry, stream. 2 roky a bylo po něm, odešel těsně po záruce.
    Jak je řečeno víše HDD „sám od sebe“ mi odešel pouze dvakrát a to druhý den od zapojení, zbytek jede pořád, pokud nespadl na zem. Jistě mají lepší statistiku pro srovnání, jen je otázka zátěže a počtu přepisů sledovaných SSD.

  4. Rukama mi prošlo dost vadných HDD z notebooků, ale ty měly nalítaný roky provozu. No a pak mi prošlo rukama celkem dost notebooků s vadným SSD ve stáří do jednoho roku. Vrchol byl SSD WD green, ten nevydržel kolikrát fungovat ani měsíc. Ale je fakt že poslední dobou se živostnost SSD rapidně zlepšila, ty první SSD byly katastrofa. A taky je fakt že z většiny vadných HDD se nám podařilo dostat aspoň část dat zpět, u vadných SSD je ztráta dat 100%.

  5. 13 let staré HDD WD 500GB běží bez problémů dodnes.
    Za to jejich nástupce HDD WD blue se odporoučeli všechny.
    Po 5 letech provozu najednou velmi pomalé čtení.
    SSD mi neodešlo ani jedno. 5 let vydrží v pohodě.
    Jsou to sice statistiky na desítkách kusů. Ale myslím že ta oranžová křivka v grafu (SSD) bude oscilovat kolem jednoho procenta. A hlavně bez ohledu na to jestli SSD běží v serveru nebo notebooku. Protože HDD v notebooku je špatný vtip.

    • Zapomněl jsem na jeden PC, který pálil levné SSD. Naštěstí dost rychle takže se stihli vyreklamovat. A Data v tahu.
      Značkové SSD tam běží dodnes. Takže nevím jestli to není zdrojem a nebo deskou. Nebo prostě smůla na 2 vadné kusy po sobě.
      Každopádně výše uvedená statistika platí pro značkové (intel, Crucial, Samsung) SSD. Nic jiného nekupuji.

  6. Tak neviem, ja som prave vzdy mal za to, ze SSD odide skor nez HDD. Uz len z titulu moznych TBW. SSD je akurat odolnejsie voci otrasom. A zatial co sa tyka HDD som nemal taky, co by mi odisiel len tak zrazu z nicoho nic, SSD ano. Jeho zdravotny stav sa mi (aspon doteraz) dalo lepsie sledovat. Ci uz po zvukovej stranke clovek vie, ze nieco nie je v poriadku alebo pomocou HDsentinel.