Jaká je poruchovost SSD v porovnání s HDD? Statistika ukazuje, že rozdíl je až 10×

14
Samsung V NAND 6generace SATA SSD Disk ilustrace 1600
SSD Samsung s čipy V-NAND 6. generace
-
Zdroj: Samsung

Umřou SSD častěji než HDD, nebo naopak? A jak často se to stává? Backblaze zveřejnilo velmi užitečné srovnání spolehlivosti (či poruchovosti) obou typů úložišť.

Před pár lety byla docela dobrým zdrojem informací o spolehlivosti disků data firmy Backblaze, která jako serverové úložiště používala klasická spotřebitelská HDD a zveřejňovala statistiky jejich poruchovosti (nepochybně hlavně proto, že po takových informacích byl hlad a tyto články byly dobrá reklama). Bohužel před časem firma přešla na serverové disky, a tak její data v podstatě přestala být pro svět PC relevantní.

Ovšem teď Backblaze přišla s trošku jinými statistickými daty, která stojí za pozornost – totiž srovnání mezi mechanickými (magnetickými) pevnými disky HDD a plně elektronickými SSD. Ačkoliv to, že SSD jsou spolehlivější, je asi většinový názor, nevyhýbají se ani jim poruchy. A místo vadných sektorů a nabouraných hlaviček u nich zase můžete mít obavy z „bricknutí“, třeba i vlivem chyb jejich komplexnějšího firmwaru či podobných faktorů. Studie Backblaze přináší statistické porovnání toho, jak časté jsou poruchy SSD a zda či o kolik jsou v tomto spolehlivější než HDD.

HDD × SSD (jako systémový disk)

Možná je dobré nejdřív upozornit, že statistiky pro SSD nejsou srovnatelné s těmi, které Backblaze poskytovalo i dřív. Nejde totiž o statistiky pro disky, které slouží jako úložiště, ty má firma pořád čistě magnetické kvůli velké výhodě v ceně za jednotku prostoru. Vedle 172 256 datových HDD ale firma má v serverech údajně 3187 systémových disků, které jsou zhruba půl na půl HDD (1669 kusů) a SSD (1518 kusů). A právě na těchto systémových discích serverů firma teď porovnala poruchovost.

Ilustrační foto (zdroj: blickpixel / Pixabay)
Ilustrační foto (Zdroj: blickpixel / Pixabay)

V uplynulém čtvrtletí Q1 2021 uvádí Backblaze 44 poruch/selhání HDD, přičemž selhání může zřejmě být i překročení určitého množství vadných sektorů. Toto číslo za čtvrtletí by odpovídalo 10,56% roční úmrtnosti (kdyby se extrapolovalo na celý rok). Jde o horší poruchovost, než má Backblaze u datových disků, ty dosahují v nejhorším případě 2,43% roční úmrtnosti, v lepších případech mají i pod 1 %. To jsou ale serverové/enterprise modely, kdežto jako systémová HDD asi Backblaze vzhledem ke kapacitě a uváděné ceně používalo levné spotřebitelské.

U systémových SSD mělo Backblaze v prvním kvartálu řádově lepší výsledek. Uvádí, že selhala jen dvě SSD, což vychází na zhruba 0,58% úmrtnost za jeden rok (pokud by se z 3 měsíců extrapolovalo/přepočetlo na celých 12).

Statistika poruchovosti HDD a SSD od Backblaze za Q1 2021
Statistika poruchovosti HDD a SSD od Backblaze za Q1 2021 (Zdroj: Backblaze)

Mimochodem, SDD používá pro systémové oddíly teprve asi dva roky, opět kvůli ceně. Firma je začala používat tehdy, když se 240GB – 250GB modely dostaly cenou pod cca 50 $, do té doby firma šetřila a kupovala na tuto roli základní 500GB HDD. Jde tak o porovnání trošku nerovné, používaná SSD mají průměrné stáří něco přes rok (12,66 měsíce), kdežto HDD v průměru přes čtyři roky (49,63 měsíce).

Kompletní záznamy od roku 2013

Možná lepší než jen nejčerstvější statistika za poslední tři měsíce jsou souhrnná data za celý provoz. Zde je trošku menší rozdíl, vychází o něco méně než desetinásobný. SSD doteď celkem odešlo osm a odpovídá to v přepočtu 0,65% úmrtnosti za rok. Pevných disků od roku 2013 doteď v roli systémových úložišť odešlo do věčných syslišť 559, což je v přepočtu na jeden rok u HDD úmrtnost 6,04 %. Je to o víc jak 40 % lepší vysvědčení, než byl stav za Q1 2021. Možná je to ovlivněno právě stárnutím flotily, kdy už patrně nejsou nasazována žádná nová HDD, jen SSD, a tak i nespolehlivost těchto stárnoucích HDD časem stoupá.

Statistika poruchovosti HDD a SSD od Backblaze souhrnná data od roku 2013
Statistika poruchovosti HDD a SSD od Backblaze, souhrnná data od roku 2013 (Zdroj: Backblaze)

Jak už bylo řečeno, HDD jsou v průměru čtyřikrát starší a tím pádem mají také odtočeno (doslova) mnohem více odsloužených hodin, 3 375 805 hodin provozu proti 450 503 hodinám u SSD. To je pochopitelně nutné vzít v potaz při posuzování poruchovosti, ale i bez toho – pokud by byly stejně staré – by asi pevné disky dopadly hůře.

Toto lze asi brát jako potvrzení, že absence mechanických/pohyblivých komponent skutečně vede k větší spolehlivosti a alespoň v průměru lze říct, že můžete SSD více věřit. Bylo by ale dobré mít nějaké statistiky různých modelů a značek ve velkém měřítku. Je asi celkem myslitelné, že kvůli chybám firmwaru, konstrukci, kvalitě výroby nebo třeba chlazení/zahřívání by asi mohly existovat problematické modely SSD, které odcházejí více, než je průměr. A různé takové by se pak mohly v nespolehlivosti dostat na horší úroveň, než má průměrné HDD.

Je nicméně zajímavé, že ta 0,58% poruchovost v Q1 2021 není až tak dramaticky lepší v porovnání s datovými disky Backblaze, což jsou, jak už bylo řečeno, místo spotřebitelských HDD dražší enterprise modely pro datacentra. U těch jsou rozdíly mezi značkami a modely, ale ta lepší mají také roční úmrtnost pod 1 % a Backblaze uvádí, že v Q1 2021 byla úmrtnost těchto HDD v roli datových disků jen 0,85 %, což už je srovnatelné s těmi (levnými) SSD. Tyto enterprise/serverové pevné disky jsou tedy evidentně o dost spolehlivější než levné spotřebitelské, i když je otázka, zda dobrému výsledku částečně nepomáhá třeba i to, že se datová úložiště méně namáhají.

Adata XPG SX8100 NVMe SSD modul M2 ilustrace 1600
SSD Adata XPG SX8100 (Zdroj: Adata)

Zálohujte, i když máte SSD

Jak můžete vidět, nějaká SSD přece jen z času na čas umřou. Ač je na to šance (za jeden rok) menší než 1:100, měli byste s tím vždy počítat a mít zálohy dat pro případ, že se to stane vám. Spíše než selhání typu „pomalu se objevují vadné sektory“ to pravděpodobně může být náhlá kompletní smrt, kdy najednou přijdete o všechno bez šance na obnovu. Pokud pro vás není praktické zálohovat si všechna data nebo máte hluboko do kapsy, dbejte aspoň, abyste měli kopii toho nejdůležitějšího. Přinejhorším aspoň třeba na úložišti OneDrive, kterého máte přímo ve výchozí instalaci Windows 10 několik gigabajtů zadarmo přímo integrovaného do systému (tedy za podmínky, že používáte microsoftí účet).

Věříte více spolehlivosti magnetických disků (HDD), nebo SSD?

Zdroj: Backblaze

Jaká je poruchovost SSD v porovnání s HDD? Statistika ukazuje, že rozdíl je až 10×
Ohodnoťte tento článek!
4.6 (92.38%) 21 hlasů

14 KOMENTÁŘE

  1. SSDčka mi umřela dvě. První bylo kdysi 120GB od Kingstonu, které mi zdechlo po pár měsících v notebooku ze dne na den a vyreklamoval jsem ho a jeho bráška běží doteď.
    Druhé SSDčko mi umřelo asi před 14 dny. 240 GB Adata SU650. Používal jsem ho jako takový odkládací a pracovní prostor na stolním počítači (konvertoval jsem na něm třeba stará videa do h.265). Fungovalo, najednou začala klesat přenosová rychlost k jednotkám MB/s, po pár minutách k nule. Adata software hlásil, že disk je „Good“. Po restartu fungoval pár minut a totéž. Po dalším restartu už ani nenaběhl počítač a disk totálně v háji. Už se mi ho nepodařilo připojit ani přes usb redukci.
    HDDček mi umřelo už taky několik, naposledy nepřežil jeden 8TB disk pád ze 2,5 metru na betonovou podlahu. 🙂

    • ssd zatím v pohodě a to mám i spousty let staré Vertexy, které dost často „odešly“ po vypnutí počítače, nvme adata, nvme evo plus, nějaké patrioty … HDD mám asi 4 v šuplíku a to jsem jednu barracudu 2x měnil v záruce, od té doby mám funkční jen jeden skyhawk, ten běží čtvrtým rokem jako datový, v pohodě …

  2. „Jak už bylo řečeno, HDD jsou v průměru čtyřikrát starší a tím pádem mají také odtočeno (doslova) mnohem více odsloužených hodin,…“

    Je to nějak explicitně vyjádřeno od Backblaze, že ty disky se nezastavují nebo je to zdejší obvyklá vata?

    • Upřímně, nezastavování dísků je ta lepší varianta.
      Mám několikaletou (dnes už naštěstí historickou) zkušenost s použitím 2,5″ HDD a 3,5″ „Zelených“ WD v serverech a routerech.
      Můj soukromý router jsem upgradoval na SSD, a byla to změna v podstatě vynucená, protože ten původní 2,5″ HDD sice fungoval, ale kvůli opakovanému parkování hlav se z něj po několika letech začaly linout cinkavé zvuky a postupně mu vybavování dat trvalo déle a déle (plus adekvátní SMART hodnota se snížila na kritickou hranici). U levného serveru jsem použil několik disků WD Green 1TB první generace (všechny tyto disky parkují hlavy a mají poměrně agresivní powermanagement). Podotýkám, že byl řešen mdraidem, takže se dá vyloučit vliv patrol readů a podobných věcí HW řadičů. Protože v té době to byla novinka, tak jsem tomu věnoval poměrně hodně času a na diitu byl na to článek s postupem, jak tyhle věci vypnout (viz wdidle). Protože jsem si nebyl jistý, aplikoval jsem vypnutí těchto funkcí ve firmwaru disku vždy jen na půlce těchto disků, druhou stranu zrcadla jsem nechal jak byla. Zkušenost je taková, že po 3 letech odešel první disk z těch neupravených a SMART hodnoty těch ostatních byly povážlivě nízké. Aplikoval jsem tedy změny na všech (i náhradě za vadný) a od té doby server jede dodnes bez zaškobrtnutí, už to bude nějakých 5-6 let? Smart hodnoty wearoff jsou už samozřejmě šílené (power on hours například), ale disky jedou pořád dobře – nehlučí, nemají prodlevy.

      Z toho plyne jedno: disku nevadí, že se stále točí, vadí mu spíše změny stavů a mechanické rozjezdy/dojezdy ramen a hlav do parkovacích poloh, pokud se to stane několikrát za den.

      • Nezpochybňuji vliv zastavování disků(ať už pozitivní nebo negativní).

        Naopak, a právě proto mě zajímá, jestli Backblaze ty disky cíleně nezatavuje(případně jsou tak vytížené, že se nezastaví) nebo se jedná jen o rádoby vtipnou poznámku.

        P.S. Hezký příběh… Ale neplyne z něj nic. Statisticky bezvýznamné.

        • ad P.S.: ale tady přece nejde o statistiku, ale o způsob použití, který se měřitelně projevoval na SMART hodnotách.
          Jak zastavení disku (resp. jeho rozběh), tak zaparkování hlav má „svou“ položku ve SMART tabulce. Pokud by to byly benigní operace, proč by se výrobce obtěžoval takovou informaci počítat a na jejím základě odhadoval životnost disku?

  3. Chybí mi možnost „Nevěřím ani jednomu,“ protože to je podstata zabezpečení důležitých dat (tedy zálohování, ať jsou uložena kdekoli.)

    U SSD je problém v praktické nemožnosti vykutat data zpět.
    Během své praxe jsem potkal asi 4 nebo 5 umřelých SSD, paradoxně to bylo 50:50 mezi noname a top (tehdejšími) značkami (Samsung, OCZ).

    Co se Backblaze týká, tak bych vypíchl jednu věc: systémový disk v úložišti bude prakticky jen číst (a to jen při startu systému), a semtam něco zapíše do logů, což je pro SSD v podstatě ideální scénář. Takže tím bude taky ovlivněna spolehlivost, respektive její poměr vůči magneťákům, pro které je čtení i zápis stejně náročný proces. Kdyby se SSD používala jako datový disk, věřím, že by ten poměr (ne)spolehlivosti mezi SSD a HDD nebyl takto velký.

    P.S.: „Věčná sysliště“ si píšu do deníčku, krásný termitus technicus. 😀

    • s tím čtením/zapisováním nemáš tak úplně pravdu, ssd i když má jen číst, stejně pořád zapisuje, přepisuje, to není o jedné feature … samozřejmě věřit tomu nebo onomu ve smyslu bezpečí záloh nelze … kdo se spolehne, zaručeně o data přijde … výhoda ssd je, že pokud odejde jen cestou maximální kapacity přepisů, pořád jde z něj číst … pokud odejde součástka, nikdo z něj data nedostane, co z ploten ještě někdy (za něco) jde …

      • Tak do takové situace jsem se nikdy nedostal, vždy to byla „rychlá smrt“ – cvak, a bylo po datech. Většinou byl disk nedostupný zcela, jen v jednom případě se hlásil, ale nešel naformátovat.

        Jinak co se týká wear levellingu, tak ten samozřejmě probíhá vždy, ale v případě, že se zapisuje málo nebo vůbec a kapacita není zasadně zaplněna, se omezuje jen na „vynucené“ kydání datového hnoje. Nedá se to srovnat se scénářem, kdy každý den na disku obměníš 10GB dat a disk je z 80% plný.

  4. Sorry ale špatné pochopení zdroje. Jde o boot disky, slouží jen jako zavaděče a ukládání logů. OS na nich neběží.
    In our case, describing these drives as boot drives is a misnomer as this cohort is also used to store log files for system access, diagnostics, and more. In other words, these boot drives are regularly reading, writing, and deleting files in addition to their named function of booting a server at startup.

    • No nevím, jestli to jede na Linuxu, tak mi z toho popisu právě spíš vyplývá disk s OS. Právě že ten citát říká, že označení „boot disk“ se nemá brát tak, že se z toho systém jenom zavede a pak to spí.