ak je chýbná časť pamäte, prečo ju nezničiť pri service oprave ak to raz budú niekedy schopný a nie tú časť pamäte zakazovať... memtest je komečná firma btw, ale programy nemajú oprávnenia na takéto zisťovania dnes, preto aj robiť overclock nie je až tak jednoduché a robí to fyzikálne nechutnosti, pretože sa o to snažia rovno výrobci a sem tam neodhadnú svoju značku. Lenže ak by bola možné zničiť časť NAND pamäte, a nie ju zakázať v systéme, možno ju aj opraviť... alebo zakázať prístup z tej časti pamäte, alebo ju označkovať a nechať na systéme, nech sa vysporiada s opravármi. Lenže snaha o rýchlosť môže viesť k neštastiam a vývojári môžu byť aj hw based. Dnes tých typov pamätí zase až tak nie je, ale tieto veci skúmať sú mimoriadne drahé a nechutné, lenže ak sa niečo porieši, potom z toho môžu byť chutné veci a raz to zistí aj Samsung, že prečo NotAnd dominuje a SSD sú príbuzní pamätí, ATA based a prerábať bázy na iné, napríklad dvojkovú sústavu na 13áskovú, vie robiť šarapatu v exceli. Prípadne u dodávatelov serverov pre gamesníkov.
Hifron to tu už nailnul :D :D, tak já si dovolím svou vlastní zkušenost - zjištění vývojářů FF v podstatě potvrzuji, velká část problémů se stabilitou jde na vrub špatně nastavených nebo dokonce nekvalitních pamětí .
Velmi často se stává, že BIOS desky na "auto" nastaví parametry RAM tak, že deska sice nabootuje, ale stabilní ten PC není. Dost často stačí přidat k EXPO/XMP nastavení ručně Vcc, popřípadě jej o pár setinek navýšit. Velmi častým problémem jsou zdroje, které sice mají na sobě "značku," mají krásné designové kabely, ale s kvalitou napájení jsou na štíru.
A jinak co se DDR4/DDR5 týká, tak bych řekl, že s DDR5 přišla spousta problémů, které se v éře DDR4 neobjevovaly. Ona částečná ochrana ECC v DDR5 je tam hlavně proto, že txy paměti jedou na samotné hranici fyzikálních možností a chyby se tam prostě objevují častěji.
" popřípadě o pár setinek navýšit."
Mám opačnou zkušenost.
Ryzen 5000 byl stabilnější když jsem napětí na RAM o destinu voltu snížil.
Výrobci desek posílají víc napětí než je třeba.
Ano, to je druhý směr, ale ten mi pomohl snad jen jednou. Na MSI (což jsou mé "hlavní" desky pomohlo vždy přidat)
Za rok 2023 se prodalo 39 milionů základních desek.
MSI prodalo 9 milionů kusů.
Takže Vaše doporučení platí pro každého čtvrtého.
Moje doporučení snížit napětí platí pro Asus a AsRock. Takže pro každého druhého.
https://www.techspot.com/news/103928-motherboard-market-poised-sharp-recovery-year.html
Dávejte si pozor na bias pane Tynyt.
Používám v domácím počítači ECC RAM už asi 15 let (od dob DDR3), mám zkušenost jak s Intely, tak s AMD. Většina těchto počítačů má memory scrubber. Motherboardy většinou hlásí chyby v ECC RAM v logu. V případě, že je počítač používán v klidovém režimu, tj. neprobíhají transakce, kondenzátory jsou s ohledem na zátěž plné, napájecí regulátory jedou na malém výkonu, teploty jsou nízké, je chybovost malá - řekněme, že se objeví jedna chyba za měsíc. Pochopitelně čím více RAM počítač má, tím častější chyby jsou. Jakmile je ale provozován v zátěži, chybovost dramaticky narůstá. Chybovost se může objevovat i denně. To se samozřejmě bavím o provozování se standardním nastavením, ne s přetaktováním, a s kvalitním napájecím zdrojem.
Ja si na Threadripper zen1 poridil DDR4 ECC RAM a v logu nikdy zadna chyba nebyla, tak jsem dalsi PC stavel s obycejnou DDR5.
Pokud jsem kdy mel problem s RAM, tak chcipnul modul takovym stylem ze pocitac prestal bootovat
V nedávné diskuzi jsi tu přesvědčoval svým “odborným” měřením jak ECC není třeba. Prosím běž to vysvětlit i těm nýmandům z FF, oni nemají totiž fištróna jako ty.
A můžete se prosím podělit o Vaše ECC logy?
Ať si uděláme představu kolik chyb za rok pomůže ECC odhalit.
Nymandi z FF našli jen to co by našel každý MemTest86+.
Ale statistika od uživatele ECC je podstatně zajímavější.
16. 3. 2026, 13:29 editováno autorem komentáře
Mam stroj se 144GB DDR3, 18x8GB, aktualne uptime 1200 dni.
Udelal za svoji historii (12? let) 1+mnoho ECC chyb podle iLO.
Ta jedna byla opravena a nahodna. Vsechny ostatni byly zpusobeny vadnym modulem.
Rika se, ze je to radove jedna chyba tydne. U konzervativne taktovaneho serveru to ale muze byt klidne jedna chyba za deset let, rika moje zkusenost.
Ale eviduji to jen u tohohle jednoho stroje, byla to kdysi moje srdcovka (tenhle kousek).
Jinak jsem se setkal treba s vadnou L2 cache u Opteronu, na kterou prislo taky ECC.
A vtipna byla hlaska tusim Debianu, neco jako Bad ECC checksum, little confused, trying to continue. VMWare na stejnou situaci reaguje okamzitym rebootem. Predpokladam, ze to bude otazka configu jadra.
Jo a protoze jsem uz nejake problemy zpusobene vadnou pameti zazil, dvakrat jsem kvuli tomu pracoval nekolik dni v kuse a zachranoval data po silent data corruption buhvi odkud, tak chci ECC vsude. Kdyby to slo, mam ho i v chytrych hodinkach.
Takova ta tvrzeni, ze ZFS nepotrebuje ECC jsou sice hezka, ale pamet je smesne levna. Teda byvala :-D (mam nakoupeno, tak se mi to smeje...)
Kdo to nezazil, jake to je, nema tuseni...
16. 3. 2026, 18:17 editováno autorem komentáře
tak... ZFS opravdu ECC ke svému fungování nepotřebuje. Dokonce ti i bez ECC řekne, že máš poškozená data - jen to je jaksi (často) už pozdě.
Samozřejmě by bylo super mít desku s podporou ECC a odpovídající RAMky, jenže to jsme s cenou (při zachování určité modernity a nežravosti celého řešení) už docela jinde. Na doma to prostě člověk riskne.
Nemusime byt cenove jinde. AMD u lepsich modelu nez spatne nabizi prece podppru pro ECC pameti, pokud to podpori deska.
Nejake SBC s 16GB ECC pameti a AMD Pro ctyrjadrem nemusi byt scifi, jen to nikdo nebude kupovat.
Ty kontrolní součty u ZFS (nebo ReFS) přijdou na to, když se data pokazila během svého uložení na HDD nebo SSD, takže ta formulace, že to ZFS "řekne", mi nepřijde úplně vhodná. Je to vlastně ortogonální k problému ECC u pamětí a nijak s ním nepomůže. Ideálně bychom měli oboje - aby ECC paměti chránily data (přičemž teda nejdůležitější asi je hlavně vědět o tom poškození, případná oprava bit flipu už je luxus navíc) a checksumy ve filesystemu hlídaly poškození na jeho úrovni. Teoreticky jsou asi důležité o něco méně, protože HDD i SSD mají svoje vlastní ECC ochrany na úrovni hardwaru (a na lepší úrovni, než je třeba ta on package ecc v DDR5, protože když selže ECC u SSD nebo HDD při čtení sektoru, tak to zařve chybu místo aby to potichu dodalo poškozená data).
Pokud vám dělá RAM chyby, tak změní data a ta se uloží chybně na ZFS, které si k jejich pokažené verzi vesele udělá kontrolní součet a pak bude pořád tvrdit, že je všechno v pořádku, protože součet sedí. Když data nahraju do RAM a něco tam změním, tak jsem zase vydán na milost a nemilost spolehlivosti RAM a ZFS mi vůbec nepomůže, protože ochrana checksumem skončí v momentě, kdy ten soubor načtu a změním a znovu začne hrát úlohu až po zápisu z RAM do FS. Jenže to už zase můžou být poškozená data a bez ECC na operační paměti prostě nemám jistotu.
Cena ECC RAM je podobná non-ECC. Cca rok a půl zpátky jsem kupoval 2x 32GB Kingston DDR4-3200 ECC unbuffered a stály mě dohromady 5000 Kč. Horší je to s deskami, politika Intelu je, že ECC RAM podporují pouze čipsety řad Cxxx a Wxxx, což nejsou zrovna levné modely. AMD je na tom lépe, tam je podpora v každém CPU a na čipsetu nezáleží, ale protože podpora není garantovaná, je potřeba hledat vhodnou desku.
Pád aplikace je způsoben tím, že je to debilně naprogramovaný a není to redundatní proti chybám. Takto se snaží část viny špatně napsaného programu svést na uživatele a hardware.
Kdyby to byl správně napsaný software, tak mu nevadí tu a tam chybka.
Druhou věcí je programování samotné, které je jak za krále klacka, debilní až na půdu. Doufám, že AI navrhne nějaký jiný fluidní systém, který poběží milionkrát líp, než debilní psaní závorek a středníků.
"debilně naprogramovaný a není to redundatní proti chybám."
A jak se toto naprogramuje?
To každý výpočet poběží dvakrát a když se výsledky budou lišit, tak poběží 4×.
To by všechno bylo 2× pomalejší.
Jeden klasický:
Potká Intel Pentium Motorolu 68K a Motorola na něj (velmi pomalu): In-te-le... ko-lik...je..čty-ři...krát...čty-ři?
Intel (bryskně): PĚT!
Motorola: To...je...ale...špa-tně!
Intel (opět bryskně): neva, ale rychle!
:D :D :D
klasika, když ti to přepíše jedničku a nulu někde u středníku ; alt+59 to udělá alt+58 a máš z toho rovnou : dvojtečku a program se ukončí, zhavaruje, prostě konec. Na konci řádku není středník konec celé to zhavaruje.
Kdyby to bylo redundadní, tak to tam ten středník nepotřebuje, prostě tak jak ví, že za středníkem je konec by měl být nějaký jiný blbuvzdorný kód, který prostě systém ihned pozná že je na konci řádku. apod. Prostě celé tady to programování je zastaralé, já nevím jak ti to mám vysvětlit. Nějaký převod středníku na bity. To je všechno historie, trapná, hloupá blbá, stará, zbytečně složitá kravina.
Dneska by se měli už vyvíjet nějaké systémy na bázi kvantové mechaniky, chceš li, že prostě máš tisíce nějakých výsledků zaráz a výsledek bude jen nějaký průměr těch hodnot které se nejvíc opakují v největší hustotě. Prakticky už dnes ti z grafiky do monitoru netečou data, ale je to spíš jen jakési vlnění, které nemá vůbec obdélnikový tvar jedna a nula. Proto se mi líbí ty světlooptické procesory, vidím v tom budoucnost. Ale pochybuji že se bude rozhodovat o jedničkách a nulách, to bude prostě nějaké vlnění jak v optickém kabelu, které bude mít 72 druhů barev a ještě podle úhlu natočení vlnění světla rozkouskované na 360°, to si nedokážeš představit, rychlost světla x 72 x 360. Asi vůbec nechápeš o čem píšu že?
Právě že může.... když natáhneš kód aplikace do RAM, tak jak zjistíš, že je vadný? Někdy se trefí chyba do resourců, jindy přímo do instrukcí pro procesor. Přesně k tomuto účelu slouží ECC.
tynyte, tohle je přesně ten případ, kdy se “snaha cení”, ale pochybuji, že tím, komu jsi odpovídal :-D
17. 3. 2026, 12:37 editováno autorem komentáře
Rundantně běží třeba elektronické zabezpečovací zařízení na železnici. Obsahuje 2 páry technologických počítačů, ze kterých běží vždy jen jeden pár a na každém běžícím počítači běží jedna verze stejného SW ze dvou, které jsou psané dvěma týmy. Vyhodnocuje se shoda výsledku z pokynu zadávacího terminálu. Pokud dojde k nesouladu výsledků, pokyn se neprovede, 1. pár počítačů se odpojí a nastartuje se 2. a jede se opět dál, do doby dalšího nesouladu, kdy se opět prohodí. Je to notně zjednodušený popis, ale vážně to tak zhruba funguje. Nicméně je tohle řešení pro domácí použití celkem dosti nepraktické... :)
On je Papez celeho vesmiru, byva v ciernej diere v centre galaxie, a svieti si iba vtedy, ked sa Kepller nediva :P
Tak to ví každej kdo se hrabe v PC delší dobu že tak za 75% crashů může nestabilita ram. Nejhorší byly podle mě DDR3, zvlášť v době kdy se na ně přecházelo ještě se socketem 775, to bylo peklo.
DDR4 se mi zdaj celkem stabilní, jedinou neplechu mi dělalo když jsem měl chvíli u ryzenu 4 moduly, ale to se nedoporučuje nikdy.
HWinfo64 dokáže sledovať a zobrazovať WHEA errory, takže odporúčam.
Ja som 7950x3d dosť dlho ladil pokial ram išla bezchybne, ten mal mrte shitny pamäťový radič, ale 9950x3d teraz ho máš super. To vidieť aj na dĺžke memory trénovania + biosy a agesa za dva roky tiež prešli kus cesty k zlepšeniu.
Mno a potom príde napr. Mictosoft dodrbe Windows novou aktualizáciou a človek zas nechápe :D