Otázka čitateľa: Rád by som sa opýtal, ako spoznám „odchádzajúci“ disk a či môže zle fungujúci zdroj počítača zapríčiniť jeho poruchu (alebo poruchu iného hardvéru). Ide mi o to, že na mojom notebooku som musel vymieňať poškodený napájací adaptér a od tej doby mám pocit, že HDD už „neťahá“ tak, ako by mal (seká). Myslím si, že začal asi aj odoberať viac elektrickej energie, pretože notebook mi zrazu už výrazne menej vydrží na batériu. Nainštaloval som si utilitu CrystalDiskInfo, aby som zistil podrobnejšie informácie o jeho stave a všimol som si, že jednotlivé kolónky obsahujú značný počet chýb za hraničnými hodnotami. Je už disk zrelý na výmenu? Ako vlastne spoznám, že disk už zanedlho celkom zlyhá?

Poškodenie hardvéru zle fungujúcim napájacím zdrojom/adaptérom je možné. Obvykle však ide o kompletné vyradenie z prevádzky, pri ktorom sa skrátka „spália“ rôzne súčiastky základnej dosky, grafickej karty či iného hardvéru, ktorý následne celkom prestane fungovať. Nejakej zmeny správania komponentov, ako napríklad toho, že disk zrazu už odoberá viac energie ako predtým, sa nie je treba obávať.

Porucha pevného disku, pri ktorom dôjde k jeho úplnému vyradeniu z prevádzky, môže nastať bez akýchkoľvek signálov blížiaceho sa zlyhania. Jedného dňa sa skrátka disk nespustí, aj napriek tomu, že ešte deň predtým a pokojne aj celé roky bez problémov fungoval.

Z tohto dôvodu je nutné všetky dáta, o ktoré nechcete prísť, držať zálohované na dvoch rôznych fyzických nosičoch (iný HDD, optické médiá, USB kľúče, cloudové úložisko a podobne). Pri zlyhaní jedného úložiska je tak možná jeho výmena a opätovné zdvojenie dát z existujúcej zálohy.

Fatálne zlyhanie však nie je vždy náhle (spôsobené zvyčajne poruchou elektroniky v podobe radiča či iných čipov na jeho vlastnej doske plošných spojov) a občas dôjde aj k poruchám súvisiacim s opotrebovaním a postupným zlyhávaním niektorých mechanických častí alebo materiálov.

Tieto prejavy sa dajú nazvať ako „výpadky“, pričom sú pomerne typické a obvykle rozpoznateľné sluchom. Patrí medzi ne napríklad náhly zvuk roztáčania disku, ktoré sa udeje napriek tomu, že s diskom neustále pracujete (nezamieňať s prebudením automaticky uspatého disku pri niekoľkominútovej nečinnosti). Častejším prejavom je však hlasné cvakanie, ktoré pripomína silné udieranie ceruzky do stola (nezamieňať s obvyklým tichým „krochkaním“ a „pradením“, čo sú normálne prejavy práce diskového ramena).

Objavenie týchto zvukových prejavov považujte za šťastie v nešťastí. Disk je síce nadobro poškodený a je treba ho urýchlene vymeniť, avšak nedošlo k jeho okamžitému definitívnemu zlyhaniu. Máte teda čas na skopírovanie nezazálohovaných dát a dokonca je často možné vykonať skoro kompletné klonovanie jeho obsahu na nový hardvér, bez nutnosti inštalácie operačného systému (v prípade, že je to systémový disk).

Na úrovni softvéru sa chyby disku obvykle prejavia tak, že pri kopírovaní súboru alebo jeho otváraní počítač výrazne zatuhne (obvykle nejde označiť ani otvoriť iný súbor a je treba počkať) a kopírovanie sa často končí chybovým hlásením. Typicky sa zobrazí chyba: cyklická redudantná kontrola dát.

Ak sa to stane prvý raz, je vhodné spustiť kompletnú kontrolu disku, vrátane skenu povrchu, čo vyvoláte príkazom CHKDSK X: /R, zadaným do príkazového riadka. Písmeno X je potrebné nahradiť za písmeno jednotky inkriminovanej partície (teda napríklad C). Pri kontrole dôjde k odhaleniu chybných sektorov, ktoré sa vyradia a prestanú používať. Ak k takémuto niečomu dôjde, je vhodné disk skontrolovať o pár dní znova a sledovať, či chybné sektory nepribúdajú. Ak áno, po takej krátkej dobe to obvykle indikuje blížiace sa zlyhanie.

Pre možné predpovedanie fatálneho zlyhania pevného disku sa používa S.M.A.R.T., čo je skratka pre samomonitorovaciu, analytickú a oznamovaciu technológiu (Self-Monitoring, Analysis, and Reporting Technology) všetkých pevných diskov. Práve tieto údaje číta z diskov program CrystalDiskInfo, či iná obdobná aplikácia. Tieto programy samotné hodnoty nemerajú, alebo iba čítajú hotovú štatistiku, ktorú si samotné disky sami zaznamenali.

Pre bežného používateľa sú žiaľ tieto dáta obvykle bezcenné, pretože zaznamenávajú len súhrn histórie. Disk môže reportovať napríklad 100 zlyhaní čítania, ale vy nemáte ako zistiť, či si v priemere zaznamenával tri chyby za mesiac (a sú pre neho teda obvyklé), alebo ku všetkým chybám došlo iba včera a za dva roky predtým žiadne chyby nezaznamenal.

SMART informácia je cenná napríklad v rámci dátových centier, kde si správcovia sťahujú SMART výsledky jednotlivých diskov denne a môžu sledovať nebezpečný trend posledných dní. Pohľad na jednorazový report je skrátka obvykle bezcenný, pretože len málokedy vám oznámi niečo, čo už zo správanie disku ako takého neviete.

Predpovedanie zlyhania disku na základe SMART dát je neľahké a je to hra so štatistikou, ktorá sa obvykle praktikuje na tisícoch či dokonca státisícoch monitorovaných HDD. Firmy ako Google alebo napríklad cloudový poskytovateľ Backblaze reportujú, že najväčším indikátorom prichádzajúceho zlyhania býva náhly nárast SMART atribútu 0xC6 (tiež označovaný číslom 198).

Ide o reportovaný počet neopraviteľných sektorov. Takéto disky majú podľa štúdií až 39-krát väčšiu šancu zlyhania, než HDD, ktoré toto správanie nezaznamenali. Medzi ďalšie dôležité atribúty, na ktorých sa zaznamenala korelácia s nárastom pravdepodobnosti zlyhania, sú 0xC4 (196) a 0x05 (5), súvisiace s realokáciou sektorov a takisto atribút 0xC5 (197), ktorý reportuje počet podozrivých sektorov.

Treba ale povedať, že sledovanie týchto parametrov SMART má limitovanú užitočnosť. V rôznych štúdiách sa ukazuje, že viac ako 50 % zlyhaných diskov žiadne podozrivé správanie v rámci SMART reportu vopred nevykazovalo. Na druhú stranu, ak dochádza k rýchlemu nárastu chybných sektorov a vďaka reportu parametru 0xC6 to viete, je to možné chápať ako indikáciu blízkeho zlyhania a v tomto je teda SMART report užitočný.

Z poslaného obrázka vyzerá váš disk normálne, i keď pravdaže chýb pri čítaní je už dosť (Ide o položku ID 01). Skutočná hodnota nameraná na vašom disku je v stĺpci RAW, avšak žiaľ iba v hexadecimálnej sústave (môžete použiť on-line prevodník z hex do decimálnej sústavy).

Počet zaznamenaných chýb pri čítaní počas celého doterajšieho života disku je 48 704 (hexa BE40) a pri zápise 5 571 (hexa 15C3). Nič hrozivé. Hlavne pri notebookoch môže občasnú chybu pri čítaní spôsobiť nečakaný otras, ktorý mierne posunie čítaciu hlavu. Dochádza k tomu napríklad pri používaní vo vlaku, alebo skrátka pri agresívnom prenášaní počas prevádzky. Keďže disk čítanie v zlomkoch sekundy zopakuje a všetko dopadne správne, všetko sa udeje bez toho, aby ste si to všimli.

Najviac vypovedajúce položky v podobe C5 (počet podozrivých sektorov) a C7 (neopraviteľných sektorov) majú nulovú hodnotu. Rovnako sa váš disk ani nikdy nemusel pokúšať opakovane roztočiť, takže prvý pokus vždy dopadol dobre (0A). Stav vášho disku je teda programom oprávnene označený ako „Dobrý“.

Značky:

František Urban

František Urban
Zameriavam sa najmä na prehľadové a analytické články z oblasti najrôznejších technológií a ich vývoja. Nájdete ma takisto pri diagnostike HW a SW problémov.