Изучаем Smart для прогнозирования сбоев жесткого диска

В предыдущем посте о времени наработки на отказ (статья "Можно ли точно спрогнозировать выход жесткого диска из строя"), мы отметили, что наиболее популярный метод прогнозирования времени жизни жесткого диска не совсем точен. Да, шумы и трения головки HDD - достаточно надежные и очевидные показатели того, что жесткий диск на грани поломки. Но это не очень актуально, скажем, если ваши жесткие диски расположены вне пределов слышимости, в удаленном центре обработки данных, на сервере.

Вообще говоря, использование метрики "среднее время наработки на отказ (MTBF)" для жестких дисков вводит в заблуждение при оценке долговечности устройств хранения данных. Время безотказной работы рассчитывается в среднем для большого количества дисков. В результате возникают неадекватно высокие, оптимистичные показатели – скажем, 1,5 миллиона часов стабильной работы - почти 200 лет. Для жестких дисков корпоративного класса это фантастические метрики. Методология хорошо звучит  (судя по описанию), но, увы, результат имеет мало общего со средней продолжительностью жизни жесткого диска в "полевых условиях".

Большинство производителей, тем не менее, также предлагают более сложные методы для прогнозирования краха HDD. В частности, многие устройства хранения информации, HDD накопители содержат в прошивке набор инструментов для самонаблюдения, анализа и отчетности (S.M.A.R.T), которые передают метрики производительности жесткого диска операционной системе. Эти данные могут быть просмотрены и проанализированы с помощью программного обеспечения, предоставленного ИТ-администраторам для более тщательного мониторинга и оценки здоровья жесткого диска.

Метрики отслеживаются Smart - называемые атрибутами - разнятся от производителя к производителю, но типичные параметры жесткого диска включают в себя такие основные метрики:

  • количество часов работы
  • время, необходимое раскрутки шпинделя
  • количество перераспределенных секторов.

Как самостоятельно проверить показатели HDD через SMART

Проверка SMART данных ваших устройств хранения данных – как правило, довольно простая процедура, доступная всем пользователям.

Можно приобрести "умное" программное обеспечение, специально разработанное для нужд жесткого диска. С помощью этого ПО вы сможете извлечь SMART показания. Однако наличие фирменного ПО для вашего жесткого диска не является обязательным условием.

Если вы используете ОС Windows, вы можете получить быстрый доступ к SMART вашего жесткого диска и атрибутам их показаний с помощью командной строки.

Проверьте ваш жесткий диск на ошибки

Конечно, если вы планируете отслеживать и анализировать данные SMART более активно, то есть более удобные графические инструменты, доступные на нескольких платформах. Одним из удачных примеров является диагностическая утилита Victoria, и если вы серьезно задумались об использовании SMART инструментов и следите за здоровьем ваших жестких дисков, то это верное решение.

Кроме того, множество других утилит для просмотра S.M.A.R.T. Так, на скриншоте вы видите программу AIDA4. Данная программа является наиболее универсальным решением для анализа системы в целом и просмотра метрик жесткого диска в частности. 

Просмотр данных S.M.A.R.T через сервисную утилиту AIDA4 (бывший Everest) на жестком диске

Достоверность считывания показаний S.M.A.R.T на жестком диске

Нам еще предстоит обсудить, являются ли SMART инструменты, на самом деле, надежным индикатором работоспособности и износа жесткого диска. Ответ – и да, и нет. В то время как некоторые SMART атрибуты полезным в предсказании ошибок на HDD, также принято считать, что система SMART не без ограничений и погрешностей учета показаний HDD.

В частности, СМАРТ не может предсказать на все 100 % рядовой сбой HDD, потому как не все причины сбоя жесткого диска предсказуемы и очевидны. В же время, те ошибки, которые возникают при регулярном механическом износе устройства, как правило, отмечаются как ненормальные показания SMART, а внезапные электронные сбои и отказ комплектующих – нет. Чтобы очертить это в перспективу, в 2007 году компания Google исследовала 100000 жестких дисков потребительского класса и обнаружила: 64 процентов отказов в течение девяти месяцев не попадает под учет SMART.

Другой фактор, который делает SMART атрибуты сами менее надежными: они изменяются от производителя к производителю, даже с точки зрения способов измерения общих атрибутов . Таким образом, жесткие диски Seagate и Western Digital устройства с эквивалентными показаниями здоровья могут дать совершенно разные показания и, в частности, процент ошибок.

В ноябре прошлого года, разработчик облачного сервиса для резервного копирования, Backblaze, опубликовал увлекательное исследование касательно различных SMART атрибутов. На основании показаний почти 40000 жестких дисков, хранящих 100 петабайт данных клиентов, они пришли к выводу, что из 70 доступных атрибутов только пять были верными индикаторами сбоя жесткого диска.

В заключение

В действительности, SMART атрибуты HDD могут предсказать некоторые типы отказов для жестких дисков, однако они не могут обеспечить на 100 процентов точный метод диагностики жесткого диска. Как мы уже отмечали раньше, к сожалению, не все сбои жестких дисков предсказуемы и поддаются мониторингу.

Таким образом, владельцы любых жестких дисков никогда не должны полностью полагаться ТОЛЬКО на SMART - или любую другую упрощенную систему диагностики. Все равно это не поможет полностью предотвратить потерю данных. Природа электромеханических устройств означает, что всегда лучше сочетать различные методы защиты: SMART, резервное копирование и восстановление данных.

См. раздел "Резервное копирование"

по материалам блога http://thedatarecoveryblog.com/

Компьютерная помощь: задайте свой вопрос

Укажите email, на который я смогу выслать ответ на ваш вопрос

Советуем загрузить эти мобильные приложения: