[uanog] refurbished hdd

Andrew Biryukov amb at amb.kiev.ua
Sun Jan 5 22:18:36 EET 2020


Всем привет!

Всех с Новым Годом!


У меня накопился некоторый опыт возни с массивами и винтами. Вот спешу 
поделится.

У меня дома два массива    ZFS raidz2, один на 8 шпинделей, другой на 12.

Ну и на работе тоже ZFS массивов хватает, много и разных.

Домой я винты покупаю что подешевле (жаба давит денег много платить) а 
на работе я покупаю

винты корпоративного класса (что бы мне не звонили бы на мобилку когда я 
в отпуске на рыбалке посередине озера с удочкой и флягой коньяка)


Причины от которых винты умирают в порядке как у меня встречались.

1. Напряжение питания.

Решил у меня как-то помереть блок питания, но не сразу с дымком а 
постепенно.

Для начала он решил что выдавать +5V это слишком, и решил давать +4.75V

Через три недели поменяв пятый винт (!!) я понял что у меня что-то 
происходит и это все не просто так )))

Блок питания конечно сменил на приличный с запасом по мощности, но еще 
три винта умерли  в течении месяца после этого.

Напряжение на блоке питания нужно время от времени проверять. Частота 
проверок зависит от соотношения вашей параноидальности

и безалаберности. Рекомендую мерять при каждом обнаруженном винте под 
замену или минимум раз в год.


2. Перегрев.

Дома, в коробке с 8 винтами умирает копеечный вентилятор. Через полдня 
винты в этой коробочке разогреваются до 80 градусов.

А я в это время в отпуске на озере с друзьями, спиннингом и флягой коньяка.

smartd пишет письма, но я в отпуске почту обычно не читаю.

И вот хоть бы кто нибуть позвонил бы мне на мобилку ??? Нет, блин, всем 
пофиг чужое горе )))

Когда вернулся то винты в руку взять нельзя было, обжигало.

Причем что интересно, там были WD NAS 3TB и они совершенно нормально это 
перенесли.

С тех пор прошло несколько лет и все эти винты до сих пор живут.

А WD GREEN 2TB из той же коробочки вскорости сдохли.


3. Неправильный выбор винтов.

Увидел я как-то раз на Boxing day что продаются Seagate Constellation 
ES.2 3TB  по цене как минимум вдвое дешевле самых дешевых других винтов.

С перепугу купил 4 штуки. Жалел страшно ((

Они шумят и греются. Они бы очень хорошо пригодились бы на работе в 
серверной, но дома были не нужны.

Я им не мог обеспечить нормальное охлаждение, на них smartd постоянно 
жаловался что у них порядка 50-55 градусов цельсия температура.

Из четырех за год три сдохло. Думаю что от перегрева. Для оставшегося 
нашел место где его нормально обдувает и он не греется.

С тех пор для дома я винты на 7200 оборотов не покупаю. Предпочитаю 
которые на  5400 или 5800.


4. И только на 4 месте у нас старость.

По моей статистике у меня винты если не сдохли от моей безалаберности 
(потому что пункты 1,2,3 это именно моя безалаберность) то живут примерно до

70000 часов работы. Пока никто не пережил 80000, но некоторые подбираются.


5. брак производителя.

все купленные винчестеры нужно немедленно поставить в работу и погонять 
с недельку.

Винт, он или сразу умирает или живет долго и счастливо )))

За последние полгода я покупал 6 штук  Seagate Barracuda Compute 8TB, из 
них 2 сдохли через несколько дней работы.

Хорошо что на amazon удобно и быстры все меняют не задавая никаких вопросов.


Это все было дома. А на работе у меня лет 10 назад были куплены порядка 
50 винтов

Constellation ES.2 ST33000650SS SAS 3TB и никаких проблем.

За 10 лет умерло только два винта.

Но там даже близко нет никаких проблем с питанием или перегревом.


Ну и в заключение пару слов о диагностике. Как проверить винт скорее жив 
или уже нет ?

Я рекомендую https://www.smartmontools.org. Замечательный набор утилиток 
позволяющий быстро и четко разобраться

жив винт или увы и ах )))) Во FreeBSD портах это 
/usr/ports/sysutils/smartmontools

Как ставить и пользоваться я подробно рассказывать не буду, тут все 
грамотные и читать умеют.

Только пару основных хинтов.

В /usr/local/etc/smartd.conf прописываем следующую строку:

DEVICESCAN -a -W 4,40,48 -S on -s (S/../.././01|L/../../3/04) -m root

Это означает следующее:

1. при превышении температуры винта 48 градусов жаловаться на root

2. запускать selftest короткий каждую ночь, и длинный раз в неделю. Если 
selftest failed то жаловаться на root.


Так вот на длинный selftest я и ориентируюсь. Если он failed то винт под 
замену.

Отдельно long selftest запускается вот так:

smartctl -t long /dev/ada0

идет от нескольких часов до пол дня в зависимости от размера винта.

Смотреть результаты так:

smartctl -d atacam -a ada0 > ada0.smart

параметр -d зависит от дискового контроллера, может быть sat  или scsi

В полученном *.smart файле смотрим какой status у:

# 1  Extended offline

Если там "Completed without error" то все хорошо (здесь и сейчас) а если 
там error то винт в металлолом.

Так можно легко убедиться винт жив или нет, но к сожалению никак нельзя 
догадаться отчего винт сдох (((


И последнее: винт можно разобрать, добыть оттуда мощный магнит (ценная 
вещь, в хозяйстве пригодится)

а также вытащить магнитную пластину и подарить какой нибуть девушке.

Девушка это воспринимает как зеркальце и приходит в полный восторг )))


---

Andrew Biryukov

amb at amb.kiev.ua




More information about the uanog mailing list