Контроллер LSI не помечает диски как failed

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Контроллер LSI не помечает диски как failed

Сообщение dolly » 01 апр 2016, 13:07

Всем доброе время суток!

Вопрос у меня следующий. Имеется сервер БД на платформе Intel SR6850HW4, 4CPU Xeon 3.16GHz, 4GB DDR3. В качестве дисковой подсистемы используется RAID-5 из 8-ми дисков на встроенном в плату контроллере Intel/LSI. (4 Seagate Cheetah 15K.4 36Gb U320SCSI и 4 Seagate Cheetah 15K.5 73Gb U320SCSI). За последние пару лет с сервером произошли два аналогичных странных случая. Выглядело это так, как будто контроллер отправил массив в readonly. При этом ОС сообщала об ошибке файловой системы. Первый раз при перезагрузке сервера RAID bios не показал никаких ошибок на дисках. Более того - каких-либо проблем в работе ОС и в файловой системе обнаружено не было. Первоначально я предположил некий трудноформализуемый сбой контроллера, однако, чуть позже решил запустить через Web Console consistency check массива, после чего на диске 0 появилось 5 media errors. Неисправный диск я заменил. Примерно через год ситуация повторилась, только на одном из дисков в RAID bios можно было сразу увидеть 2 media errors. После этого диск был принудительно отправлен в offline и массив автоматически перешел в degraded. Отсюда вопрос - почему контроллер перестал автоматически помечать неисправные диски как Failed и можно ли как-то это исправить?
Ведь во втором случае ошибки на диске присутствовали уже сразу.

Заранее благодарен за ответы.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Контроллер LSI не помечает диски как failed

Сообщение Stranger03 » 01 апр 2016, 13:45

dolly писал(а):Отсюда вопрос - почему контроллер перестал автоматически помечать неисправные диски как Failed и можно ли как-то это исправить?
Ведь во втором случае ошибки на диске присутствовали уже сразу.
Видимо контроллер посчитал, что в таком состоянии диск еще способен отработать какое-то время.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Контроллер LSI не помечает диски как failed

Сообщение gs » 01 апр 2016, 13:50

Медиа-эррор - это бэд блоки. Для их нейтрализации (в разумных пределах) контроллер может сделать верификацию массива с восстановлением консистентности. Так что с его точки зрения диск не дохлый, а просто больной.

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Re: Контроллер LSI не помечает диски как failed

Сообщение dolly » 01 апр 2016, 14:26

gs писал(а):Медиа-эррор - это бэд блоки. Для их нейтрализации (в разумных пределах) контроллер может сделать верификацию массива с восстановлением консистентности. Так что с его точки зрения диск не дохлый, а просто больной.
Т.е. последующий за этим сбой работоспособности массива можно рассматривать как излишний "оптимизм" контроллера? Является ли такое поведение нормальным (с учетом того, что массив был переведен в read-only и данные в итоге не пострадали)?

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Контроллер LSI не помечает диски как failed

Сообщение Stranger03 » 01 апр 2016, 15:03

dolly писал(а):Т.е. последующий за этим сбой работоспособности массива можно рассматривать как излишний "оптимизм" контроллера?
Диск надо менять, только и всего.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Контроллер LSI не помечает диски как failed

Сообщение gs » 01 апр 2016, 15:09

Прошивки у Вас свежие?
Диски валидированные?
Просто в нормальной ситуации бэд блоки в небольших количествах для диска - это как простуда. Рядовое явление. С ним должен бороться регулярный консистенси чек. А то в стодисковых массивах придется слишком часто диски менять.

dolly
Power member
Сообщения: 39
Зарегистрирован: 28 ноя 2005, 20:42
Откуда: Санкт-Петербург

Re: Контроллер LSI не помечает диски как failed

Сообщение dolly » 01 апр 2016, 15:13

gs писал(а):Прошивки у Вас свежие?
Диски валидированные?
Просто в нормальной ситуации бэд блоки в небольших количествах для диска - это как простуда. Рядовое явление. С ним должен бороться регулярный консистенси чек. А то в стодисковых массивах придется слишком часто диски менять.
Прошивки последние, диски валидированные, consistency раз в неделю.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Контроллер LSI не помечает диски как failed

Сообщение gs » 01 апр 2016, 15:25

Хм, только сейчас обратил внимание на платформу :)
У пенсионера небось здоровье уже пошаливает, а вы к нему с претензиями :)

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 17 гостей