Контроллер LSI не помечает диски как failed
Модераторы: Trinity admin`s, Free-lance moderator`s
Контроллер LSI не помечает диски как failed
Всем доброе время суток!
Вопрос у меня следующий. Имеется сервер БД на платформе Intel SR6850HW4, 4CPU Xeon 3.16GHz, 4GB DDR3. В качестве дисковой подсистемы используется RAID-5 из 8-ми дисков на встроенном в плату контроллере Intel/LSI. (4 Seagate Cheetah 15K.4 36Gb U320SCSI и 4 Seagate Cheetah 15K.5 73Gb U320SCSI). За последние пару лет с сервером произошли два аналогичных странных случая. Выглядело это так, как будто контроллер отправил массив в readonly. При этом ОС сообщала об ошибке файловой системы. Первый раз при перезагрузке сервера RAID bios не показал никаких ошибок на дисках. Более того - каких-либо проблем в работе ОС и в файловой системе обнаружено не было. Первоначально я предположил некий трудноформализуемый сбой контроллера, однако, чуть позже решил запустить через Web Console consistency check массива, после чего на диске 0 появилось 5 media errors. Неисправный диск я заменил. Примерно через год ситуация повторилась, только на одном из дисков в RAID bios можно было сразу увидеть 2 media errors. После этого диск был принудительно отправлен в offline и массив автоматически перешел в degraded. Отсюда вопрос - почему контроллер перестал автоматически помечать неисправные диски как Failed и можно ли как-то это исправить?
Ведь во втором случае ошибки на диске присутствовали уже сразу.
Заранее благодарен за ответы.
Вопрос у меня следующий. Имеется сервер БД на платформе Intel SR6850HW4, 4CPU Xeon 3.16GHz, 4GB DDR3. В качестве дисковой подсистемы используется RAID-5 из 8-ми дисков на встроенном в плату контроллере Intel/LSI. (4 Seagate Cheetah 15K.4 36Gb U320SCSI и 4 Seagate Cheetah 15K.5 73Gb U320SCSI). За последние пару лет с сервером произошли два аналогичных странных случая. Выглядело это так, как будто контроллер отправил массив в readonly. При этом ОС сообщала об ошибке файловой системы. Первый раз при перезагрузке сервера RAID bios не показал никаких ошибок на дисках. Более того - каких-либо проблем в работе ОС и в файловой системе обнаружено не было. Первоначально я предположил некий трудноформализуемый сбой контроллера, однако, чуть позже решил запустить через Web Console consistency check массива, после чего на диске 0 появилось 5 media errors. Неисправный диск я заменил. Примерно через год ситуация повторилась, только на одном из дисков в RAID bios можно было сразу увидеть 2 media errors. После этого диск был принудительно отправлен в offline и массив автоматически перешел в degraded. Отсюда вопрос - почему контроллер перестал автоматически помечать неисправные диски как Failed и можно ли как-то это исправить?
Ведь во втором случае ошибки на диске присутствовали уже сразу.
Заранее благодарен за ответы.
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Контроллер LSI не помечает диски как failed
Видимо контроллер посчитал, что в таком состоянии диск еще способен отработать какое-то время.dolly писал(а):Отсюда вопрос - почему контроллер перестал автоматически помечать неисправные диски как Failed и можно ли как-то это исправить?
Ведь во втором случае ошибки на диске присутствовали уже сразу.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Контроллер LSI не помечает диски как failed
Медиа-эррор - это бэд блоки. Для их нейтрализации (в разумных пределах) контроллер может сделать верификацию массива с восстановлением консистентности. Так что с его точки зрения диск не дохлый, а просто больной.
Re: Контроллер LSI не помечает диски как failed
Т.е. последующий за этим сбой работоспособности массива можно рассматривать как излишний "оптимизм" контроллера? Является ли такое поведение нормальным (с учетом того, что массив был переведен в read-only и данные в итоге не пострадали)?gs писал(а):Медиа-эррор - это бэд блоки. Для их нейтрализации (в разумных пределах) контроллер может сделать верификацию массива с восстановлением консистентности. Так что с его точки зрения диск не дохлый, а просто больной.
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Контроллер LSI не помечает диски как failed
Диск надо менять, только и всего.dolly писал(а):Т.е. последующий за этим сбой работоспособности массива можно рассматривать как излишний "оптимизм" контроллера?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Контроллер LSI не помечает диски как failed
Прошивки у Вас свежие?
Диски валидированные?
Просто в нормальной ситуации бэд блоки в небольших количествах для диска - это как простуда. Рядовое явление. С ним должен бороться регулярный консистенси чек. А то в стодисковых массивах придется слишком часто диски менять.
Диски валидированные?
Просто в нормальной ситуации бэд блоки в небольших количествах для диска - это как простуда. Рядовое явление. С ним должен бороться регулярный консистенси чек. А то в стодисковых массивах придется слишком часто диски менять.
Re: Контроллер LSI не помечает диски как failed
Прошивки последние, диски валидированные, consistency раз в неделю.gs писал(а):Прошивки у Вас свежие?
Диски валидированные?
Просто в нормальной ситуации бэд блоки в небольших количествах для диска - это как простуда. Рядовое явление. С ним должен бороться регулярный консистенси чек. А то в стодисковых массивах придется слишком часто диски менять.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Контроллер LSI не помечает диски как failed
Хм, только сейчас обратил внимание на платформу
У пенсионера небось здоровье уже пошаливает, а вы к нему с претензиями
У пенсионера небось здоровье уже пошаливает, а вы к нему с претензиями
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 17 гостей