Разрушение массива на 3ware 9650se-4lpml
Модераторы: Trinity admin`s, Free-lance moderator`s
Разрушение массива на 3ware 9650se-4lpml
Приветствую всех.
На сервере DOLBY DSS200 на базе мат.платы Supermicro X8SIE-LN4 и контроллера 3ware 9650se-4lpml через 2 месяца развалился массив RAID5 из 4 дисков.
В 3ware BIOS Manager не было ни одного массива, а напротив всех 4 дисков стояла надпись Disk Error. Система грузившаяся с этого массива естественно перестала грузиться. Пришлось заново объединять диски (те же) в массив и переустанавливать систему, благо установка и настройка системы (на базе linux) с установочного диска оказалась очень простой. Таких серверов у нас 4 и теперь как-то неспокойно на душе.
Сервера отключаются каждый вечер просто отключением питания (выключается UPS). Такому способу завершения работы персонал был обучен интеграторами-установщиками этой системы. В самой системе управления кинозалом нет кнопки/функции завершения системы как в винде, например.
Не может ли такое отключение сервера привести к разрушению массива? Просто сервер днем работал, был отключен вечером, а на следующее утро уже не грузился.
ПС:На райд-контроллере не стоит батарейка аварийного питания. Поможет ли ее установка?
На сервере DOLBY DSS200 на базе мат.платы Supermicro X8SIE-LN4 и контроллера 3ware 9650se-4lpml через 2 месяца развалился массив RAID5 из 4 дисков.
В 3ware BIOS Manager не было ни одного массива, а напротив всех 4 дисков стояла надпись Disk Error. Система грузившаяся с этого массива естественно перестала грузиться. Пришлось заново объединять диски (те же) в массив и переустанавливать систему, благо установка и настройка системы (на базе linux) с установочного диска оказалась очень простой. Таких серверов у нас 4 и теперь как-то неспокойно на душе.
Сервера отключаются каждый вечер просто отключением питания (выключается UPS). Такому способу завершения работы персонал был обучен интеграторами-установщиками этой системы. В самой системе управления кинозалом нет кнопки/функции завершения системы как в винде, например.
Не может ли такое отключение сервера привести к разрушению массива? Просто сервер днем работал, был отключен вечером, а на следующее утро уже не грузился.
ПС:На райд-контроллере не стоит батарейка аварийного питания. Поможет ли ее установка?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Разрушение массива на 3ware 9650se-4lpml
Да, если серверу тупо рубить питание, да еще постоянно, то вполне можно получить проблемы с массивом.
Батарейка в этом плане конечно крайне полезна. Вместе с выключением кэша самих дисков.
Но лучше, помимо батарейки, гасить серверы штатным образом. Например сделать скрипт, чтобы все уходили в даун одним нажатием.
Ну и интеграторы, блин. В своей области наверно спецы, но с серверами обращаться не умеют.
Батарейка в этом плане конечно крайне полезна. Вместе с выключением кэша самих дисков.
Но лучше, помимо батарейки, гасить серверы штатным образом. Например сделать скрипт, чтобы все уходили в даун одним нажатием.
Ну и интеграторы, блин. В своей области наверно спецы, но с серверами обращаться не умеют.
Re: Разрушение массива на 3ware 9650se-4lpml
Батарейку мы решили брать. Только вот интеграторы грозят, что может гарантия на сервер пропасть из-за добавления в систему этой батарейки . Надо, говорят, запрос в DOLBY сделать и узнать. Мы теперь должны запрос сделать им с нашими хотелками, а они им уже перенаправят запрос.gs писал(а):Батарейка в этом плане конечно крайне полезна. Вместе с выключением кэша самих дисков.
Пользуясь случаем хотелось бы уточнить один момент для себя. Эта батарейка что именно защищает? Я думал она защищает целостность данных, пишущихся на диски. И если жить без батарейки, я полагал, что это может привести к потере данных на массиве, но не к разрушению массива. Но после последнего происшествия были сомнения. Настройки массива (какой уровень, какие диски и другие настройки) разве не на самом контроллере хранятся в биосе на манер биоса мат.платы со своей батарейкой?
Нажатием на кнопку выключения на корпусе сервера? Скрипт в линуксе имеется ввиду? Просто хоть система и стоит на базе линукса, но доступа к консоли я на ней не заметил. Система ставится с диска "одним нажатием" - и линукс, и граф.оболочка программы ставятся автоматически. Но это скорее уже к интеграторам вопросы.Но лучше, помимо батарейки, гасить серверы штатным образом. Например сделать скрипт, чтобы все уходили в даун одним нажатием.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Разрушение массива на 3ware 9650se-4lpml
Нда уж, молодцы...
Отсутствие батарейки конечно защищает данные, а не конфиг массива. Но дело в том, что в определенных условиях отсутствие ББУ и жесткое вырубание питалова может повлечь за собой неисправимые ошибки на массиве (лечится только полной его пересборкой): http://3nity.ru/viewtopic.php?f=24&t=12433
Адаптек в таких случаях заносит сбойные блоки в свой реестр и сигнализирует админу о необходимости печальных процедур. А как на это реагирует триварь, я просто не знаю.
Да и вообще, такое постоянное изнасилование машины может повлечь за собой разновсяческие неприятные последствия. Недаром же старая истина гласит, что машина должна работать без выключений - это для нее самый благоприятный режим эксплуатации. Каждый вырубон питалова - это стресс для всего железа.
Конфиг масссива, кстати, хранится на винтах.
Выключать хотя бы кнопкой на сервере - надеюсь ACPI там настроено в ОС.
Отсутствие батарейки конечно защищает данные, а не конфиг массива. Но дело в том, что в определенных условиях отсутствие ББУ и жесткое вырубание питалова может повлечь за собой неисправимые ошибки на массиве (лечится только полной его пересборкой): http://3nity.ru/viewtopic.php?f=24&t=12433
Адаптек в таких случаях заносит сбойные блоки в свой реестр и сигнализирует админу о необходимости печальных процедур. А как на это реагирует триварь, я просто не знаю.
Да и вообще, такое постоянное изнасилование машины может повлечь за собой разновсяческие неприятные последствия. Недаром же старая истина гласит, что машина должна работать без выключений - это для нее самый благоприятный режим эксплуатации. Каждый вырубон питалова - это стресс для всего железа.
Конфиг масссива, кстати, хранится на винтах.
Выключать хотя бы кнопкой на сервере - надеюсь ACPI там настроено в ОС.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 30 гостей