Разрушение массива на 3ware 9650se-4lpml

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
kambi
Advanced member
Сообщения: 51
Зарегистрирован: 03 янв 2012, 13:36
Откуда: Москва

Разрушение массива на 3ware 9650se-4lpml

Сообщение kambi » 11 июл 2012, 15:43

Приветствую всех.
На сервере DOLBY DSS200 на базе мат.платы Supermicro X8SIE-LN4 и контроллера 3ware 9650se-4lpml через 2 месяца развалился массив RAID5 из 4 дисков.
В 3ware BIOS Manager не было ни одного массива, а напротив всех 4 дисков стояла надпись Disk Error. Система грузившаяся с этого массива естественно перестала грузиться. Пришлось заново объединять диски (те же) в массив и переустанавливать систему, благо установка и настройка системы (на базе linux) с установочного диска оказалась очень простой. Таких серверов у нас 4 и теперь как-то неспокойно на душе.
Сервера отключаются каждый вечер просто отключением питания (выключается UPS). Такому способу завершения работы персонал был обучен интеграторами-установщиками этой системы. В самой системе управления кинозалом нет кнопки/функции завершения системы как в винде, например.
Не может ли такое отключение сервера привести к разрушению массива? Просто сервер днем работал, был отключен вечером, а на следующее утро уже не грузился.

ПС:На райд-контроллере не стоит батарейка аварийного питания. Поможет ли ее установка?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Разрушение массива на 3ware 9650se-4lpml

Сообщение gs » 11 июл 2012, 16:39

Да, если серверу тупо рубить питание, да еще постоянно, то вполне можно получить проблемы с массивом.
Батарейка в этом плане конечно крайне полезна. Вместе с выключением кэша самих дисков.
Но лучше, помимо батарейки, гасить серверы штатным образом. Например сделать скрипт, чтобы все уходили в даун одним нажатием.

Ну и интеграторы, блин. В своей области наверно спецы, но с серверами обращаться не умеют.

kambi
Advanced member
Сообщения: 51
Зарегистрирован: 03 янв 2012, 13:36
Откуда: Москва

Re: Разрушение массива на 3ware 9650se-4lpml

Сообщение kambi » 11 июл 2012, 17:39

gs писал(а):Батарейка в этом плане конечно крайне полезна. Вместе с выключением кэша самих дисков.
Батарейку мы решили брать. Только вот интеграторы грозят, что может гарантия на сервер пропасть из-за добавления в систему этой батарейки :). Надо, говорят, запрос в DOLBY сделать и узнать. Мы теперь должны запрос сделать им с нашими хотелками, а они им уже перенаправят запрос.
Пользуясь случаем хотелось бы уточнить один момент для себя. Эта батарейка что именно защищает? Я думал она защищает целостность данных, пишущихся на диски. И если жить без батарейки, я полагал, что это может привести к потере данных на массиве, но не к разрушению массива. Но после последнего происшествия были сомнения. Настройки массива (какой уровень, какие диски и другие настройки) разве не на самом контроллере хранятся в биосе на манер биоса мат.платы со своей батарейкой?
Но лучше, помимо батарейки, гасить серверы штатным образом. Например сделать скрипт, чтобы все уходили в даун одним нажатием.
Нажатием на кнопку выключения на корпусе сервера? Скрипт в линуксе имеется ввиду? Просто хоть система и стоит на базе линукса, но доступа к консоли я на ней не заметил. Система ставится с диска "одним нажатием" - и линукс, и граф.оболочка программы ставятся автоматически. Но это скорее уже к интеграторам вопросы.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Разрушение массива на 3ware 9650se-4lpml

Сообщение gs » 11 июл 2012, 18:03

Нда уж, молодцы...

Отсутствие батарейки конечно защищает данные, а не конфиг массива. Но дело в том, что в определенных условиях отсутствие ББУ и жесткое вырубание питалова может повлечь за собой неисправимые ошибки на массиве (лечится только полной его пересборкой): http://3nity.ru/viewtopic.php?f=24&t=12433
Адаптек в таких случаях заносит сбойные блоки в свой реестр и сигнализирует админу о необходимости печальных процедур. А как на это реагирует триварь, я просто не знаю.
Да и вообще, такое постоянное изнасилование машины может повлечь за собой разновсяческие неприятные последствия. Недаром же старая истина гласит, что машина должна работать без выключений - это для нее самый благоприятный режим эксплуатации. Каждый вырубон питалова - это стресс для всего железа.

Конфиг масссива, кстати, хранится на винтах.


Выключать хотя бы кнопкой на сервере - надеюсь ACPI там настроено в ОС.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 8 гостей