RAID 5 (5 дисков) HP Smart Array P400

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
cetacea
Junior member
Сообщения: 4
Зарегистрирован: 09 окт 2011, 01:01
Откуда: Москва

RAID 5 (5 дисков) HP Smart Array P400

Сообщение cetacea » 09 окт 2011, 01:04

Оборудование: HP Proliant ML350 G5, контроллер HP Smart Array P400, диски SAS по 300 Гб 15k rpm (seagate), куплено все летом 2008 года. В корзине 5 дисков в массиве типа 5, 6-й диск (SATA, 1 Тб) сам по себе.

В среду (05.10.2011) утром сервер оказался в нерабочем состоянии, причем перезагружались и остальные 2 сервера, из чего я сделал вывод, что ночью снова надолго отключали электричество, и ups-ы отрубали серваки.
При загрузке на стадии инициализации raid-контроллера была ошибка
1779 - Slot 6 Drive Array - Replacement drive(s) detected OR previosly failed drive(s)  now appear to be operational:
Port 1I: Box 1:Bays 1,3
Logical drive(s) disabled due to possible data loss.
Press F1 to continue with logical drive(s) disabled
Press F2 to accept data loss and to re-enabled logical drives
Покумекав, я решился нажать F2, и система (Win 2003) успешно загрузилась.
Первый раз я решил, что это случайный глюк...

Ситуация повторилась на следующий день. Тогда я заказал винты на замену, понадеявшись, что до выходных сервер протянет. Ситуация повторилась еще раза 3-4, при этом между сбоями система нормально работала (на сервере висит AD, DNS, лежат общие файлы и базы 1с тоже в файловом виде). В это время слил бэкапы на другой сервер. К сожалению, не сделал образ самой системы, т.к. не хотел дополнительно вырубать сервер... В общем, суперкритичной ситуация не является, если не считать потерянного времени на восстановление Win, AD и, скорее всего, изменений в файлах и 1с за 1-2 дня.
В пятницу привезли новые диски, SEAGATE Constellation ES 1Тб, SAS, 7200об/мин [st1000nm0001] - решил, что 7200 rpm вполне хватит, т.к. пользователей немного. Ну и я начал пробовать...
За эти сутки положительных результатов не добился, кроме разве того, что загрузился с CD и через Acronis сделал образ диска C.
Периодически отваливаются диски 1 (часто),3 (очень часто) и 5 (редко). При этом после перезагрузки все диски могут гореть зеленым. В один момент я заменил диск 3 на новый, чтобы контроллер взял его в работу, но, кажется, этого не произошло.
При загрузке нередко вылезает описанная ошибка 1779 или
1789 "Check Cables or replace the following drive(s): Port 1I:Box 1:Bay 1"
Когда через F8 заходишь в настройки контроллера, почти всегда статус массива и дисков ОК.

Вопросы...
Как правильно поступить дальше, с минимальными потерями времени и информации?
Каковы возможные причины выхода сразу нескольких дисков из строя?
Надо отметить, что за последние полтора года, после переезда в новое помещение, в серверной часто были проблемы с охлаждением, и сервер не раз автоматически вырубался из-за перегрева. Сейчас ситуация улучшилась, но постоянных 18 град. там все равно не бывает, всегда выше, примерно 23 град.
Может ли быть, что дело все-таки не в дисках, а в контроллере или в корзине?
Ну и какие еще мысли по теме будут...

Понимаю, что в субботу ночью вряд ли тут отпишутся сто человек, но вдруг хоть кто-то :-)

cetacea
Junior member
Сообщения: 4
Зарегистрирован: 09 окт 2011, 01:01
Откуда: Москва

Re: RAID 5 (5 дисков) HP Smart Array P400

Сообщение cetacea » 12 окт 2011, 09:03

ну, на восстановление старого массива можно уже забить, спасибо 40-ка читателям, которые зашли в топик :P

тем не менее, кроме кучи проблем с приведением AD в рабочий вид на оставшемся контроллере домена, остались проблемы и с этим сервером.
Я поставил 5 новых винтов, сделал на 4-х из них новый RAID 5-го уровня, один диск пометил как "spare". Установил Win 2008, ввел в домен, начал потихоньку вытаскивать данные из архивов...
Но за 2 дня он уже 2 раза внезапно перезагружался и загрузка снова останавливалась на инициализации дисков raid-контроллера с той же ошибкой 1779, первый раз он перечислил все диски, сейчас - только 3 из них. Снова жму F2 и все нормально грузится. При этом зашел в настройки контроллера - статус массива ОК, статус всех дисков в нем - ОК.

Что же это? Все-таки, заглючил сам контроллер изначально, а не диски? Или что-то с материнкой случилось? Как проверить, потестировать?
Сервер уже не на гарантии.

Аватара пользователя
diz
Advanced member
Сообщения: 1189
Зарегистрирован: 12 янв 2009, 12:09
Откуда: Пермь

Re: RAID 5 (5 дисков) HP Smart Array P400

Сообщение diz » 12 окт 2011, 10:59

Может виноваты левые диски, а может контроллер умирает. Все-равно комплектуху придется менять, надо было покупать карепак.

cetacea
Junior member
Сообщения: 4
Зарегистрирован: 09 окт 2011, 01:01
Откуда: Москва

Re: RAID 5 (5 дисков) HP Smart Array P400

Сообщение cetacea » 13 окт 2011, 16:44

В суппорте HP сказали сделать следующее:
1) Обновить прошивки всех железок на сервере, скачав образ волшебного диска.
2) Искать проблему в железе:
- заменить плату кэша контроллера
- заменить контроллер целиком
- заменить корзину дисков (я это первым делом хотел сделать).

cetacea
Junior member
Сообщения: 4
Зарегистрирован: 09 окт 2011, 01:01
Откуда: Москва

Re: RAID 5 (5 дисков) HP Smart Array P400

Сообщение cetacea » 30 дек 2011, 13:11

Таки дело в корзине оказалось, как первоначально и предполагалось.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 24 гостя