LSI U320 RAID5 -1диск

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

DIV72
Junior member
Сообщения: 11
Зарегистрирован: 04 окт 2004, 10:34

LSI U320 RAID5 -1диск

Сообщение DIV72 » 04 окт 2004, 10:42

Контроллер LSI U320, RAID5 - один диск ушел в filed(всего 5). Как долго система продержится до восстановления нормальной конфигурации, пока разбираюсь сс слетевшим диском?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 04 окт 2004, 10:53

Система проживет ровно до умирания еще одного диска. После этого восстановить уже ничего не получится.

DIV72
Junior member
Сообщения: 11
Зарегистрирован: 04 окт 2004, 10:34

Сообщение DIV72 » 04 окт 2004, 11:03

Немного выяснил ситуацию: была демонстрация отказоустойчивости и "крутизны" сервера, один диск из пяти был вынут и через промежуток 2-3 минуты водружен на место, система начала rebuild, но потом написал "REBUILD ERROR" и диск стал "FILED". До этого диск работал нормально. Как с минимальным риском запустить винт? Перегружать или останавливать сервер нет возможности.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 04 окт 2004, 11:15

Проверить диск утилитой производителя (для ibm - dft, для seagate - seatool enterprise) на обычном scsi-контроллере. Если с диском все нормально, то повторить rebuild.

DIV72
Junior member
Сообщения: 11
Зарегистрирован: 04 окт 2004, 10:34

Сообщение DIV72 » 05 окт 2004, 08:53

Диск проверил - ошибок и бэдов нет. Отформатировал, вставил, запустил REDUILD, пишет: ERROR ON REBUILDING DEVICE. То же, что и
до проверки, диск FAILED. В чем проблема?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 окт 2004, 11:48

Проверьте и остальные винты - возможно там тоже бэды есть.

DIV72
Junior member
Сообщения: 11
Зарегистрирован: 04 окт 2004, 10:34

Сообщение DIV72 » 05 окт 2004, 12:05

В том-то и дело, что остальные нормальные. А может это быть из-за плохого контакта в корзине? Что если его переставить на другое место? Он стоит 0(т.е. первым из пяти) диском, а в корзина на семь.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 окт 2004, 12:12

А Вы их проверяли утилитой вендора? То, что контроллер считает их исправными еще ничего не значит.
Хотя корзина конечно тоже может быть. Но тогда нельзя будет просто так ребилд запустить - придется этот винт назначить спаре и ребилд сам пойдет.

DIV72
Junior member
Сообщения: 11
Зарегистрирован: 04 окт 2004, 10:34

Сообщение DIV72 » 05 окт 2004, 12:29

Сейчас в логах накопал это:
Rebuild Started on CHNL 1 TARG 0. - Tue Oct 05 10:51:36 2004
Notify message : DRIVE STATE changed in Ch 1 ID 0 to FAILED - Tue Oct 05 11:13:38 2004
Error on Rebuilding CHNL 1 TARG 0 - Tue Oct 05 11:13:38 2004
NOTIFY:Check Condition on Ch 1 ID 1 with the following sense key - Tue Oct 05 11:13:38 2004
f0 00 03 01 28 77 17
0a 0a a5 2c 1f 11 00
Что сие может означать?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 окт 2004, 12:52

Ругается на диск ID1.

DIV72
Junior member
Сообщения: 11
Зарегистрирован: 04 окт 2004, 10:34

Сообщение DIV72 » 05 окт 2004, 14:08

Что на ID1 понятно. Непонятна фраза:"Check Condition on Ch 1 ID 1 with the following sense key - Tue Oct 05 11:13:38 2004
f0 00 03 01 28 77 17
0a 0a a5 2c 1f 11 00"
"Проверьте состояние на Ch 1 ID 1 следуя ключу f0 00 03 01 28 77 17
0a 0a a5 2c 1f 11 00" Что имеется в виду?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 окт 2004, 14:29

Я честно говоря не знаю кодов ошибки - это надо очень глубоко рыть или запрашивать вендора.
Но в приземленном плане это означает, что надо разбираться с этим адресом, т.е. винтом или слотом корзины.
Моя рекомендация - отстегнуть кабель от рэйда, привесить его на простой скази адаптер и прогнать утилиту производителя дисков (неразрушающие тесты есс-но). Она-то все и скажет. Весьма вероятно, что на этом винте есть бэды.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 окт 2004, 14:31

Не "следуя", а "со следующим кодом ошибки" :)

DIV72
Junior member
Сообщения: 11
Зарегистрирован: 04 окт 2004, 10:34

Сообщение DIV72 » 05 окт 2004, 14:48

Sorry за перевод, не верно понял.
Касаемо проблемы: насколько я понял исправить "на лету" без остановки сервера не получится. И как быть, если ID1 окажется битым, а ID0 вне массива? Заново пересобирать массив?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 окт 2004, 14:54

Если так, то это очень плохо. Правильный путь в такой ситуации - бэкап, формат или замена дохлых и полная переделка массива. Другими путями вряд ли что получится - ребилд просто не пройдет.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 22 гостя