В вашем браузере включен плагин блокировки рекламы: Мы заботимся о своих клиентах и показываем только ту информацию, которая по нашему мнению может Вас заинтересовать. Можете смело отключать блокировку рекламы.
Поломалось, посыпалось, не работает...
Модераторы: Trinity admin`s, Free-lance moderator`s
-
DIV72
- Junior member
- Сообщения: 11
- Зарегистрирован: 04 окт 2004, 10:34
Сообщение
DIV72 » 04 окт 2004, 10:42
Контроллер LSI U320, RAID5 - один диск ушел в filed(всего 5). Как долго система продержится до восстановления нормальной конфигурации, пока разбираюсь сс слетевшим диском?
-
exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
-
Контактная информация:
Сообщение
exLH » 04 окт 2004, 10:53
Система проживет ровно до умирания еще одного диска. После этого восстановить уже ничего не получится.
-
DIV72
- Junior member
- Сообщения: 11
- Зарегистрирован: 04 окт 2004, 10:34
Сообщение
DIV72 » 04 окт 2004, 11:03
Немного выяснил ситуацию: была демонстрация отказоустойчивости и "крутизны" сервера, один диск из пяти был вынут и через промежуток 2-3 минуты водружен на место, система начала rebuild, но потом написал "REBUILD ERROR" и диск стал "FILED". До этого диск работал нормально. Как с минимальным риском запустить винт? Перегружать или останавливать сервер нет возможности.
-
exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
-
Контактная информация:
Сообщение
exLH » 04 окт 2004, 11:15
Проверить диск утилитой производителя (для ibm - dft, для seagate - seatool enterprise) на обычном scsi-контроллере. Если с диском все нормально, то повторить rebuild.
-
DIV72
- Junior member
- Сообщения: 11
- Зарегистрирован: 04 окт 2004, 10:34
Сообщение
DIV72 » 05 окт 2004, 08:53
Диск проверил - ошибок и бэдов нет. Отформатировал, вставил, запустил REDUILD, пишет: ERROR ON REBUILDING DEVICE. То же, что и
до проверки, диск FAILED. В чем проблема?
-
gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
-
Контактная информация:
Сообщение
gs » 05 окт 2004, 11:48
Проверьте и остальные винты - возможно там тоже бэды есть.
-
DIV72
- Junior member
- Сообщения: 11
- Зарегистрирован: 04 окт 2004, 10:34
Сообщение
DIV72 » 05 окт 2004, 12:05
В том-то и дело, что остальные нормальные. А может это быть из-за плохого контакта в корзине? Что если его переставить на другое место? Он стоит 0(т.е. первым из пяти) диском, а в корзина на семь.
-
gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
-
Контактная информация:
Сообщение
gs » 05 окт 2004, 12:12
А Вы их проверяли утилитой вендора? То, что контроллер считает их исправными еще ничего не значит.
Хотя корзина конечно тоже может быть. Но тогда нельзя будет просто так ребилд запустить - придется этот винт назначить спаре и ребилд сам пойдет.
-
DIV72
- Junior member
- Сообщения: 11
- Зарегистрирован: 04 окт 2004, 10:34
Сообщение
DIV72 » 05 окт 2004, 12:29
Сейчас в логах накопал это:
Rebuild Started on CHNL 1 TARG 0. - Tue Oct 05 10:51:36 2004
Notify message : DRIVE STATE changed in Ch 1 ID 0 to FAILED - Tue Oct 05 11:13:38 2004
Error on Rebuilding CHNL 1 TARG 0 - Tue Oct 05 11:13:38 2004
NOTIFY:Check Condition on Ch 1 ID 1 with the following sense key - Tue Oct 05 11:13:38 2004
f0 00 03 01 28 77 17
0a 0a a5 2c 1f 11 00
Что сие может означать?
-
gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
-
Контактная информация:
Сообщение
gs » 05 окт 2004, 12:52
Ругается на диск ID1.
-
DIV72
- Junior member
- Сообщения: 11
- Зарегистрирован: 04 окт 2004, 10:34
Сообщение
DIV72 » 05 окт 2004, 14:08
Что на ID1 понятно. Непонятна фраза:"Check Condition on Ch 1 ID 1 with the following sense key - Tue Oct 05 11:13:38 2004
f0 00 03 01 28 77 17
0a 0a a5 2c 1f 11 00"
"Проверьте состояние на Ch 1 ID 1 следуя ключу f0 00 03 01 28 77 17
0a 0a a5 2c 1f 11 00" Что имеется в виду?
-
gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
-
Контактная информация:
Сообщение
gs » 05 окт 2004, 14:29
Я честно говоря не знаю кодов ошибки - это надо очень глубоко рыть или запрашивать вендора.
Но в приземленном плане это означает, что надо разбираться с этим адресом, т.е. винтом или слотом корзины.
Моя рекомендация - отстегнуть кабель от рэйда, привесить его на простой скази адаптер и прогнать утилиту производителя дисков (неразрушающие тесты есс-но). Она-то все и скажет. Весьма вероятно, что на этом винте есть бэды.
-
gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
-
Контактная информация:
Сообщение
gs » 05 окт 2004, 14:31
Не "следуя", а "со следующим кодом ошибки"
-
DIV72
- Junior member
- Сообщения: 11
- Зарегистрирован: 04 окт 2004, 10:34
Сообщение
DIV72 » 05 окт 2004, 14:48
Sorry за перевод, не верно понял.
Касаемо проблемы: насколько я понял исправить "на лету" без остановки сервера не получится. И как быть, если ID1 окажется битым, а ID0 вне массива? Заново пересобирать массив?
-
gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
-
Контактная информация:
Сообщение
gs » 05 окт 2004, 14:54
Если так, то это очень плохо. Правильный путь в такой ситуации - бэкап, формат или замена дохлых и полная переделка массива. Другими путями вряд ли что получится - ребилд просто не пройдет.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 22 гостя