Lsi Logic 320-2X Не ребилдит

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Axx
Junior member
Сообщения: 9
Зарегистрирован: 23 ноя 2005, 12:38

Lsi Logic 320-2X Не ребилдит

Сообщение Axx » 23 ноя 2005, 12:50

Имеем:
Lsi Logic 320-2X (FW414C, H429), на каждом канале висит корзина по 5 HDD (ST373307LC). Собран RAID 5 c одним HоtSpare.

Один из дисков "наелся" ошибок и контроллером был отправлен в режим FAIL. В настройках установлено "Auto Rebuild : Enabled", НО ребилд на HS не начинается. Рейд в режиме DEGRADED.

Замена "вышедшего из строя" диска на такой же новый к изменению статуса FAIL не приводит, даже после рестарта сервера.

Как решать данную проблему, HELP!

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 23 ноя 2005, 13:06

Запустите Power Console и нажмите rebuild

Axx
Junior member
Сообщения: 9
Зарегистрирован: 23 ноя 2005, 12:38

Сообщение Axx » 23 ноя 2005, 13:17

У нас установлен RH9, соответственно из софта по управлению имеется только "MegaRAID Manager" (точная копия меню по Ctrl+M)

Заходя в раздел Rebuild, выводится в две колонки каналы, на одном красуется FAIL.  Ребилд (F10) ругается : "No Drive is selected", при попытки отметить любой из дисков ONLINE - ругается: "Cannot Rebuild a Drive Which is not in Failed State".

Не вижу реальной возможности "заставить" ребилдить.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 23 ноя 2005, 13:27

Вставьте диск на место сдохшего и толкните ребилд на него. Почему не пошел авторебилд на спаре - непонятно, но возможно он просто в опциях контроллера выключен.

Axx
Junior member
Сообщения: 9
Зарегистрирован: 23 ноя 2005, 12:38

Сообщение Axx » 23 ноя 2005, 13:36

Установка на место сдохшего харда, нового - НЕ меняет статус FAIL.

Создаётся впечатление, что контроллер багует.

Если заменить контроллер на такой же, подцепится ли рэйд ? спросит ли, откуда нужно брать конфигурацию и как новый контроллер отреагирует на то, что "наследство" в статусе "DEGRADED"

Спасибо.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 23 ноя 2005, 13:38

Замена диска и не должна менять статус. Просто после этого должен сработать ребилд вручную, раз уж он автоматом на спаре не пошел.

Axx
Junior member
Сообщения: 9
Зарегистрирован: 23 ноя 2005, 12:38

Сообщение Axx » 23 ноя 2005, 13:54

Заменил диск, в меню Rebuild стало возможным отметить диск со статусом FAIL. Попытка ребилдить приводит к ошибке (см. картинку).

Есть ли возможность начать ребилд не этого диска, а именно HS  (возможно необходимо сменить статус диска FAIL на READY и т.д. ?)
Вложения
rebuild.gif
rebuild.gif (10.39 КБ) 9902 просмотра

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 23 ноя 2005, 13:58

Не надо пускаться во все тяжкие. Стандартная процедура - это ребилд. Причем неважно - вручную или авто. Смена статуса и т.п. - операции потенциально опасные и их стоит делать только от безысходности и четко осознавая что именно делаете и их последствия.
Ребилд может вылететь с ошибкой например по причине бэд блока на ЛЮБОМ из винтов. Так что проверьте-ка все диски на простом скази адаптере утилитой вендора. После этого станет ясно кто из ху.
Надеюсь бэкап уже сделали в два разных места?

Axx
Junior member
Сообщения: 9
Зарегистрирован: 23 ноя 2005, 12:38

Сообщение Axx » 23 ноя 2005, 14:07

Допустим выявится, что один из боевых хардов имеет бэдблоки

"Еще минус один диск" приведет к разрушительным последствиям. Программа минимум - сделать ребилд хотябы на один из неиспользуемых дисков (в настоящее время это FAIL и HS)

Бэкап сделать возможности нет, возможности позволяют заменять диски на новые и имеется еще 2 таких контроллера :]

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 23 ноя 2005, 14:09

Если хотя бы один из дисков имеет бэды, то ребилд НЕВОЗМОЖЕН.
Если это так, то единственный путь - бэкап, замена (или хотя бы переформатирование) дисков и пересборка массива с нуля.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 23 ноя 2005, 14:13

Раз у Вас линукс, попробуйте для начала вопользоваться утилитой MegaRC:
http://www.lsilogic.com/downloads/licen ... 5&pid=2407

Axx
Junior member
Сообщения: 9
Зарегистрирован: 23 ноя 2005, 12:38

Сообщение Axx » 23 ноя 2005, 14:45

Поразительный "Мост Стабилити":  продакшин сервер имеющий аппаратный RAID контроллер, SCSI диски, Hot Swap, встаёт в режим "вытащите все диски и проверьте на BB" иначе ребилд невозможен, а при вылетании еще одного диска система накроется ...  слов нет :]]

Это так, накатило что то :)

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 23 ноя 2005, 14:51

Чтобы не плясать с бубном по поводу бэд блоков придумана процедура consystency check. Если ее делать почаще, обо всех проблемах будете узнавать заранее. А мелкие проблемки она сама и замапить может. Но сейчас уже поздно.
Повторюсь - я не уверен на 100%, что виноваты бэды (возможно и контроллер плющит), но очень на то похоже.

Axx
Junior member
Сообщения: 9
Зарегистрирован: 23 ноя 2005, 12:38

Сообщение Axx » 23 ноя 2005, 14:55

Возможно повторюсь, но последняя попытка:

Возможно ли мануально HS ввести в режим FAIL, и заставить ребилдиться, или если бы это было возможно, то ребилд прошёл бы и с новым винтом ?

Спасибо.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 23 ноя 2005, 15:01

Правильный ответ - переставить спаре диск на место подохшего и запустить ребилд вручную. Если он не пойдет, то скорее всего бэд блоки, проблемы кабеля и т.д. и т.п.
Или проверьте включенность опции автоматик ребилд (хотя он должен быть включен по дефолту). Если включен, то ребилд должен пойти автоматом при первой же попытке записи (или по информации SAF-TE процессора корзины, если он есть). Если не идет - см. выше.
Конечно не исключен баг контроллера, но это менее вероятно.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 24 гостя