Mylex AcceleRAID 170 - Logical Drive Critical

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Artem_A
Junior member
Сообщения: 8
Зарегистрирован: 17 май 2006, 10:43

Mylex AcceleRAID 170 - Logical Drive Critical

Сообщение Artem_A » 17 май 2006, 11:24

Добрый день.

Возникла следующая проблема.
На сервере с рэйд контроллером Mylex AcceleRAID 170 построен RAID Level 5 (на четырех дисках, если я не ошибаюсь.)

В корзине установлено 4 винчестера (0-2 канал и 4 канал, на третьем канале винчестера нет).

День назад Logical Drive перешел в состояние Critical. Что вы можете посоветовать сделать?

P.S. Система не грузилась после внезапного "входа" диска на 0-м канале в состояние Offfline. Я его на свой страх и риск принудительно сделал Online в BIOS контроллера, смог загрузиться.

Вот что показывает GAM:
Вложения
test.jpg

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 17 май 2006, 11:52

ГАМ говорит, что у Вас в массиве пять винтов. Причем один дохлый. Проясните вопрос.

Artem_A
Junior member
Сообщения: 8
Зарегистрирован: 17 май 2006, 10:43

Сообщение Artem_A » 17 май 2006, 12:05

Да честно говоря, я сам не понимаю, откуда там пятый дохлый винт.

Было так:

На третьем канале винт однажды перешел в состояние Offline (пару месяцев назад). Я на нем создал (это я потом понял) еще один логический диск.

Он поработал какое-то время, и опять - Offline. Одновременно с ним ушел в Offline диск на 0-м канале, сервер вообще не грузился, пока я его принудительно не сделал Online.

Логический диск я убил, винт достал.
Купил новый винт Seagate ST373207LC чтобы заменить им диск на 0-м канале (там стоят ST318405LC), вставил его, отформатировал, он стал Unconfigured.

Сделать из-под него Rebuild массива из BIOS'а не получается, сообщение что-то вроде "диск Unconfigured".

Пока сервер работает, но состояние Critical и это опасно. Вот такая ситуация.

Заранее благодарю за помощь.

Artem_A
Junior member
Сообщения: 8
Зарегистрирован: 17 май 2006, 10:43

Сообщение Artem_A » 17 май 2006, 12:07

Да честно говоря, я сам не понимаю, откуда там пятый дохлый винт.

Было так:

На третьем канале винт однажды перешел в состояние Offline (пару месяцев назад). Я на нем создал (это я потом понял) еще один логический диск.

Он поработал какое-то время, и опять - Offline. Одновременно с ним ушел в Offline диск на 0-м канале, сервер вообще не грузился, пока я его принудительно не сделал Online.

Логический диск я убил, винт достал.
Купил новый винт Seagate ST373207LC чтобы заменить им диск на 0-м канале (там стоят ST318405LC), вставил его, отформатировал, он стал Unconfigured.

Сделать из-под него Rebuild массива из BIOS'а не получается, сообщение что-то вроде "диск Unconfigured".

Пока сервер работает, но состояние Critical и это опасно. Вот такая ситуация.

Заранее благодарю за помощь.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 17 май 2006, 12:30

Ситуация малопонятная и разбираться придется долго. К тому же есть риск испорченного телефона.
Лучше всего сделайте фулл бэкап и переделайте сервак заново. Это будет самый надежный и возможно даже самый быстрый вариант.

И еще - почитайте мануал контроллера, у Вас явно пробелы в этом деле (это не наезд, а совет). Во первых - канал у контроллера один, а то, что Вы называете каналами на самом деле SCSI ID. Эта путаница может вызвать у Вас проблемы в понимании документации со всеми вытекающими. Во вторых, make online - операция исключительно для катастрофических случаев, когда массив разваливается вдребезги. Если же вылетел только оди винт, его надо ребилдить.
Скорее всего Вы очень много чего напутали и сделали неправильно. И теперь мы можем все еще больше усугубим, если попробуем восстанавливать. Лучше переделать.

Artem_A
Junior member
Сообщения: 8
Зарегистрирован: 17 май 2006, 10:43

Сообщение Artem_A » 17 май 2006, 12:53

Спасибо за помощь.

Вы не могли бы сказать, почему я не могу сделать Rebuild, если винт Unconfigure?

И если случится повторная ситуация с винтом на 0-м SCSI ID, могу ли я туда подсунуть новый винт и сделать и-под него Rebuild?

Кстати, если посмотреть св-ва того "дохлого" винта (которого физически нет), то там активна кнопка Rebuild.

Чем Вы посоветуете делать фул бэкап: RGost, Acronis ?...

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 17 май 2006, 13:25

1. Анконфигуред - массив считает, что этот винт никогда не был в массиве. И естественно ничего с ним делать не хочет, кроме создания массива или назначения его спаре.

2. Если вылетает винт, то его надо или менять на другой и ребилдить (если он действительно сдох) или отформатить и заребилдить его же (если сбой был логическим).

3. Глюк контроллера наверно - мы много неправильных действий сделали, могла и крыша поехать :)

4. ntbackup - старая боевая лошадь.

Artem_A
Junior member
Сообщения: 8
Зарегистрирован: 17 май 2006, 10:43

Сообщение Artem_A » 17 май 2006, 13:44

Т.е. я правильно понял: у меня три винта в RAID массиве, один выходит из строя.

1) Я ставлю на его место новый винт.
2) Делаю Rebuild
3) Делаю Consistency check.

или

1) Форматирую отказавший
2) Делаю Rebuild
3) Делаю Consistency check.

Сейчас проблема в том, что лог. диск переходит в оффлайн, если винт на 0-м ID отваливается.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 17 май 2006, 14:03

Действия Вы поняли правильно. Но поичтайте таки мануал - много чего еще узнаете.

Почему массив разваливается при вылете одного винта - не знаю, но скорее всего это связано с тем, что у контроллера конфиг не в порядке (грубо говоря крыша поехала). Он почему-то считает, что в массиве пять винтов, а не четыре и один из них дохлый. И при вылете еще одного он по всем правилам валит массив. Т.е. налицо логический сбой. Его можно попробовать побороть и без переустановки системы, но не стоит - проще и надежнее поросто переделать.

Artem_A
Junior member
Сообщения: 8
Зарегистрирован: 17 май 2006, 10:43

Сообщение Artem_A » 17 май 2006, 14:19

В BIOS'е показывает, что логический диск состоит из трех дисков.

Как можно побороть ситуацию без переустановки?

Можно сделать ребилд диска, который на SCSI ID 3 (который сейчас отсутствует)? И заменить диск на SCSI ID 0?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 17 май 2006, 14:38

Я сознательно не хочу Вам это объяснять. Дело в том, что со сбрендившим контроллером шутки плохи - можете все конкретно запороть. Да и вообще подобные действия - для профессионала, совершенно четко представляющего, что он делает. Лучше не рискуйте - велик шанс, что нихрена у Вас не выйдет и придется все равно все переколбасить.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 17 май 2006, 14:52

Хотя на будущее имейте в виду. В таких случаях на майлексовских контроллерах (и LSI MegaRAID) можно сделать clear config и пересоздать массив В ТОЧНОСТИ как он был раньше и БЕЗ ИНИЦИАЛИЗАЦИИ. Операция эта опасная - можно неловким движением все снести к едрене фене. Но в крайних случаях это бывает последним шансом и использовалось неоднократно.

Но в данном случае это делать не надо. Дело в том, что Вы уже сделали неправильное действие - мэйк онлайн. Поэтому у Вас сейчас нарушена структура массива - скорее всего повреждены какие-то файлы, что еще просто не проявилось. И переделав массив таким нештатным образом Вы просто ЗАСТАВИТЕ контроллер думать, что все в порядке, хотя это не так. Так что бэкпьтесь и делайте все по уставу.

DEMOMON
Junior member
Сообщения: 7
Зарегистрирован: 12 сен 2011, 13:22
Откуда: S-Pb

Re: Mylex AcceleRAID 170 - Logical Drive Critical

Сообщение DEMOMON » 21 окт 2011, 16:52

Можно я продолжу тему?
Тоже есть вопросы.
Вылетел винт. Я поменял на другой такого же объёма, но он не подхватился массивом, хотя функции в EZ включены. Из выше сказанного следует, что надо сделать Rebuild. Дело в том, что если посмотреть в Logical drives и в Hard drives, везде есть функция Rebuildig-а. Так вот вопрос: где проводить его?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Mylex AcceleRAID 170 - Logical Drive Critical

Сообщение gs » 21 окт 2011, 17:07

Вы думаете я помню? :)
Сто лет прошло.

Но вреда в любом случае быть не должно.

DEMOMON
Junior member
Сообщения: 7
Зарегистрирован: 12 сен 2011, 13:22
Откуда: S-Pb

Re: Mylex AcceleRAID 170 - Logical Drive Critical

Сообщение DEMOMON » 21 окт 2011, 17:24

Так проводить Rebuild и там и там?
И ещё вопрос. Данный RAID5 состоял из шести винтов. В общем сейчас почему-то видится (через EZ) один логический диск в состоянии critical, и другой в состоянии offline. Откуда он взялся я не знаю, т.к. хорошо помню что в Винде общий объём дисков был 170 Гб. 6 винтов по 34 Гб как раз и будет 170 Гб. Причём система грузится и второй логический диск виден тоже.
Что тут может помочь?

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 20 гостей