Rebuild RAID5

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Rebuild RAID5

Сообщение cherep » 08 дек 2003, 17:22

RAID контроллер: Infortrend
Модель: SR150 (что-то типа этого http://61.66.209.12/sr150f.asp)
Firmware: v.3.15S

Logical Drive Status:
- RAID5
- Drivers - 4
- Capacity - 103GB (занято > 70%)

Ситуевина такая: отвалился винт, я его переформатировал, включил обратно в RAID массив и запустил REBUILDING (причем в настройках Rebuilding priority = LOW). Теперь сетевые диски не доступны, хотя север работает, Rebuilding progress = 0% (вот уже больше часа).

Сколько может продлиться этот процесс?

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Сообщение cherep » 08 дек 2003, 17:26

А что будет если во время REBUILDING'а вырубить сервер?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 08 дек 2003, 17:41

Контроллер внешний, так что выключение сервера на него повлиять никак не должно. Хотя я лично с таких аппаратом не сталкивался. А вот почему ребилд не идет - непонятно. Еще непонятнее почему во время ребилда сервер том не видит. А утилита управления-то не повисла?

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Сообщение cherep » 08 дек 2003, 17:48

Сервер работает чисто внешне (NetWare5.1), т.е. можно делать что угодно, но как только обращаешся к файловой системе (запуск программы, просмотр файла и т.п.) тишина. Т.е. утилиту запустить не могу.

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Сообщение cherep » 08 дек 2003, 18:34

Rebuild progrees - 0% уже 3 часа. ПАМАГИТЕ!!!! Что делать-то?

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Сообщение cherep » 09 дек 2003, 08:50

Кароче перезагрузил я сервер. Вроде пронесло, сервер заработал. Правда отвалившийся винт так и не запустился. Я его выдернул из корзины, теперь RAID пишет что винт содержит BAD блоки, хотя при форматировании ничего не было.

По какой причине мог повиснуть процесс REBUILDING'а?

Причем теперь к RAID контроллеру нельзя подключиться с консоли сервера утилитой RAIDMAN. Связь с RAID'ом осуществляется по com порту, теперь же пишет Connection FAILED!

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 09 дек 2003, 12:42

Вот за что я и не люблю Инфортренд. Хотя может быть просто не умею готовить:) Но например на Чапарале я таких приколов не видел ни разу.
Ребилд мог остановиться как раз по причине бэдов на диске - может быть он и правда дохлый. Хотя по уму контроллер должен был об этом сказать, а не виснуть. А контроллер перегружали?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 09 дек 2003, 12:43

Извиняюсь за бестолковые вопросы, но не видя железку очень трудно что-то дельное сказать :(

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Сообщение cherep » 09 дек 2003, 13:04

И я извиняюсь за бестолковые вопросы

Можно-ли перезагрузить RAID на живом сервере?
А вообще когда перезагрузил сервер RAID тоже перезагрузился, но после этого я больше не стал экспериментировать т.к. сервер боевой.

А еще я тут порыскал в Инете и нашел свежую прошивку для RAID'а и решил обновить ее, но опять же не знаю можно-ли это делать на работающем сервере и как это скажется на его работе, чем это чревато и на сколько необходимо?

И вообще опишите типичную процедуру перепрошивки, а то в мануале ничего не сказано по этому поводу.

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Сообщение cherep » 10 дек 2003, 12:07

УРА! все заработало.
Я воткнул в другое место другой(100% исправный) винт.

А похоже проблема была в том, что я пытался поставить винт в то же место, а он осавался помеченый как неисправный.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 10 дек 2003, 14:39

Оригинально. Вообще-то классически замена вставляется именно туда, где был сбойный. Вдруг например у вас весь ящик уже занят?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 10 дек 2003, 14:42

Кажется понял. Контроллер не захотел ребилдить массив обычной процедурой, а когда вы вставили в диск другое место он его воспринял как хот спаре и отработал нормально.
ИМХО кривое фирмваре контроллера. Или слот в ящике битый.

cherep
Junior member
Сообщения: 12
Зарегистрирован: 08 дек 2003, 17:15

Сообщение cherep » 11 дек 2003, 07:49

Вобщем-то я сам новый винт пометил как хот спаре.
Да и контроллер вроде нормальный, это мануал к нему кривой. Там ни полслова не написано о подобной ситуации.


PS: Искать причину сбоя чета не хочется, итак страху натерпелся. И вообще случись чего меня-же вся контора (200 чел.) вместе с ботинками сожрут.

Аватара пользователя
Dmitry
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 861
Зарегистрирован: 22 авг 2002, 16:12
Откуда: St.Petersburg
Контактная информация:

Сообщение Dmitry » 11 дек 2003, 10:55

Так в этом случае на один сервер с RAID полагаться нельзя. Тут надо всю информационную политику предприятия подчинить требованию надежности и непрерывности бизнеса. А именно вам необходимо продумать: backup, резервный сервер, резервное оборудование (например HDD), подготовленные дистрибутивы и профайлы, имиджи и слепки, и естественно инсталлировать и настроить все возможные средства мониторинга и управления для вашего конкретного оборудования.

В общем, продумать все исходя из принципа - "а вдруг все сломается и я потеряю информацию".

Тогда вся контора (200 чел.) вместе с ботинками Вас не сожрет. В лучшем случае никто ничего не заметит, в худшем - будет перерывчик на кофе с булочками :P

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 11 дек 2003, 11:18

Вообще-то зависание во время ребилда - явление совершенно ненормальное. Тут дело не в мануале :)
Или действительно фирмваре контроллера кривое или аппаратная проблема шины/слота. С этим бы стоило разобраться, если система критичная. А то потом вылезет во всей красе и в самый неподходящий момент.
Кстати, имхо эти контроллеры предназначены не для критичных систем (кстати и от ящика многое зависит) - что бы про себя не думал Инфортренд. Если Вы имеете такое чудо, да и прецедент уже был, стоит вдвойне задуматься о средствах отказоустойчивости (бэкап, реплика и пр.).
А то съедят и будут правы:(

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»