развалился raid 10 (отключено 5 дисков из 8)

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
zubastiy
Power member
Сообщения: 38
Зарегистрирован: 13 фев 2008, 09:23
Откуда: СПБ
Контактная информация:

развалился raid 10 (отключено 5 дисков из 8)

Сообщение zubastiy » 15 янв 2009, 15:59

есть полка msa2012fc с двумя контроллерами и двумя кузовами
есть raid 10 из 8 дисков подцепленный к серверу файлопомойки
в каждом кузове по 4 диска
владелец raid - контроллер 2
на кузове 1 вышел из строя диск, заменили, запустили ребилд
в процессе ребилда (ребилд не был завершен) выключился контроллер 2 где были 4 рабочих диска
raid 10 из 8 дисков не выдержал отключения 5 дисков и развалился
после перезапуска контроллера 2 появилось сообщение, что вышел из строя диск в кузове 2
добавили еще один диск, идет реконструкция массива, причем замененный ранее диск отмечен как рабочий.
сервер файлопомойки самопроизвольно перезагрузился и с разваленым рейдом начала проверку диска )
отработал около часа перед тем как это было обнаружено. выключили комп, реконструкция потихоньку идет дальше.

исходя из опыта общения с проверкой диска в разваленном рейде - те данные что были "проверенны" уже трудно восстановимы.

что делать после реконструкции массива, ведь наверняка винда попросит проверить диск - разрешать ли ей это делать? хотелось бы чтобы максимальная часть данных была сохранена (бэкап есть, но не первой свежести)

позволит ли использование софтовый raid 5+1 из 8 дисков (два аппаратных объеденены софтварным зеркалом) избежать в последствии такой ситуации (отключение 5 дисков, 4 с одного контроллера и 1 из второго)?
понимаю, что софтварный рейд в данном случае точка отказа, чисто теоретически любопытно.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: развалился raid 10 (отключено 5 дисков из 8)

Сообщение gs » 15 янв 2009, 16:14

Чек конечно запускать не надо. Если данные ценны, поговорите с рекаверами - они денег возьмут конечно, но есть шанс спасения.

Но, если честно, я не очень понял ситуацию по Вашему описанию. Что-то непонятно насчет кузовов и контроллеров.
Но то, что вылетевший первым диск отмечен как рабочий - он или уже успел доребилдиться, или это может быть проблемой.
Как сервер мог начать проверку диска, если массив развалился?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: развалился raid 10 (отключено 5 дисков из 8)

Сообщение gs » 15 янв 2009, 16:15

Извращаться с зеркалированием в рамках одной системы имхо бессмысленно. Если уж хотите зубодробительной надежности - поставьте второй аппарат и на него уже зеркальтесь.

zubastiy
Power member
Сообщения: 38
Зарегистрирован: 13 фев 2008, 09:23
Откуда: СПБ
Контактная информация:

Re: развалился raid 10 (отключено 5 дисков из 8)

Сообщение zubastiy » 15 янв 2009, 16:30

gs писал(а): Но, если честно, я не очень понял ситуацию по Вашему описанию. Что-то непонятно насчет кузовов и контроллеров.
Что именно не понятно насчет кузовов и контроллеров?

msa2012 состоит из двух кузовов, на каждом кузове - контроллер
контроллер 1 обслуживает диски в кузове 1
контроллер 2 обслуживает диски в кузове 2
выключился контроллер 2 и диски находящиеся в в кузове 2 стали недоступны
надеюсь более понятно?

сервер файлопомойки имеет встроенный физический raid (на чипе адаптека, с батарейкой, маркировку не помню), на нем собрано зеркало - используется для операционки.
видимо это и позволило запустится :roll:
развалившийся рейд использовался исключительно для хранения файлов.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: развалился raid 10 (отключено 5 дисков из 8)

Сообщение gs » 15 янв 2009, 16:46

Судя по этому:
http://h18004.www1.hp.com/products/quic ... 1_div.HTML
оба контроллера находятся в одном кузове. Вот потому и непонятно.

"видимо это и позволило запустится"
Запуститься операционке - конечно. Но как она смогла чекать массив? Если он развалился, значит к нему пропал доступ. Или все же не развалился, а просто деградед?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: развалился raid 10 (отключено 5 дисков из 8)

Сообщение gs » 15 янв 2009, 16:47

Контроллеры обслуживают не "диски в кузове №", а те, которые Вы им дадите - неважно в каком кузове.

zubastiy
Power member
Сообщения: 38
Зарегистрирован: 13 фев 2008, 09:23
Откуда: СПБ
Контактная информация:

Re: развалился raid 10 (отключено 5 дисков из 8)

Сообщение zubastiy » 15 янв 2009, 17:36

gs писал(а):Судя по этому:
http://h18004.www1.hp.com/products/quic ... 1_div.HTML
оба контроллера находятся в одном кузове. Вот потому и непонятно.

"видимо это и позволило запустится"
Запуститься операционке - конечно. Но как она смогла чекать массив? Если он развалился, значит к нему пропал доступ. Или все же не развалился, а просто деградед?
хм. да, Вы правы насчет размещения контроллеров.
контроллеру 2 были отданы в управление 4 диска из кузова 2 и 4 диска из кузова 1

евентлог полки огромен и пестрит критикал ошибками
отправлю в HP - пусть думают, как такое произошло и как бороться.

спасибо за информацию, думаю топик можно закрывать

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя