развалился raid 10 (отключено 5 дисков из 8)
Модераторы: Trinity admin`s, Free-lance moderator`s
-
- Power member
- Сообщения: 38
- Зарегистрирован: 13 фев 2008, 09:23
- Откуда: СПБ
- Контактная информация:
развалился raid 10 (отключено 5 дисков из 8)
есть полка msa2012fc с двумя контроллерами и двумя кузовами
есть raid 10 из 8 дисков подцепленный к серверу файлопомойки
в каждом кузове по 4 диска
владелец raid - контроллер 2
на кузове 1 вышел из строя диск, заменили, запустили ребилд
в процессе ребилда (ребилд не был завершен) выключился контроллер 2 где были 4 рабочих диска
raid 10 из 8 дисков не выдержал отключения 5 дисков и развалился
после перезапуска контроллера 2 появилось сообщение, что вышел из строя диск в кузове 2
добавили еще один диск, идет реконструкция массива, причем замененный ранее диск отмечен как рабочий.
сервер файлопомойки самопроизвольно перезагрузился и с разваленым рейдом начала проверку диска )
отработал около часа перед тем как это было обнаружено. выключили комп, реконструкция потихоньку идет дальше.
исходя из опыта общения с проверкой диска в разваленном рейде - те данные что были "проверенны" уже трудно восстановимы.
что делать после реконструкции массива, ведь наверняка винда попросит проверить диск - разрешать ли ей это делать? хотелось бы чтобы максимальная часть данных была сохранена (бэкап есть, но не первой свежести)
позволит ли использование софтовый raid 5+1 из 8 дисков (два аппаратных объеденены софтварным зеркалом) избежать в последствии такой ситуации (отключение 5 дисков, 4 с одного контроллера и 1 из второго)?
понимаю, что софтварный рейд в данном случае точка отказа, чисто теоретически любопытно.
есть raid 10 из 8 дисков подцепленный к серверу файлопомойки
в каждом кузове по 4 диска
владелец raid - контроллер 2
на кузове 1 вышел из строя диск, заменили, запустили ребилд
в процессе ребилда (ребилд не был завершен) выключился контроллер 2 где были 4 рабочих диска
raid 10 из 8 дисков не выдержал отключения 5 дисков и развалился
после перезапуска контроллера 2 появилось сообщение, что вышел из строя диск в кузове 2
добавили еще один диск, идет реконструкция массива, причем замененный ранее диск отмечен как рабочий.
сервер файлопомойки самопроизвольно перезагрузился и с разваленым рейдом начала проверку диска )
отработал около часа перед тем как это было обнаружено. выключили комп, реконструкция потихоньку идет дальше.
исходя из опыта общения с проверкой диска в разваленном рейде - те данные что были "проверенны" уже трудно восстановимы.
что делать после реконструкции массива, ведь наверняка винда попросит проверить диск - разрешать ли ей это делать? хотелось бы чтобы максимальная часть данных была сохранена (бэкап есть, но не первой свежести)
позволит ли использование софтовый raid 5+1 из 8 дисков (два аппаратных объеденены софтварным зеркалом) избежать в последствии такой ситуации (отключение 5 дисков, 4 с одного контроллера и 1 из второго)?
понимаю, что софтварный рейд в данном случае точка отказа, чисто теоретически любопытно.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: развалился raid 10 (отключено 5 дисков из 8)
Чек конечно запускать не надо. Если данные ценны, поговорите с рекаверами - они денег возьмут конечно, но есть шанс спасения.
Но, если честно, я не очень понял ситуацию по Вашему описанию. Что-то непонятно насчет кузовов и контроллеров.
Но то, что вылетевший первым диск отмечен как рабочий - он или уже успел доребилдиться, или это может быть проблемой.
Как сервер мог начать проверку диска, если массив развалился?
Но, если честно, я не очень понял ситуацию по Вашему описанию. Что-то непонятно насчет кузовов и контроллеров.
Но то, что вылетевший первым диск отмечен как рабочий - он или уже успел доребилдиться, или это может быть проблемой.
Как сервер мог начать проверку диска, если массив развалился?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: развалился raid 10 (отключено 5 дисков из 8)
Извращаться с зеркалированием в рамках одной системы имхо бессмысленно. Если уж хотите зубодробительной надежности - поставьте второй аппарат и на него уже зеркальтесь.
-
- Power member
- Сообщения: 38
- Зарегистрирован: 13 фев 2008, 09:23
- Откуда: СПБ
- Контактная информация:
Re: развалился raid 10 (отключено 5 дисков из 8)
Что именно не понятно насчет кузовов и контроллеров?gs писал(а): Но, если честно, я не очень понял ситуацию по Вашему описанию. Что-то непонятно насчет кузовов и контроллеров.
msa2012 состоит из двух кузовов, на каждом кузове - контроллер
контроллер 1 обслуживает диски в кузове 1
контроллер 2 обслуживает диски в кузове 2
выключился контроллер 2 и диски находящиеся в в кузове 2 стали недоступны
надеюсь более понятно?
сервер файлопомойки имеет встроенный физический raid (на чипе адаптека, с батарейкой, маркировку не помню), на нем собрано зеркало - используется для операционки.
видимо это и позволило запустится
развалившийся рейд использовался исключительно для хранения файлов.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: развалился raid 10 (отключено 5 дисков из 8)
Судя по этому:
http://h18004.www1.hp.com/products/quic ... 1_div.HTML
оба контроллера находятся в одном кузове. Вот потому и непонятно.
"видимо это и позволило запустится"
Запуститься операционке - конечно. Но как она смогла чекать массив? Если он развалился, значит к нему пропал доступ. Или все же не развалился, а просто деградед?
http://h18004.www1.hp.com/products/quic ... 1_div.HTML
оба контроллера находятся в одном кузове. Вот потому и непонятно.
"видимо это и позволило запустится"
Запуститься операционке - конечно. Но как она смогла чекать массив? Если он развалился, значит к нему пропал доступ. Или все же не развалился, а просто деградед?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: развалился raid 10 (отключено 5 дисков из 8)
Контроллеры обслуживают не "диски в кузове №", а те, которые Вы им дадите - неважно в каком кузове.
-
- Power member
- Сообщения: 38
- Зарегистрирован: 13 фев 2008, 09:23
- Откуда: СПБ
- Контактная информация:
Re: развалился raid 10 (отключено 5 дисков из 8)
хм. да, Вы правы насчет размещения контроллеров.gs писал(а):Судя по этому:
http://h18004.www1.hp.com/products/quic ... 1_div.HTML
оба контроллера находятся в одном кузове. Вот потому и непонятно.
"видимо это и позволило запустится"
Запуститься операционке - конечно. Но как она смогла чекать массив? Если он развалился, значит к нему пропал доступ. Или все же не развалился, а просто деградед?
контроллеру 2 были отданы в управление 4 диска из кузова 2 и 4 диска из кузова 1
евентлог полки огромен и пестрит критикал ошибками
отправлю в HP - пусть думают, как такое произошло и как бороться.
спасибо за информацию, думаю топик можно закрывать
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 21 гость