Помогите, пожалуйста, провести диагностику RAID-массива...
Модераторы: Trinity admin`s, Free-lance moderator`s
-
- member
- Сообщения: 30
- Зарегистрирован: 30 янв 2006, 08:59
- Откуда: Москва
Помогите, пожалуйста, провести диагностику RAID-массива...
Ребят, подскажите, пожалуйста, как выловить причину сбоя.
массив построен на конроллере Promise SuperTrack SX 6000. серве управляетс Win2k Advanced Server SP4. так вот, уже третий раз в какой-то момент винда выдает ошибку "не получен ответ от устройства \Device\Sptrack в течение промежутка времени". не помню, к сожалению дословно, но смысл примерно такой.
после этого винда начинала жутко глючить. если, к примеру, перезагрузить сервер, то винда загружалась по 40 (!) минут:(
после переустановки винды - все приходило в норму на некоторое время.
а в этот раз - вообще что-то непонятное моему умишку произошло.
пришла на работу, слышу, контроллер пищит. посмотрела в мануале расшифровку звуковых кодов. оказалось, сбой одного из дисков массива. у меня установлен RAID 3.
биос самого контроллера выдала ошибку "critical" и "посоветовала" запустить утилиту SuperBuld. я по глупости нажала требуемое сочетенаие кнопок. и утилита начала ребилд отметив ошибку на втором канале рэйда. я так поняла, что сбоил 2-диск массива. именно он установлен на втором канале.
на после того как прошел ребилд, биос контроллера выдала мне, что всё ок, всё "functional" и спокойно запустилась. при этом я снова запустила встроенную "Супербилд" и она мне не выдала никаких ошибок. Напротив все трех винчестеров просто отображались их характеристики, маркировка и всё...
винда опять навернулась и пришлось снова ее переставлять.
в общем, я понимаю, что чего-то не понимаю, но с чего начать - не могу дойти
почитала здесь раздел FAQ, как начать диагностику, но возникли вопросы:
1) не понятно теперь, какой винчестер тестировать. и надо ли вообще извлекать какой-либо диск и тестировать его на отдельном компе "утилитой производителя". в принципе, подозрения, что это именно второй диск сохраняются, т.к. он на ощупь горячее остальных.
2) мне знакомый посоветовал методику тестирования, отличающуюся от того, что сказано в ЧАВО:
- во-первых, он мне посоветовал утилиту Victoria
- во-вторых, он сказал, что надо сначала создать загрузочную дискетку с Викторией, загрузиться с этой дискетки, при этом тестируемый винт должен быть подключен только шлейфом, а кабель питания к нему надо присоединять только после того, как комп загрузится с дискетки Виктории.
в общем, голова кругом идет:(:(:(
и еще вопрос: если все-таки окажется, что не исправен винт, какой можно купить на замену, ибо точно таких же винтов - той же модели, фирмы, объема - нет в продаже
массив построен на конроллере Promise SuperTrack SX 6000. серве управляетс Win2k Advanced Server SP4. так вот, уже третий раз в какой-то момент винда выдает ошибку "не получен ответ от устройства \Device\Sptrack в течение промежутка времени". не помню, к сожалению дословно, но смысл примерно такой.
после этого винда начинала жутко глючить. если, к примеру, перезагрузить сервер, то винда загружалась по 40 (!) минут:(
после переустановки винды - все приходило в норму на некоторое время.
а в этот раз - вообще что-то непонятное моему умишку произошло.
пришла на работу, слышу, контроллер пищит. посмотрела в мануале расшифровку звуковых кодов. оказалось, сбой одного из дисков массива. у меня установлен RAID 3.
биос самого контроллера выдала ошибку "critical" и "посоветовала" запустить утилиту SuperBuld. я по глупости нажала требуемое сочетенаие кнопок. и утилита начала ребилд отметив ошибку на втором канале рэйда. я так поняла, что сбоил 2-диск массива. именно он установлен на втором канале.
на после того как прошел ребилд, биос контроллера выдала мне, что всё ок, всё "functional" и спокойно запустилась. при этом я снова запустила встроенную "Супербилд" и она мне не выдала никаких ошибок. Напротив все трех винчестеров просто отображались их характеристики, маркировка и всё...
винда опять навернулась и пришлось снова ее переставлять.
в общем, я понимаю, что чего-то не понимаю, но с чего начать - не могу дойти
почитала здесь раздел FAQ, как начать диагностику, но возникли вопросы:
1) не понятно теперь, какой винчестер тестировать. и надо ли вообще извлекать какой-либо диск и тестировать его на отдельном компе "утилитой производителя". в принципе, подозрения, что это именно второй диск сохраняются, т.к. он на ощупь горячее остальных.
2) мне знакомый посоветовал методику тестирования, отличающуюся от того, что сказано в ЧАВО:
- во-первых, он мне посоветовал утилиту Victoria
- во-вторых, он сказал, что надо сначала создать загрузочную дискетку с Викторией, загрузиться с этой дискетки, при этом тестируемый винт должен быть подключен только шлейфом, а кабель питания к нему надо присоединять только после того, как комп загрузится с дискетки Виктории.
в общем, голова кругом идет:(:(:(
и еще вопрос: если все-таки окажется, что не исправен винт, какой можно купить на замену, ибо точно таких же винтов - той же модели, фирмы, объема - нет в продаже
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Проверьте таки диск родной утилитой - это самый правильный вариант.
На замену в принципе подойдет любой винт неменьшего размера, но тут могут быть грабли - это выясняется только методом тыка.
И выбросьте нафиг этот промис - то, что Вы пишете, до Вас писали уже десятки админов. Это к сожалению нормальное поведение промиса. Поставбте нормальный LSI или 3ware - почувствуете разницу.
На замену в принципе подойдет любой винт неменьшего размера, но тут могут быть грабли - это выясняется только методом тыка.
И выбросьте нафиг этот промис - то, что Вы пишете, до Вас писали уже десятки админов. Это к сожалению нормальное поведение промиса. Поставбте нормальный LSI или 3ware - почувствуете разницу.
-
- member
- Сообщения: 30
- Зарегистрирован: 30 янв 2006, 08:59
- Откуда: Москва
вот тебе раз... а мне вот еще говорили, что надо смотреть, чтоб количесво "блинов" было одинаковым.. это надо?Проверьте-таки диск родной утилитой - это самый правильный вариант.
На замену в принципе подойдет любой винт неменьшего размера, но тут могут быть грабли - это выясняется только методом тыка.
и, самое главное, не повредятся ли данные на массиве от таких замен?
ну, Вы же прекрасно представляете, что кто заказывает музыку - тот и платит:) это как раз тот случай, когда я вынуждена танцевать не по своим правилам:( и работать с тем, что есть.И выбросьте нафиг этот промис - то, что Вы пишете, до Вас писали уже десятки админов. Это к сожалению нормальное поведение промиса. Поставбте нормальный LSI или 3ware - почувствуете разницу
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Количество блинов, производитель и т.п. теоретически без разницы. С практической же точки зрения в большинстве случаев работают совершенно разные диски (хотя для полного отсутствия проблем они должны быть не только одной модели, но и одной ревизии). Но иногда бывают ситуации, когда винты одной модели, но разных ревизий наотрез отказываются работать - это тонкости на уровне фирмваре контроллера и дисков. Заранее предугадать такие моменты практически невозможно.
-
- member
- Сообщения: 30
- Зарегистрирован: 30 янв 2006, 08:59
- Откуда: Москва
понятно. тогда еще вопрос: имеет ли смысл купить два диска? у меня RAID 3. вот новые мне посоветовали ставить вместо старых, которые в зеркале, а исправны старый поставить третим диском...gs писал(а):Количество блинов, производитель и т.п. теоретически без разницы. С практической же точки зрения в большинстве случаев работают совершенно разные диски (хотя для полного отсутствия проблем они должны быть не только одной модели, но и одной ревизии). Но иногда бывают ситуации, когда винты одной модели, но разных ревизий наотрез отказываются работать - это тонкости на уровне фирмваре контроллера и дисков. Заранее предугадать такие моменты практически невозможно.
-
- member
- Сообщения: 30
- Зарегистрирован: 30 янв 2006, 08:59
- Откуда: Москва
да нет, массив у меня один-единственный RAID 3. а вот как лучше заменять диск в рамках этого массива? т.е. мне закупать диск только вместо одного, того, которого я подозреваю глючным или менять его вместе со вторым диском, который с ним находится в зеркале, а третий диск массива не трогать?gs писал(а):Если у Вас два массива на контроллере (рэйд1 + рэйд3), то действительно во избежание проблем лучше сделать так, чтобы винты были одинаковыми в рамках каждого массива. В разных массивах винты могут быть совершенно разными - это не принципиально.
и какую посоветуете модель? мне вот сказали, что некоторые производители сейчас выпускают диски "RAID edition" насколько они лучше "обычных" для работы в массиве? диски мне нужны IDEвые
я так полагаю, что лучше взять по объему больше, т.е., если у меня сейчас в массиве стоят по 250 Гб, то поставить лучше на 300 минимум?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Не понял. У вас в массиве как минимум три винта - откуда еще зеркало? Если менять - то или один или все.
Но Вы сначала проверьте диск утилитой вендора - вполне возможно, что он исправен, а глючит промис и Вы не в ту сторону паритесь.
ИДЕ диски мы уже давно не используем - ничего сказать не могу.
По поводу рэйд эдишен - знаете ли, сигейты самые обычные работают совершенно нормально. А вот WD пришлось выпустить RE, чтобы не было глюков. Так что байки это все.
Винт должен быть не меньшего объема. Ни на байт. В приличных контроллерах во избежание таких ситуаций при создании массива специально немного занижается размер диска - но не знаю как с этим в промисе. Так что если опасаетесь, берите диск большего номинала.
Но Вы сначала проверьте диск утилитой вендора - вполне возможно, что он исправен, а глючит промис и Вы не в ту сторону паритесь.
ИДЕ диски мы уже давно не используем - ничего сказать не могу.
По поводу рэйд эдишен - знаете ли, сигейты самые обычные работают совершенно нормально. А вот WD пришлось выпустить RE, чтобы не было глюков. Так что байки это все.
Винт должен быть не меньшего объема. Ни на байт. В приличных контроллерах во избежание таких ситуаций при создании массива специально немного занижается размер диска - но не знаю как с этим в промисе. Так что если опасаетесь, берите диск большего номинала.
-
- Advanced member
- Сообщения: 431
- Зарегистрирован: 26 янв 2006, 09:15
- Откуда: Moscow
если у Вас RAID3 - то информация располагается на 2 дисках ( данные там в виде страйпов, а не зеркала), а на 3-м XOR-информация (парити).
1. Если вышел из строя один диск из тех 2 что с данными, то информация
восстанавливается с помощью XOR с 3-го диска.
2. Если вышел из строя XOR-диск, информация туда восстанавливается
из реальных данных.
в принципе это штатная ситуация - что Вы и проделали запустив
Rebuild.
Если вы думаете, что диск ( тот что на 2-м канале) близок к смерти
- лучше купить точно такой и провести Rebuild. Если точно такого
нет , то больше - тогда часть будет неиспользована.
НО
1. в любом случае нужен back-up
2. Все 3 диска должны быть одного размера , иначе
имея 2 диска по 300 и 1 диск 200 вы получите 400
( на тех что по 300 потеряются по 100 )
А делать сразу 2 операции - чинить RAID и расширять его об'ем
не стоит.
3. RAID Editions - только SATA, IDE я лично не видел
4. местные админы правы - "promise" слово ругательное и
сколь мало серьезное решение на них строить низзя.
1. Если вышел из строя один диск из тех 2 что с данными, то информация
восстанавливается с помощью XOR с 3-го диска.
2. Если вышел из строя XOR-диск, информация туда восстанавливается
из реальных данных.
в принципе это штатная ситуация - что Вы и проделали запустив
Rebuild.
Если вы думаете, что диск ( тот что на 2-м канале) близок к смерти
- лучше купить точно такой и провести Rebuild. Если точно такого
нет , то больше - тогда часть будет неиспользована.
НО
1. в любом случае нужен back-up
2. Все 3 диска должны быть одного размера , иначе
имея 2 диска по 300 и 1 диск 200 вы получите 400
( на тех что по 300 потеряются по 100 )
А делать сразу 2 операции - чинить RAID и расширять его об'ем
не стоит.
3. RAID Editions - только SATA, IDE я лично не видел
4. местные админы правы - "promise" слово ругательное и
сколь мало серьезное решение на них строить низзя.
-
- member
- Сообщения: 30
- Зарегистрирован: 30 янв 2006, 08:59
- Откуда: Москва
да-да. я неудачно обозвала "зеркалом" те два диска, на который данные находятся. вот как раз один из дисков с данными, мне и показался глючным...если у Вас RAID3 - то информация располагается на 2 дисках ( данные там в виде страйпов, а не зеркала), а на 3-м XOR-информация (парити).
1. Если вышел из строя один диск из тех 2 что с данными, то информация
восстанавливается с помощью XOR с 3-го диска.
2. Если вышел из строя XOR-диск, информация туда восстанавливается
из реальных данных.
точно такой же НЕТ возможности приобрести. нету их в продаже.
т.образом, как я поняла, если мне необходимо заменить диск объемом 250 Гб, и негде взять точно такой же, то лучше купить, скажем, сигейт на 300 Гб, правильно?
и каков последующий алгоритм действий?
при отключенном компе вытащить глючный диск и поставить на его место новый, а потом контроллер сам проведет ребилд, так?
-
- Advanced member
- Сообщения: 431
- Зарегистрирован: 26 янв 2006, 09:15
- Откуда: Moscow
так - если в конфигурации контроллера стоит Auto Rebuild,SvetlanaNikit писал(а): при отключенном компе вытащить глючный диск и поставить на его место новый, а потом контроллер сам проведет ребилд, так?
в противном случае инициализировать Rebuild из программы
управления. И не забыть сделать buck up данных, ДО
замены диска.
-
- member
- Сообщения: 30
- Зарегистрирован: 30 янв 2006, 08:59
- Откуда: Москва
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 27 гостей