Вылетел диск на Adaptec5805!!

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Вылетел диск на Adaptec5805!!

Сообщение slooch » 29 мар 2010, 09:56

Здравствуйте!
Есть сервер SuperMicro с контроллером Adaptec5805 и пятью дисками. Создан массив RAID 10 из 4 дисков и 1 диск назначен HotSpare.
На выходных на этот сервер было скопировано большое количество файлов (т.е. вообщем-то была определенная нагрузка), сегодня утром обнаружилось, что сервер "запищал". Запустив программу Adaptec Storage Manager вижу, что массив в состоянии "Degrated", диск который был HotSpare так и обозначен "Hot Spare" и один из дисков что раньше был в массиве, в состоянии "Ready". Но когда я выделяю Logical Device R10, он в списке дисков подсвечивает 4 диска, включая HotSpare.
Мне кажется, что при выходе из строя одного диска в массиве, должен был автоматически подхватиться диск HotSparе, произойти Rebuild на него и массив должен стать в состоянии "Optimal".

Собственно Вопросы: Почему массив Degrated? Почему при этом HotSpare так и остался Hotspare? Почему "отвалившийся" диск в состоянии Ready, как бы вы поступили с ним в данной ситуации (заменять, или потестировать и может оставить)?
Может быть сейчас и идет Rebuild? Где я это могу увидеть?

Заранее большое спасибо всем кто ответит, вопрос очень актуальный, с сервером сейчас как раз начали работать люди, а тут такое :(
Изображение

slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение slooch » 29 мар 2010, 12:16

Жаль что никто не может ответить :(
Я сейчас в течении рабочего дня не могу перезагрузить сервак и зайти в настройку RAID при инициализации системы, поэтому могу работать только с "Adaptec Storage Manager". Может быть там руками можно запустить Rebuild или как лучше поступить? Я не нашел соответствующего пункта в меню программы.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение exLH » 29 мар 2010, 14:40

Если сервер наш, то пришлите в поддержку support-archive. Если не наш, то выложите его сюда. Картинки это красиво, но абсолютно не информативно.
Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598

slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение slooch » 29 мар 2010, 15:41

К сожалению этот сервер не ваш.
По картинкам я так понимаю, что Device1 отвалился, он вероятно был в зеркале с Device 3, который сейчас ребилдится на HS. Сходил в серверную посмотрел на сервак - лампочками HDD он актиано не моргает, т.е. есть сомнения насчет того, что в данный момент идет ребилд.
Это очень плохо, если я перегружу сервак пока идет Rebuild?
Вложения
Support.zip
(243.78 КБ) 800 скачиваний

slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение slooch » 29 мар 2010, 16:33

exLH
Из вашего сообщения узнал, что есть такая вещь как "support-archive".
Сделал, посмотрел что там есть. Судя по логам, первый раз была какая-то неполадка с диском еще в феврале, тогда все отребилдилось на HS, а теперь похоже еще один винт накрылся, вот контроллер и запищал :(

Теперь планирую сделать так:
1. Сделать полный Бэкап
2. Device 1, который в состоянии Ready, пометить как HS (вероятно после этого на него сразу пойдет Rebuild)

А там посмотрю как он себя поведет и дальше буду думать.
А вообще как-то неприятно, что винты отваливаются, оборудованию и полугода нет :(

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение exLH » 29 мар 2010, 16:42

1. Очень старая прошивка - в новых версиях было много исправлений
2. Физические ошибки на двух дисках (в частности на диске 9QJ5E1FX - этот еще в массиве со статусом impacted)

Сделайте бэкап.
Диск, который Ready как минимум неплохо бы проверить на обычном контроллере при помощи seatools.
И уже после этого поставить в сервер (по результатам проверки).
Оборудованию полугода нет, а прошивке на контроллере уже два года. Привет поставщикам оборудования...
Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598

slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение slooch » 29 мар 2010, 18:10

Огромное спасибо за советы, ну и на всякий случай хочу уточнить, на Adaptec5805 я могу выдергивать /вставлять винт в корзину не останавливая работу сервера, т.е. горячая замена на нем есть, да?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение exLH » 29 мар 2010, 18:19

slooch писал(а):т.е. горячая замена на нем есть, да?
В существенной мере это зависит и от корзины. Так как в выложенном конфиге интеллект корзины замечен не был, то рекомендуется сделать рескан после выдергивания диска и рескан после вставления обратно.
Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598

slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение slooch » 31 мар 2010, 11:17

Дальше все получилось так:
- Сделал полный Бэкап.
- Раздобыл еще один диск, такой же как диски в массиве.
- Воткнул диск
- Перегрузил Сервак
- Зашел в БИОС рэйда, назначил новый диск как HS
- Загрузился в Винду
После перезагрузки автоматически пошел Ребилд, но к моему удивлению не на новый диск (HS), а на "Device 3", который был Degraded.
После окончания ребилда массив наконец-то стал в состоянии OPTIMAL, и мне как-то полегчало :).
Сдернул винт Device 1, который был в состоянии Ready (похоже он еще раньше отвалился от массива), потестирую его.
Картина стала вот такая:
Изображение
Видимо осталось теперь с диска "CN1 Device 0" снять пометку HotSpare, что бы он все же числился обычным членом массива, насколько я понял надо на него нажать правой кнопкой мыши и выбрать "Delete hot-spare drive" ????
Он после этого точно не удалится вообще, а то пугает слово DELETE? :)

Ну и наверное надо повнимательнее наблюдать, может снова отвалится Device 3, раз уже были с ним какие-то приключения.

Огромное спасибо exLH, вы мне очень помогли! :)

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение gs » 31 мар 2010, 11:21

Ребут или рескан дисков в ASM делали после ребилда?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение gs » 31 мар 2010, 11:21

Контроллер прошили?

slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение slooch » 31 мар 2010, 11:54

Нет, после Ребилда ничего не делал.
Предыдущий раз я нажимал "Rescan", когда купил новый HDD, к сожалению сервер от этого крепко повис, и пришлось его перегружать RESETом. Как раз тогда после перезагрузки и пошел Rebuild.
После этого я как-то боюсь нажимать на кнопку "Rescan".

Контроллер еще не прошил, но готовлюсь к этому, скачал прошивку, прочитал в мануале как это делается. Просто думаю, что делать эту процедуру я буду только после Полного Бэкапа, удобнее всего на выходных, когда сервер можно спокойно перезагружать и все такое. Надеюсь, что 1,5 недельки-то он поживет со старой прошивкой, до этого же как-то работал.

slooch
member
Сообщения: 32
Зарегистрирован: 20 ноя 2006, 09:02
Откуда: Санкт-Петербург
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение slooch » 02 апр 2010, 10:34

Оказывается история еще не закончилась :(

Сегодня утром сервер завис, перезагрузил - после инициализации контроллера он написал мне, что-то типа "диск потерян", но после нажатия ENTER написал, что массив OPTIMAL и продолжил грузиться в Windows (при следующих перезагрузках такого не было). К сожалению после загрузки сервер снова крепко висел, т.е. вплодь до того, что никак не нажималось ALT-CTRL-DEL, и в систему было не войти. По сети он при этом пинговался, но удаленно тоже было не войти.
Перегрузился в безопасный режим, удалось войти в Windows, успел заглянуть в системный журнал, там были сообщения от Adaptec : Bad Block discovered: controller 1 (ffee98), потом сервер опять завис :(

После еще одной перезагрузки он нормально запустился и загрузился в Windows.
Заглянул в логи контроллера там вот такие ошибки:
April 1, 2010 7:32:00 PM GMT WRN SRV-2.mkis.su Medium error: controller 1, channel 0, SCSI device ID 3, LUN 0, start LBA 35200, end LBA 353ff, bad block recovery possible

Т.е. он ругается на диск DEVICE 3, который до этого как раз числился сбойным, но на который почему-то произошел ребилд.

Подскажите пожалуйста, как мне быть в этой ситуации?????
Есть желание Выдернуть этот диск, тогда произойдет ребилд на новый HS.
Можно ли прямо в рабочем режиме, когда пользователи работают на сервере, запускать "Консистенси чек", а то есть желание запустить, но не знаю насколько это мне действительно нужно прямо сейчас?

Так никаких нервов не хватит, как на пороховой бочке :( :( :(
Вложения
Support.zip
(248.29 КБ) 760 скачиваний

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: Вылетел диск на Adaptec5805!!

Сообщение exLH » 02 апр 2010, 11:31

Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 9 гостей