Срочный ХЕЛП! Сервер INTEL

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Аватара пользователя
Marvik
Advanced member
Сообщения: 55
Зарегистрирован: 22 фев 2006, 22:22
Откуда: Новороссийск
Контактная информация:

Срочный ХЕЛП! Сервер INTEL

Сообщение Marvik » 26 мар 2006, 13:15

Сервер Intel SE7501WV2, raid контроллер LSI MegaRAID SCSI 320-1, rad5 hot spares, загорелись сразу три диска оранжквыми лампочками, при загрузке написал:
1 Logical Drives found on the host adapter
1 Logical Drives failed
Unresolved configuration mismatch between disk(s) and NVRAM on the adapter
1 Logical Drives handles by BIOS
Что делать, чтобы ничего не потерять?!

The1st
member
Сообщения: 22
Зарегистрирован: 30 окт 2003, 01:15
Откуда: Spb
Контактная информация:

Re: Срочный ХЕЛП! Сервер INTEL

Сообщение The1st » 27 мар 2006, 01:04

Marvik писал(а):Сервер Intel SE7501WV2, raid контроллер LSI MegaRAID SCSI 320-1, rad5 hot spares, загорелись сразу три диска оранжквыми лампочками, при загрузке написал:
1 Logical Drives found on the host adapter
1 Logical Drives failed
Unresolved configuration mismatch between disk(s) and NVRAM on the adapter
1 Logical Drives handles by BIOS
Что делать, чтобы ничего не потерять?!
Самое главное - успокоится и осознать, что данных уже БОЛЬШЕ НЕТ. Ибо массив развалился.  А все что может противоречить этому факту и поможет оживит массив - воспринимать как подарок судьбы.. (Именно такие вот "подарки" на таком же 320-1 я регулярно получал 3 последних месяца, пока наконец не поменял глючивший контроллер.)

Основных вариантов произошедшего несколько. Например:
1 - глюкнувший контроллер с потекшим NVRAMoм и как следствие живые винты просто опущены в оф-лайн . Наблюдал такое сам периодически.
2 - всякие там "SCSI bus error", "unit CRC error" в результате которых возможен временный отвал винтов, перегрузка сервака и переход к п.1 .  Напр. один сдыхающий винт может утянуть с собой во временный "dead" еще несколько.
3 - физический дефект сразу 3-х винтов. Очень маловероятно, но кто знает.. ?

Решение:
Т.к. в случае физического отказа винтов (п.3) данные восстановить невозможно (экономически нецелесообразно), то
- при возможности "отвалившиеся" винты проверяются на работоспособность на простом SCSI-адаптере (исключаем п.3)
- аккуратно проверяем все подключения кабелей (наука о контактах :))
- берем бумажку с записанной кофигурацией массива/дисков (или напрягаем память)
- принимаем допущения что 2 диска отвалились одновременно и авторебилд не запускался
- выбираем один из 2-х отавлившихся дисков массива, проверяем свою удачу :)
- поднимаем его в он-лайн
- грузим сервак.

Загрузился  - ставим свечку, делаем бекап, разбираемся с дисками/контроллером по-полной. Не получилось - все правильно, массив оказался разрушенным фактически, как и следовало ожидать. Тоже  разбираемся с дисками/контроллером по-полной , достаем бекап и восстанавливаем систему/данные.
/Vladislav

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 27 мар 2006, 12:56

The1st
Самое главное - успокоится и осознать, что данных уже БОЛЬШЕ НЕТ. Ибо массив развалился.
С чего бы это ???  :shock:
Крыша у контроллера съехала -эт да, но это лечится крайне просто: скидываются шлейфы (диски должны быть физисски отключены от контроллера), затем Clear Configuration.
Затем подцепить винты обратно - конфиг должен подхватиться.
Причина - скорее всего или что-то со шлейфом/корзиной, или навернуло сервер по питанию.
Почти однозначно диски живы - одновременная смерть всех трех винтов по вероятности равна встрече с инопланетянином на улице :gigi:

Аватара пользователя
Marvik
Advanced member
Сообщения: 55
Зарегистрирован: 22 фев 2006, 22:22
Откуда: Новороссийск
Контактная информация:

Сообщение Marvik » 27 мар 2006, 14:09

Вот этот ответ мне больше нравитс :wink: , я в темах видел такой совет, но не решался пока. А вот вопрос, контроллер менять надо потом или вообще в принципе?

The1st
member
Сообщения: 22
Зарегистрирован: 30 окт 2003, 01:15
Откуда: Spb
Контактная информация:

Сообщение The1st » 27 мар 2006, 15:29

a_shats писал(а):The1st
Самое главное - успокоится и осознать, что данных уже БОЛЬШЕ НЕТ. Ибо массив развалился.
С чего бы это ???  :shock:
"Надейся на лучшее, а готовься к худшему" (с)
Данная ситуация - отнюдь не штатная, и нужно изначально осознавать возможные последствия. Я ж не призывал все разбить молотком и поставить новое :))
/Vladislav

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 27 мар 2006, 15:38

Контроллер менять надо только если есть однозначный диагноз :)
Если он живой - зачем его менять ?

Аватара пользователя
Marvik
Advanced member
Сообщения: 55
Зарегистрирован: 22 фев 2006, 22:22
Откуда: Новороссийск
Контактная информация:

Сообщение Marvik » 27 мар 2006, 15:42

Самое важное - это информация, пусть хорошая или плохая, есть над чем подумать. Спасибо всем откликнувшимся на мой хелп.

Аватара пользователя
Marvik
Advanced member
Сообщения: 55
Зарегистрирован: 22 фев 2006, 22:22
Откуда: Новороссийск
Контактная информация:

Сообщение Marvik » 27 мар 2006, 15:46

a_shats писал(а):Контроллер менять надо только если есть однозначный диагноз :)
Если он живой - зачем его менять ?
Т.е. если всё заработает, то ничего не трогать (ждать когда он ещё чего выкинет), как протестировать контроллер? Есть необходимость обновлять прошивку контроллера?
a_shats писал(а):скидываются шлейфы (диски должны быть физисски отключены от контроллера), затем Clear Configuration.
Затем подцепить винты обратно - конфиг должен подхватиться
FastInit отключать?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 27 мар 2006, 16:35

Т.е. если всё заработает, то ничего не трогать (ждать когда он ещё чего выкинет), как протестировать контроллер? Есть необходимость обновлять прошивку контроллера?
К прошивке есть рид-ми, если там содержатсяс проблемы, похожие на те, которые Вы наблюдали, то имеет смысл обновить прошивку. Также, имеет смысл проверить диски. А главное, что надо сделать, после того как все как-то наладится - купить софт и оборудование для резервного копирования, все настроить и поддерживать в рабочем состоянии.

abc
Advanced member
Сообщения: 207
Зарегистрирован: 24 ноя 2003, 14:01
Откуда: Москва

Сообщение abc » 27 мар 2006, 20:22

Проверьте еще версию firmware дисков, возможно надо обновить. У меня этот контроллер с ST336607LC дважды намертво вставал без видимых причин.

Аватара пользователя
Marvik
Advanced member
Сообщения: 55
Зарегистрирован: 22 фев 2006, 22:22
Откуда: Новороссийск
Контактная информация:

Сообщение Marvik » 27 мар 2006, 21:31

abc писал(а):У меня этот контроллер с ST336607LC дважды намертво вставал без видимых причин.
Кстати, у меня такие-же диски, если можно подробней, а вообще сервер работал без проблем почти два года не выключаясь и что могло случиться, наверное устал :)

Аватара пользователя
Marvik
Advanced member
Сообщения: 55
Зарегистрирован: 22 фев 2006, 22:22
Откуда: Новороссийск
Контактная информация:

Сообщение Marvik » 28 мар 2006, 09:22

Boot Failure System Halted  :( , это конец?
:)  Нет, не конец!!!
Подскажите действия перед/после update FW контроллера LSI MegaRAID SCSI 320-1

abc
Advanced member
Сообщения: 207
Зарегистрирован: 24 ноя 2003, 14:01
Откуда: Москва

Сообщение abc » 29 мар 2006, 18:10

Про зависание, см: http://www.seagate.com/support/disc/u320_firmware.html
А вообще-то здесь на форуме про это было... :wink:

Аватара пользователя
Marvik
Advanced member
Сообщения: 55
Зарегистрирован: 22 фев 2006, 22:22
Откуда: Новороссийск
Контактная информация:

Сообщение Marvik » 02 апр 2006, 10:52

Спасибо всем! Всё востановилось, оказался физический глюк в корзине, где-то пропадает контакт. Корзину заменим, ещё на гарантии.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 48 гостей