Hardware Malfunction. Не отвечает RAID на Intel SRCU41L

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Аватара пользователя
Odavid
Advanced member
Сообщения: 110
Зарегистрирован: 21 мар 2007, 17:23
Откуда: Нижний Новгород

Hardware Malfunction. Не отвечает RAID на Intel SRCU41L

Сообщение Odavid » 14 ноя 2007, 11:54

Мат.плата S500VSA.
HDD - 4 Seagate ST373455LC SCSI
Модель контроллера Intel SRCU41L SCSI
Был RAID5 на 4 дисках.
Драйвера RAID взяты из поставки на диске для контроллера Intel SRCU41L последней версии: Microsoft Windows* 2003 and XP 5.49-00, Microsoft Windows* 2000 6.45.2.32.
Сервер проработал 4,5 месяца. Недавно самопроизвольно внезапно выключился.
При попытке запуска ОС Windows Server 2003 Enterprise Edition появился синий экран с  ошибкой:

*** Hardware Malfunction
Call your hardware vendor for support
*** The system has halted ***

Настройки BIOS были сброшены в default.
После пересобирания RAID-массива (предыдущий RAID сброшен и установлен заново RAID5) была произведена попытка повторной установки Windows Server 2003. Драйвер RAID-контроллера SCSI был установлен и жесткие диски, объединенные в RAID-массив, были распознаны инсталлятором.
После начала форматирования процесс проходит 10-15% и выскакивает синий экран с той же ошибкой:
*** Hardware Malfunction
Call your hardware vendor for support
*** The system has halted ***

Подозрение, что вышел из строя RAID-контроллер.
Хотелось бы узнать мнение специалистов Тринити.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 14 ноя 2007, 13:58

Что в логах матери ?
Память memtest'ом проверяли ?

Аватара пользователя
Odavid
Advanced member
Сообщения: 110
Зарегистрирован: 21 мар 2007, 17:23
Откуда: Нижний Новгород

Сообщение Odavid » 14 ноя 2007, 14:25

Логи, чесно говоря, посмотреть не знаю где.
Платы для нас новые, не объезженные. Подскажите, где - посмотрю.

Memtest запускался, ничего не выявил. Да и битая память как то здесь не просматривается.
Официальное описание ошибки Microsoft - критическая ошибка, обнаруженная при проверке процессором.
А на корпусеSC5299DP мигает индикатор красным - критическая ошибка, падение напряжения или отказ вентилятора.
Так что на память думается в самую последнюю очередь.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 15 ноя 2007, 11:50

В BIOSе можно посмотреть Error Log, если я все правильно помню.
Если на корпусе красный индикатор мигает - неисправность железа.
Кстати. BIOS, BMC, FRU/SDR на маме обновлены, в соответствии с инструкцией ?

Аватара пользователя
Odavid
Advanced member
Сообщения: 110
Зарегистрирован: 21 мар 2007, 17:23
Откуда: Нижний Новгород

Сообщение Odavid » 19 ноя 2007, 16:56

BIOS v08.00.10
Но прошивка здесь нипричем, я думаю - сервер был собран и работал 4 месяца.
На тот момент все прошивки и драйвера были актуальные.
Error Log в BIOS не нашел. SELVIEW тоже не смотрит такую плату. Подскажите, где искать лог, если он есть?
А в соответствии с какой инструкцией их надо было обновлять?
Да и обновлять не можем - сервер на гарантии.
А причину указать надо.

Аватара пользователя
Odavid
Advanced member
Сообщения: 110
Зарегистрирован: 21 мар 2007, 17:23
Откуда: Нижний Новгород

Сообщение Odavid » 03 дек 2007, 08:48

Сервер отвозили в ремонт.
После ремонта заменили SRCU41L на SRCU42X, двухканальный. Вроде как поменяли матплату на аналогичную (со слов сервиса).
Заменили один SCSI-диск (говорят, был нерабочий).
Протестировали 3 дня - все у них в ремонте работало.
Привезли к нам обратно.
Поставил RAID0 на первый диск (порт 0), RAID5 - на 3 оставшихся.
RAID0 отвалился через полдня, причем disk failed - отказ диска, как будто его физически вытащили.

Потом долгое время инсталлятор Windows не мог определить диски.
Причем картина следующая:
POST тест RAID-контроллер - все диски видит, оба RAID'а (0 и 5);
POST BIOS определяет 2 логических диска (т.е. оба рэйда для BIOS видны и рабочие);
Ставим Windows 2003 -> инсталлятор требует драйвер -> подгружаем драйвер SRCU42X с дискеты -> драйвер ставится, Windows его схватывает, дает добро на продолжение, следуем к выбору раздела установки на HDD -> и тут сообщает, что жестких дисков нет ни одного. И так раз 5-6 подряд.
Наконец, очередной раз переделал заново - вдруг заработал (!). При этом забыл нажать F6, Windows пролетела все этапы и нашла драйвер самостоятельно, предложив ставить на вновь обретенный диск С.
Я конечно не поверил, переконфигурировал RAID заново и попробовал еще раз.
Однако ж теперь Windows диски увидел, поставился, день проработал.

Далее сервер постоял день выключенным - при включении опять RAID0 отвалился.
Теперь только одно объяснение осталось - порт 0 в корзине работает после прогрева, да и то с трудом.
А возможно, и вся корзина битая.
Модель - AXX6DRV3G.
Может такое быть? Или все-таки южный мост на плате не работает (хоть плату вроде как заменили, в этом не совсем уверен - документов не прислали...)?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 03 дек 2007, 12:44

Я таки не понимаю, что Вы паритесь.
Вот это все изложите на бумаге и отправьте ее в сервис, вместе с железкой. Пусть разбираются до победного конца.

Аватара пользователя
Odavid
Advanced member
Сообщения: 110
Зарегистрирован: 21 мар 2007, 17:23
Откуда: Нижний Новгород

Сообщение Odavid » 04 дек 2007, 09:13

Я таки понимаю, что в сервисе не больше нашего знают ;)
А случай уже не первый, вот и приходится разбираться.
И начальство требует "диагностику причины". Чтобы отправить в сервис и сказать там: "вот эта штука у нас погорела - замените!" :)

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Сообщение Tert » 04 дек 2007, 14:09

Odavid
Ничего не понятно. Если у вас SCSI диски, то почему стоит корзина под SAS диски?

Аватара пользователя
Odavid
Advanced member
Сообщения: 110
Зарегистрирован: 21 мар 2007, 17:23
Откуда: Нижний Новгород

Сообщение Odavid » 05 дек 2007, 14:48

вы правы, конечно модель AXX6DRV3G - это SATA.
А на том AXX6SCSIDB - SCSI.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 21 гость