Hardware Malfunction. Не отвечает RAID на Intel SRCU41L
Модераторы: Trinity admin`s, Free-lance moderator`s
Hardware Malfunction. Не отвечает RAID на Intel SRCU41L
Мат.плата S500VSA.
HDD - 4 Seagate ST373455LC SCSI
Модель контроллера Intel SRCU41L SCSI
Был RAID5 на 4 дисках.
Драйвера RAID взяты из поставки на диске для контроллера Intel SRCU41L последней версии: Microsoft Windows* 2003 and XP 5.49-00, Microsoft Windows* 2000 6.45.2.32.
Сервер проработал 4,5 месяца. Недавно самопроизвольно внезапно выключился.
При попытке запуска ОС Windows Server 2003 Enterprise Edition появился синий экран с ошибкой:
*** Hardware Malfunction
Call your hardware vendor for support
*** The system has halted ***
Настройки BIOS были сброшены в default.
После пересобирания RAID-массива (предыдущий RAID сброшен и установлен заново RAID5) была произведена попытка повторной установки Windows Server 2003. Драйвер RAID-контроллера SCSI был установлен и жесткие диски, объединенные в RAID-массив, были распознаны инсталлятором.
После начала форматирования процесс проходит 10-15% и выскакивает синий экран с той же ошибкой:
*** Hardware Malfunction
Call your hardware vendor for support
*** The system has halted ***
Подозрение, что вышел из строя RAID-контроллер.
Хотелось бы узнать мнение специалистов Тринити.
HDD - 4 Seagate ST373455LC SCSI
Модель контроллера Intel SRCU41L SCSI
Был RAID5 на 4 дисках.
Драйвера RAID взяты из поставки на диске для контроллера Intel SRCU41L последней версии: Microsoft Windows* 2003 and XP 5.49-00, Microsoft Windows* 2000 6.45.2.32.
Сервер проработал 4,5 месяца. Недавно самопроизвольно внезапно выключился.
При попытке запуска ОС Windows Server 2003 Enterprise Edition появился синий экран с ошибкой:
*** Hardware Malfunction
Call your hardware vendor for support
*** The system has halted ***
Настройки BIOS были сброшены в default.
После пересобирания RAID-массива (предыдущий RAID сброшен и установлен заново RAID5) была произведена попытка повторной установки Windows Server 2003. Драйвер RAID-контроллера SCSI был установлен и жесткие диски, объединенные в RAID-массив, были распознаны инсталлятором.
После начала форматирования процесс проходит 10-15% и выскакивает синий экран с той же ошибкой:
*** Hardware Malfunction
Call your hardware vendor for support
*** The system has halted ***
Подозрение, что вышел из строя RAID-контроллер.
Хотелось бы узнать мнение специалистов Тринити.
Логи, чесно говоря, посмотреть не знаю где.
Платы для нас новые, не объезженные. Подскажите, где - посмотрю.
Memtest запускался, ничего не выявил. Да и битая память как то здесь не просматривается.
Официальное описание ошибки Microsoft - критическая ошибка, обнаруженная при проверке процессором.
А на корпусеSC5299DP мигает индикатор красным - критическая ошибка, падение напряжения или отказ вентилятора.
Так что на память думается в самую последнюю очередь.
Платы для нас новые, не объезженные. Подскажите, где - посмотрю.
Memtest запускался, ничего не выявил. Да и битая память как то здесь не просматривается.
Официальное описание ошибки Microsoft - критическая ошибка, обнаруженная при проверке процессором.
А на корпусеSC5299DP мигает индикатор красным - критическая ошибка, падение напряжения или отказ вентилятора.
Так что на память думается в самую последнюю очередь.
BIOS v08.00.10
Но прошивка здесь нипричем, я думаю - сервер был собран и работал 4 месяца.
На тот момент все прошивки и драйвера были актуальные.
Error Log в BIOS не нашел. SELVIEW тоже не смотрит такую плату. Подскажите, где искать лог, если он есть?
А в соответствии с какой инструкцией их надо было обновлять?
Да и обновлять не можем - сервер на гарантии.
А причину указать надо.
Но прошивка здесь нипричем, я думаю - сервер был собран и работал 4 месяца.
На тот момент все прошивки и драйвера были актуальные.
Error Log в BIOS не нашел. SELVIEW тоже не смотрит такую плату. Подскажите, где искать лог, если он есть?
А в соответствии с какой инструкцией их надо было обновлять?
Да и обновлять не можем - сервер на гарантии.
А причину указать надо.
Сервер отвозили в ремонт.
После ремонта заменили SRCU41L на SRCU42X, двухканальный. Вроде как поменяли матплату на аналогичную (со слов сервиса).
Заменили один SCSI-диск (говорят, был нерабочий).
Протестировали 3 дня - все у них в ремонте работало.
Привезли к нам обратно.
Поставил RAID0 на первый диск (порт 0), RAID5 - на 3 оставшихся.
RAID0 отвалился через полдня, причем disk failed - отказ диска, как будто его физически вытащили.
Потом долгое время инсталлятор Windows не мог определить диски.
Причем картина следующая:
POST тест RAID-контроллер - все диски видит, оба RAID'а (0 и 5);
POST BIOS определяет 2 логических диска (т.е. оба рэйда для BIOS видны и рабочие);
Ставим Windows 2003 -> инсталлятор требует драйвер -> подгружаем драйвер SRCU42X с дискеты -> драйвер ставится, Windows его схватывает, дает добро на продолжение, следуем к выбору раздела установки на HDD -> и тут сообщает, что жестких дисков нет ни одного. И так раз 5-6 подряд.
Наконец, очередной раз переделал заново - вдруг заработал (!). При этом забыл нажать F6, Windows пролетела все этапы и нашла драйвер самостоятельно, предложив ставить на вновь обретенный диск С.
Я конечно не поверил, переконфигурировал RAID заново и попробовал еще раз.
Однако ж теперь Windows диски увидел, поставился, день проработал.
Далее сервер постоял день выключенным - при включении опять RAID0 отвалился.
Теперь только одно объяснение осталось - порт 0 в корзине работает после прогрева, да и то с трудом.
А возможно, и вся корзина битая.
Модель - AXX6DRV3G.
Может такое быть? Или все-таки южный мост на плате не работает (хоть плату вроде как заменили, в этом не совсем уверен - документов не прислали...)?
После ремонта заменили SRCU41L на SRCU42X, двухканальный. Вроде как поменяли матплату на аналогичную (со слов сервиса).
Заменили один SCSI-диск (говорят, был нерабочий).
Протестировали 3 дня - все у них в ремонте работало.
Привезли к нам обратно.
Поставил RAID0 на первый диск (порт 0), RAID5 - на 3 оставшихся.
RAID0 отвалился через полдня, причем disk failed - отказ диска, как будто его физически вытащили.
Потом долгое время инсталлятор Windows не мог определить диски.
Причем картина следующая:
POST тест RAID-контроллер - все диски видит, оба RAID'а (0 и 5);
POST BIOS определяет 2 логических диска (т.е. оба рэйда для BIOS видны и рабочие);
Ставим Windows 2003 -> инсталлятор требует драйвер -> подгружаем драйвер SRCU42X с дискеты -> драйвер ставится, Windows его схватывает, дает добро на продолжение, следуем к выбору раздела установки на HDD -> и тут сообщает, что жестких дисков нет ни одного. И так раз 5-6 подряд.
Наконец, очередной раз переделал заново - вдруг заработал (!). При этом забыл нажать F6, Windows пролетела все этапы и нашла драйвер самостоятельно, предложив ставить на вновь обретенный диск С.
Я конечно не поверил, переконфигурировал RAID заново и попробовал еще раз.
Однако ж теперь Windows диски увидел, поставился, день проработал.
Далее сервер постоял день выключенным - при включении опять RAID0 отвалился.
Теперь только одно объяснение осталось - порт 0 в корзине работает после прогрева, да и то с трудом.
А возможно, и вся корзина битая.
Модель - AXX6DRV3G.
Может такое быть? Или все-таки южный мост на плате не работает (хоть плату вроде как заменили, в этом не совсем уверен - документов не прислали...)?
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 21 гость