Сбой при загрузке сервера
Модераторы: Trinity admin`s, Free-lance moderator`s
Сбой при загрузке сервера
Имеется сервер TCM-1000 (Техмаркет) на базе Intel STL2 (BIOS STL20.86B.0021), 768 Mb на борту, SCSI корзина на 5 HDD.
На основе RAID SRCU31 (Bios v6.05B) смонтирован RAID10 из 1 HDD IBM DDYS-T18350N
и 3 HDD IBM IC35L018UCD210.
Один HDD IBM DDYS-T18350N подключен к встроенному AIC-7899 и используется для рез. копирования.
Все это работало год. Неделю назад начались баги.
Во-первых BIOS на маме, при загрузке начал выдавать:
"0BB0: SMBIOS - SROM Data read error
0B81: BMC Firmware Code Area CRC chek failed"
и предлагает F1 для продолжения или F2 для настройки Setup.
Во-вторых, один из винтов в RAID начал работать на скорости 80, в то время как три других на 160.
В третьих, самое интересное, при изьятии RAID платы мать не загружает экран BIOS, никаких сигналов не подает.
Возвращаю RAID наместо в свой слот, BIOS загружается, но выдает описанную выше ошибку.
Вопрос: из-за чего могут быть эти глюки, из-за RAID или сбоя в BIOSе мамы?
P.s. ОС - Win2k server SP4. на самой ОС эти глюки не отразились, т.к. ни производительность (SQL 2000 с
1С предприятием 7.7) ни стабильность не снизились (за исключением того, что сервер не может самостаятельно
перезагрузиться - закрывает все приложения корректно, но "замирает" с черным экраном пока не нажмешь RESET).
Помоги плиз!!!! Сервер один и если он рухнет, то .......
На основе RAID SRCU31 (Bios v6.05B) смонтирован RAID10 из 1 HDD IBM DDYS-T18350N
и 3 HDD IBM IC35L018UCD210.
Один HDD IBM DDYS-T18350N подключен к встроенному AIC-7899 и используется для рез. копирования.
Все это работало год. Неделю назад начались баги.
Во-первых BIOS на маме, при загрузке начал выдавать:
"0BB0: SMBIOS - SROM Data read error
0B81: BMC Firmware Code Area CRC chek failed"
и предлагает F1 для продолжения или F2 для настройки Setup.
Во-вторых, один из винтов в RAID начал работать на скорости 80, в то время как три других на 160.
В третьих, самое интересное, при изьятии RAID платы мать не загружает экран BIOS, никаких сигналов не подает.
Возвращаю RAID наместо в свой слот, BIOS загружается, но выдает описанную выше ошибку.
Вопрос: из-за чего могут быть эти глюки, из-за RAID или сбоя в BIOSе мамы?
P.s. ОС - Win2k server SP4. на самой ОС эти глюки не отразились, т.к. ни производительность (SQL 2000 с
1С предприятием 7.7) ни стабильность не снизились (за исключением того, что сервер не может самостаятельно
перезагрузиться - закрывает все приложения корректно, но "замирает" с черным экраном пока не нажмешь RESET).
Помоги плиз!!!! Сервер один и если он рухнет, то .......
во первых, надо обновить BMC, FRU, BIOS ( темплэйт однако )
во вторых, проверить память (есть у тупелы стандартная утилита BYO confidence test или же можно взять memtest)
в третьих, скорость скази диска понижается в половину когда контроллер по каким-то причинам не может прочитать данные с него. снижение скорости происходит до тех пор пока данные не прочитаются. так что проверьте кабели терминацию
во вторых, проверить память (есть у тупелы стандартная утилита BYO confidence test или же можно взять memtest)
в третьих, скорость скази диска понижается в половину когда контроллер по каким-то причинам не может прочитать данные с него. снижение скорости происходит до тех пор пока данные не прочитаются. так что проверьте кабели терминацию
Память проверил. Утилита BYO (сделал дискету с фирменного диска) не нашла ни одной ошибки.pepz писал(а):во первых, надо обновить BMC, FRU, BIOS ( темплэйт однако )
во вторых, проверить память (есть у тупелы стандартная утилита BYO confidence test или же можно взять memtest)
в третьих, скорость скази диска понижается в половину когда контроллер по каким-то причинам не может прочитать данные с него. снижение скорости происходит до тех пор пока данные не прочитаются. так что проверьте кабели терминацию
По новым прошивкам: BIOS мамки обновил до версии STL20.86B.0027.P01.0207171927 STL2 BIOS Release 1.13, BMC обновил на Firmware Version 11.19
Все симптомы прежние!!!
Единственное, что пока не сделал не обновил FRU, но уже скачал новую версию.
Но всетаки очень интересно, почему не загружается BIOS после изъятия платы RAID?
- a_shats
- Advanced member
- Сообщения: 5010
- Зарегистрирован: 27 авг 2002, 10:55
- Откуда: Москва
- Контактная информация:
Есть подозрение, что с матерью происходит именно то, что она и говорит , а именно - накрывается или накрылся BMC. Или - сбойнула его фирмварь.
Предлагаю попробовать следующее:
- перепрошить BMC последней прошивкой
- сделать clear CMOS джампером после этого
- Load BIOS Defaults - обязательно.
Если после этого проблема повторится - имхо, надо нести в гарантию.
Предлагаю попробовать следующее:
- перепрошить BMC последней прошивкой
- сделать clear CMOS джампером после этого
- Load BIOS Defaults - обязательно.
Если после этого проблема повторится - имхо, надо нести в гарантию.
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Вот ссылка с интела, возможо, имеющая некоторое отношение к проблеме.
http://www.intel.com/support/motherboar ... prd464.htm
Интересно другое. Был недели две назад сервер на такой же мамке, с точно такими же проблемами, как у Вас. НО решилась проблема не прошивкой, а вылечилось все заменой блока питания. С тех пор пока работает нормально. Блок мы потом смотрели отдельно - с SAI2 вообще отказался стартовать.
http://www.intel.com/support/motherboar ... prd464.htm
Интересно другое. Был недели две назад сервер на такой же мамке, с точно такими же проблемами, как у Вас. НО решилась проблема не прошивкой, а вылечилось все заменой блока питания. С тех пор пока работает нормально. Блок мы потом смотрели отдельно - с SAI2 вообще отказался стартовать.
К сожалению замена блока питания не помогла. А за ссылку большое спасибо.exLH писал(а):Вот ссылка с интела, возможо, имеющая некоторое отношение к проблеме.
http://www.intel.com/support/motherboar ... prd464.htm
Интересно другое. Был недели две назад сервер на такой же мамке, с точно такими же проблемами, как у Вас. НО решилась проблема не прошивкой, а вылечилось все заменой блока питания. С тех пор пока работает нормально. Блок мы потом смотрели отдельно - с SAI2 вообще отказался стартовать.
Проблема была в кнопке POWER!!!!!!!
Знаете в чем была причина сбоев сервака? Ни в
матери (ее заменили), ни в памяти (тестировали), ни в блоке питания (меняли), а в маленькой злобной кнопке "Power" на лицевой панели. Эта кнопка просто "залипала" и в момент включения сервака вместо кратковременного замыкания была постоянно замкнутой (( Со временем, после долгого выключения, она возвращалась в норму, но через 1 минуту работы снова барахлила! Все пришло в норму, после замена кнопки power на кнопку reset!!! Теперь питание включаю reset-ом и опять же враг какой не сразу догадаеться Вот так вот: век живи, а помрешь всеравно дураком, господа админы
матери (ее заменили), ни в памяти (тестировали), ни в блоке питания (меняли), а в маленькой злобной кнопке "Power" на лицевой панели. Эта кнопка просто "залипала" и в момент включения сервака вместо кратковременного замыкания была постоянно замкнутой (( Со временем, после долгого выключения, она возвращалась в норму, но через 1 минуту работы снова барахлила! Все пришло в норму, после замена кнопки power на кнопку reset!!! Теперь питание включаю reset-ом и опять же враг какой не сразу догадаеться Вот так вот: век живи, а помрешь всеравно дураком, господа админы
- Kirill Tkachev
- Advanced member
- Сообщения: 481
- Зарегистрирован: 08 июл 2004, 13:37
- Откуда: Saint-Petersburg
- Контактная информация:
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя