Сбой при загрузке сервера

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Аватара пользователя
Satorius
member
Сообщения: 31
Зарегистрирован: 11 фев 2004, 12:01

Сбой при загрузке сервера

Сообщение Satorius » 11 фев 2004, 12:07

Имеется сервер TCM-1000 (Техмаркет) на базе Intel STL2 (BIOS STL20.86B.0021), 768 Mb на борту, SCSI корзина на 5 HDD.
На основе RAID SRCU31 (Bios v6.05B) смонтирован RAID10 из 1 HDD IBM DDYS-T18350N
и 3 HDD IBM IC35L018UCD210.
Один HDD IBM DDYS-T18350N подключен к встроенному AIC-7899 и используется для рез. копирования.
Все это работало год. Неделю назад начались баги.
Во-первых BIOS на маме, при загрузке начал выдавать:
"0BB0: SMBIOS - SROM Data read error
0B81: BMC Firmware Code Area CRC chek failed"
и предлагает F1 для продолжения или F2 для настройки Setup.
Во-вторых, один из винтов в RAID начал работать на скорости 80, в то время как три других на 160.
В третьих, самое интересное, при изьятии RAID платы мать не загружает экран BIOS, никаких сигналов не подает.
Возвращаю RAID наместо в свой слот, BIOS загружается, но выдает описанную выше ошибку.
Вопрос: из-за чего могут быть эти глюки, из-за RAID или сбоя в BIOSе мамы?

P.s. ОС - Win2k server SP4. на самой ОС эти глюки не отразились, т.к. ни производительность (SQL 2000 с
1С предприятием 7.7) ни стабильность не снизились (за исключением того, что сервер не может самостаятельно
перезагрузиться - закрывает все приложения корректно, но "замирает" с черным экраном пока не нажмешь RESET).

Помоги плиз!!!! Сервер один и если он рухнет, то .......

Аватара пользователя
pepz
Power member
Сообщения: 42
Зарегистрирован: 10 июл 2003, 07:19
Откуда: Хабаровск

Сообщение pepz » 12 фев 2004, 04:36

во первых, надо обновить BMC, FRU, BIOS ( темплэйт однако :wink: )
во вторых, проверить память (есть у тупелы стандартная утилита BYO confidence test или же можно взять memtest)
в третьих, скорость скази диска понижается в половину когда контроллер по каким-то причинам не может прочитать данные с него. снижение скорости происходит до тех пор пока данные не прочитаются. так что проверьте кабели терминацию

Аватара пользователя
Satorius
member
Сообщения: 31
Зарегистрирован: 11 фев 2004, 12:01

Сообщение Satorius » 12 фев 2004, 09:13

pepz писал(а):во первых, надо обновить BMC, FRU, BIOS ( темплэйт однако :wink: )
во вторых, проверить память (есть у тупелы стандартная утилита BYO confidence test или же можно взять memtest)
в третьих, скорость скази диска понижается в половину когда контроллер по каким-то причинам не может прочитать данные с него. снижение скорости происходит до тех пор пока данные не прочитаются. так что проверьте кабели терминацию
Память проверил. Утилита BYO (сделал дискету с фирменного диска) не нашла ни одной ошибки.
По новым прошивкам: BIOS мамки обновил до версии STL20.86B.0027.P01.0207171927 STL2 BIOS Release 1.13, BMC обновил на Firmware Version 11.19
Все симптомы прежние!!!
Единственное, что пока не сделал не обновил FRU, но уже скачал новую версию.
Но всетаки очень интересно, почему не загружается BIOS после изъятия платы RAID?

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 12 фев 2004, 11:06

Есть подозрение, что с матерью происходит именно то, что она и говорит ;) , а именно - накрывается или накрылся BMC. Или - сбойнула его фирмварь.
Предлагаю попробовать следующее:
- перепрошить BMC последней прошивкой
- сделать clear CMOS джампером после этого
- Load BIOS Defaults - обязательно.
Если после этого проблема повторится - имхо, надо нести в гарантию.

Аватара пользователя
pepz
Power member
Сообщения: 42
Зарегистрирован: 10 июл 2003, 07:19
Откуда: Хабаровск

Сообщение pepz » 12 фев 2004, 11:07

FRU надо обновлять после BMC. кажется на саппорте по этому поводу написано однозначно. в противном случае возможны глюки...

если BYO ничего не нашла попробуйте memtest - только сделайте загрузочную дискету и с нее запустите. как правило она находит "плохую" память.

Аватара пользователя
Satorius
member
Сообщения: 31
Зарегистрирован: 11 фев 2004, 12:01

Сообщение Satorius » 12 фев 2004, 14:27

Делаю как предлагает Intel:
1. Clear cmos
2. BMC Upgrade
3. BIOS Upgrade
4. FRU/SDR upgrade - и вот как раз в момент перепрошивки FRU сервак виснет наглухо - помогает только RESET :(
Что это?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 18 фев 2004, 15:35

Вот ссылка с интела, возможо, имеющая некоторое отношение к проблеме.
http://www.intel.com/support/motherboar ... prd464.htm

Интересно другое. Был недели две назад сервер на такой же мамке, с точно такими же проблемами, как у Вас. НО решилась проблема не прошивкой, а вылечилось все заменой блока питания. С тех пор пока работает нормально. Блок мы потом смотрели отдельно - с SAI2 вообще отказался стартовать.

Аватара пользователя
Satorius
member
Сообщения: 31
Зарегистрирован: 11 фев 2004, 12:01

Сообщение Satorius » 19 фев 2004, 12:06

exLH писал(а):Вот ссылка с интела, возможо, имеющая некоторое отношение к проблеме.
http://www.intel.com/support/motherboar ... prd464.htm

Интересно другое. Был недели две назад сервер на такой же мамке, с точно такими же проблемами, как у Вас. НО решилась проблема не прошивкой, а вылечилось все заменой блока питания. С тех пор пока работает нормально. Блок мы потом смотрели отдельно - с SAI2 вообще отказался стартовать.
К сожалению :( замена блока питания не помогла. А за ссылку большое спасибо.

Аватара пользователя
Satorius
member
Сообщения: 31
Зарегистрирован: 11 фев 2004, 12:01

Проблема была в кнопке POWER!!!!!!!

Сообщение Satorius » 04 авг 2004, 16:58

Знаете в чем была причина сбоев сервака? Ни в
матери (ее заменили), ни в памяти (тестировали), ни в блоке питания (меняли), а в маленькой злобной кнопке "Power" на лицевой панели. Эта кнопка просто "залипала" и в момент включения сервака вместо кратковременного замыкания была постоянно замкнутой :((( Со временем, после долгого выключения, она возвращалась в норму, но через 1 минуту работы снова барахлила! Все пришло в норму, после замена кнопки power на кнопку reset!!! Теперь питание включаю reset-ом :) и опять же враг какой не сразу догадаеться :) Вот так вот: век живи, а помрешь всеравно дураком, господа админы :)

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 04 авг 2004, 17:06

Гы!
Мы так на сборке с одной машиной трахались. Кнопка ресета просто залипла :)

Аватара пользователя
Kirill Tkachev
Advanced member
Сообщения: 481
Зарегистрирован: 08 июл 2004, 13:37
Откуда: Saint-Petersburg
Контактная информация:

Сообщение Kirill Tkachev » 04 авг 2004, 18:27

:)
Нет повести печальнее на свете,
чем повесть о заклинившем ресете...

Ответить

Вернуться в «Серверы - Решение проблем»