Intel 5000PSL + Intel SC5400BRP. Периодический шум

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Intel 5000PSL + Intel SC5400BRP. Периодический шум

Сообщение Rendalina » 04 окт 2007, 18:57

Периодически начинают очень шумно работать вентиляторы в корпусе - 4 штуки.  В БИОСе стоит Acoustic.

Конфигурация сервера:
2*Intel Xeon E5335 (Clovertown) 2GHz 8MB cache

Intel "Star Lake" 5000P 2*Socket 771 LGA FSB1333/1066/667 8*DDR2 667/533 ECC FBDIMM (up to 32GB) Video S-ATAII 2*LAN Gigabit USB2.0 PCI-Express 4-port SAS S5000PLSAS

2* Fujitsu AL9LX 73GB SAS rpm 15000 Cache 8 MB MAX3073RC +
Объединительная панель Intel 6-drive SAS/SATA backplane with expander for SC5400 and SC5299 AXX6DRV3GEXP

2*Qimonda FBDIMM DDR2-667 2GB PC2-5300 ECC HYS72T256420HF

Корпус Intel Server Chassis with optional redudant power SC5400BRP
+ Intel 830W Redundant Power Supply for SC5400BRP/SC5400LX FXX830WPSU
+ Набор вентиляторов Intel SC5400 Hot-swap Fan kit to upgrade SC5400BRP to SC5400LX

ОС Windows Server 2003 Standart.

Интелловская софтина, шедшая с сервером (ASM вроде) ругается на критическое значение датчика IPMI, конкретно на Front Panel Temperature, якобы она 63 градуса Цельсия при пороговой 44. Причем показывает значения 60-63 градуса, даже если сервер перед этим был несколько часов отключен.

Причем раньше иногда сервер работал тихо, как обычный комп (причем, если не ошибаюсь, и с Performance и с Acoustic). Показатель Front Panel Temp говорил что-то вроде 0 градусов, нет доступа к датчику. Потом после перезагрузки иногда опять шумел, потом опять затихал. Шуметь начинал обычно после открытия корпуса или выключения питания (однажды нечаянно выдернули шнур).
Последний (текущий) раз начал шуметь когда в офисе выключили свет на 2 часа и с тех пор не прекращает.
Пороговые значения в этой программе задаются только для свободного места на диске и вроде файла подкачки, для температуры не задаются, в БИОСе они тоже не задаются.

Загрузилась с диска, шедшего с сервером, обновила с сайта Intel'а BIOS  и FRUSDR. В итоге стало:
BIOS 0079
BMC 0.59
FRUSDR 43
IPMI Vers 2.0

Не помогло. На сайте Интела есть еще какие-то zip-архивы вроде для конкретной связки мать + корпус, но у них сайтом случилось что-то нехорошее и скачать вообще ничего не могу.

Ввиду того, что сервер периодически работал тихо, я что-то начала сомневаться есть ли такой датчик (Front Panel Temperature) вообще? Если есть, то нельзя ли его как-нибудь отключить или изменить критическое значение?

Может где-то еще есть драйвера с сайта Интела?

Добавление:
Сайт Интелла сейчас ожил. Попробую завтра на работе ещё поэкспериментировать

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Сообщение Tert » 05 окт 2007, 14:54

Rendalina
Последняя связка BIOS/BMC/FRU на сайте имеет версии 81/59/43 соответственно. Ее и прошивайте. Кроме того, при обновлении FRU/SDR проследите за правильным указанием типа корпуса.
Ну и заодно переткните шлейф, идущий от передней панели к материнской плате и проверьте правильность подключения вентиляторов  к этой же плате.

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Сообщение Rendalina » 05 окт 2007, 17:31

Tert
Хорошо, спасибо, завтра с утра попробую. Надеюсь, получится.  :)

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Сообщение Rendalina » 07 окт 2007, 16:50

Обновили BIOS до 81. Потом заново поочередно обновили FRUSDR, BMC и BIOS. Тип корпуса выбирали SC5400BRP, 2 доп. вентилятора. Фаны вроде подключены нормально. Все шлейфы подёргала. Ничего не изменилось. Шумит всё также.

Active System Console ругается на датчик Front Panel Temp. Показывает 55 градусов Цельсия при порогом значении для этого показателя 44 градуса. При этом в помещении субъективно холодно, но точно температуру, к сожалению, определить не могу.

Когда нажимаешь на кнопку включения, то сразу очень шумно. Через пару секунд шум стихает. Потом секунд через 10 шум опять скачком нарастает и уже не прекращается.

Есть ли там вообще этот датчик (Front Panel Temp)? Можно ли для него установить другой порог срабатывания или сделать так, чтобы система на него не реагировала?

and3008
Заслуженный сетевик
Сообщения: 1109
Зарегистрирован: 03 янв 2004, 23:30
Откуда: Н.Новгород

Сообщение and3008 » 07 окт 2007, 19:42

При включении вентиляторы у всех молотят на максимум. Это все потому, что то, что ими управляет еще не включилось. Через несколько секунд (а иногда и минут) нужный софт просыпается и начинает рулить. Тогда и обороты обычно падают.

Попробуйте другой корпус. У меня тоже самое было.

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Сообщение Rendalina » 08 окт 2007, 03:28

and3008 писал(а):Попробуйте другой корпус. У меня тоже самое было.
К сожалению, такой возможности нет.  :(

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Сообщение Oleg2 » 08 окт 2007, 11:21

Rendalina писал(а):
and3008 писал(а):Попробуйте другой корпус. У меня тоже самое было.
К сожалению, такой возможности нет.  :(
Сохраните, пожалуйста, аппаратный лог BMC в файл и выложите его сюда. Сохранить лог можно при помощи вот этой утилиты.

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Сообщение Rendalina » 08 окт 2007, 12:24

Oleg2 писал(а): Сохраните, пожалуйста, аппаратный лог BMC в файл и выложите его сюда.
Хорошо, сейчас попробую.  :)

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Сообщение Rendalina » 08 окт 2007, 15:00

Лог BMC прикреплен.

У нас небольшая организация, серверной нету.  Честно говоря, даже кондиционера нету. :( . Пишем служебку на сплит-систему. Серверная нам не грозит.

В файле screen.jpg Front Panel Temp 47 градусов (упала с 60-63). Достигнуто открывание окон, снятием обоих крышек, приставлением вентилятора.

Смущает же меня разница температур - Front Panel Temp, которая гораздо выше нормы, в то время как Baseboard Temp и 6HDD Temp ниже номинальных значений.

Такая разница температур - нормальное явление, так и должно быть и надо срочно ставить сплит-систему? Или температуры должны быть около номинального значения и у нас с датчиком какие-то неполадки?


Прикрепленные файлы:
log.sel - лог ВМС
log.zip - то же самое в архиве
screen.jpg - показания Active System Console
Вложения
log.zip
Лог BMC в архиве
(22.7 КБ) 477 скачиваний
Screen.JPG
Показания Active System Console
(156.09 КБ) 273 скачивания
LOG.TXT
Лог ВМС в текстовом формате
(559.14 КБ) 849 скачиваний

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Сообщение Oleg2 » 08 окт 2007, 16:39

Rendalina писал(а):Лог BMC прикреплен.

У нас небольшая организация, серверной нету.  Честно говоря, даже кондиционера нету. :( . Пишем служебку на сплит-систему. Серверная нам не грозит.

В файле screen.jpg Front Panel Temp 47 градусов (упала с 60-63). Достигнуто открывание окон, снятием обоих крышек, приставлением вентилятора.

Смущает же меня разница температур - Front Panel Temp, которая гораздо выше нормы, в то время как Baseboard Temp и 6HDD Temp ниже номинальных значений.

Такая разница температур - нормальное явление, так и должно быть и надо срочно ставить сплит-систему? Или температуры должны быть около номинального значения и у нас с датчиком какие-то неполадки?


Прикрепленные файлы:
log.sel - лог ВМС
log.zip - то же самое в архиве
screen.jpg - показания Active System Console
Сильное ощущение, что у Вас накрылся датчик температуры на плате передней панели.  Либо его показания неверно интерпретируются BMC контроллером. В этом случае нужно обновить весь комплект прошивок для материнской платы. Последний набор софта для S5000PSL можно скачать здесь
Только сначала обязательно прочтите release notes, там описана правильная последовательность действий при прошивке.

Для борьбы с датчиком имеет смысл проверить кабели (вытащить/ вставить из разъёма как на материнской плате, так и на плате передней панели). Если не поможет - заказать на замену подменную плату передней панели для корпусв SC5400. Если гарантия на корпус не истекла, то это легко делается партнёром Интела через процедуру AWR. Платка крепится тремя винтами и меняется за пару минут.

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Сообщение Rendalina » 08 окт 2007, 17:02

Oleg2 писал(а): Сильное ощущение, что у Вас накрылся датчик температуры на плате передней панели.  Либо его показания неверно интерпретируются BMC контроллером. В этом случае нужно обновить весь комплект прошивок для материнской платы.
Ясно. В принципе, я это и подозревала. Завтра с утра попробую заново накатить все прошивки. Может, и поможет. Датчик, может, и заработает, так как он реагирует на изменение температуры - откроешь окно - темпрература снижается, поставишь вентилятор - ещё снижается, уберёшь вентилятор - повышается...  :wink:
Oleg2 писал(а): Для борьбы с датчиком имеет смысл проверить кабели (вытащить/ вставить из разъёма как на материнской плате, так и на плате передней панели).
Сервер на гарантии. Разъёмы опломбированы. В компании, в которой мы его брали, сказали, что такой шум - это нормально - у нас просто в помещении высокая температура и надо делать серверную. Хотя он при такой же температуре иногда работал тихо.

Если не поможет обновление прошивок, будем звонить в компанию, где брали сервер и доказывать им свою правоту. И это при том, что обратились в одну из самых серьёзных организаций города.  :(

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Сообщение Oleg2 » 08 окт 2007, 18:49

Rendalina писал(а):
Oleg2 писал(а): Сильное ощущение, что у Вас накрылся датчик температуры на плате передней панели.  Либо его показания неверно интерпретируются BMC контроллером. В этом случае нужно обновить весь комплект прошивок для материнской платы.
Ясно. В принципе, я это и подозревала. Завтра с утра попробую заново накатить все прошивки. Может, и поможет. Датчик, может, и заработает, так как он реагирует на изменение температуры - откроешь окно - темпрература снижается, поставишь вентилятор - ещё снижается, уберёшь вентилятор - повышается...  :wink:
Oleg2 писал(а): Для борьбы с датчиком имеет смысл проверить кабели (вытащить/ вставить из разъёма как на материнской плате, так и на плате передней панели).
Сервер на гарантии. Разъёмы опломбированы. В компании, в которой мы его брали, сказали, что такой шум - это нормально - у нас просто в помещении высокая температура и надо делать серверную. Хотя он при такой же температуре иногда работал тихо.

Если не поможет обновление прошивок, будем звонить в компанию, где брали сервер и доказывать им свою правоту. И это при том, что обратились в одну из самых серьёзных организаций города.  :(

Если корпус опломбирован, то обновлять прошивки сервера бессмысленно. Любое обновление на интеловских серверных платформах требует в обязательном порядке выполнять очистку NVRAM перемычкой, которая находится на материнской плате.
Если Вы не можете сами правильно обновить прошивки сервера, то пусть это делает поставщик, в порядке гарантийного обслуживания.

По поводу доказательств правоты, я считаю, что Вам достаточно отправить в эту фирму файлы, которые Вы выложили на форуме в этой теме. Для любого грамотного сервисного инженера это повод начать разбираться с железом.

Удачи Вам.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 08 окт 2007, 18:52

Да и пломбирование - само по себе дурной тон...

Rendalina
Junior member
Сообщения: 14
Зарегистрирован: 04 окт 2007, 17:09
Откуда: Улан-Удэ

Сообщение Rendalina » 09 окт 2007, 03:21

Oleg2 писал(а): Если корпус опломбирован
Нет, сам корпус там не опломбирован. Я говорила о разъёмах, в частности шлейфа передней панели (в том смысле, что разъём от передней панели нельзя вытащить и назад вставить).
Oleg2 писал(а): Удачи Вам.
Спасибо.

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Сообщение Oleg2 » 09 окт 2007, 13:17

Нет, сам корпус там не опломбирован. Я говорила о разъёмах, в частности шлейфа передней панели (в том смысле, что разъём от передней панели нельзя вытащить и назад вставить).
Тогда однозначно нужно обращаться к поставщику.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 29 гостей