Перегрев контроллера?

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Strannik
Advanced member
Сообщения: 436
Зарегистрирован: 19 июл 2007, 15:39
Откуда: г. Тосно

Перегрев контроллера?

Сообщение Strannik » 10 янв 2012, 11:37

Всем привет!
Имеется сервер на платформе Supermicro 826 кузов
CPU Xeon E5540
Установлено 12 дисков, Adaptec 5445Z
В праздники выключали питание. Сервера пережили это нормально , а вот кондиционеры в серверной нет.
В один из дней кондиционеры не работали достаточно долго, температура в серверной была высокая, утилиты мониторинга писали об этом. Потом кондиционеры включили и температура стала нормальной о чем тоже утилиты мониторинга сообщили (все кроме одной).
На одном из серверов стоит ASM (последняя версия) до сих пор продолжает слать сообщения о превышеной температуре.
Перезапустил службу ASM - не помогло.
Если зайти в сам ASM то температура контроллера 75 градусов - это нормальная температура для этого контроллера. Температура бэкплайна 37 градусов.
Однако графическая пиктограмма градусника горит красным и ASM шлет события типа

"controller 1, channel 2, enclosure 0 temperature is out of the normal range."

температура в серверной 18 градусов.
Все три вентилятора установленные в сервере работают на частоте 5300 RPM (по данным Aida)

Подскажите , можно ли как то дополнительно выяснить , что случилось
- глючит ASM
- температура на бэкплайне действительно высокая

Заранее спасибо!

LCF_R
Advanced member
Сообщения: 702
Зарегистрирован: 27 сен 2011, 18:12
Откуда: Москва

Re: Перегрев контроллера?

Сообщение LCF_R » 10 янв 2012, 14:00

Мог и термодатчик полететь. 75 градусов - это НЕнормально для данного контроллера. Допустимая температура - это до 55 градусов без батареи и 40 градусов с батареей.
С уважением, Александр.

turboprop
Advanced member
Сообщения: 244
Зарегистрирован: 18 июн 2010, 11:22
Откуда: C.Петербург

Re: Перегрев контроллера?

Сообщение turboprop » 10 янв 2012, 17:25

По-моему, вы ошибаетесь, предельная температура проца 100.
http://ask.adaptec.com/scripts/adaptec_ ... aqid=15345
55 и 40 это максимальная температура окружающей среды.

а очистка лога не помогает?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Перегрев контроллера?

Сообщение gs » 10 янв 2012, 18:00

100 градусов - это критическая, выше уже кирдык.
Так что он шлет уведомлялки на вполне законных основаниях. Только непонятно, откуда такая температура при работающих вентилях. Может их глазами посмотреть?

LCF_R
Advanced member
Сообщения: 702
Зарегистрирован: 27 сен 2011, 18:12
Откуда: Москва

Re: Перегрев контроллера?

Сообщение LCF_R » 10 янв 2012, 18:10

turboprop,
При температуре 70 он проработает пару месяцев (и то не факт, что стабильно). Допустимо ли назвать такую работу корректной?
С уважением, Александр.

turboprop
Advanced member
Сообщения: 244
Зарегистрирован: 18 июн 2010, 11:22
Откуда: C.Петербург

Re: Перегрев контроллера?

Сообщение turboprop » 10 янв 2012, 18:31

По словам адаптека 70 для самого проца - нормальная рабочая температура. Информационные предупреждения должны выдаваться начиная с 90, а критические с 95.
Но здесь насколько я понимаю проблема генерируется либо корзиной, либо это глюк софта.
если на корзину подключен sideband кабели я бы проверил ещё правильно ли стоят джампера на корзине для SGPIO и стоит ли в биосе контроллера тип управления корзиной SGPIO (Не Auto!)

Strannik
Advanced member
Сообщения: 436
Зарегистрирован: 19 июл 2007, 15:39
Откуда: г. Тосно

Re: Перегрев контроллера?

Сообщение Strannik » 11 янв 2012, 10:35

Проблемы не с температурой контроллера , а с температурой бэкплейна.
Это видно даже из сообщений

"controller 1, channel 2, enclosure 0 temperature is out of the normal range."

наблюдая за температурой бэкплейна заметил , что она скачет между 36 и 37 градусами
и это похоже на правду.
Контроллер же реагирует на 37 градусов как на повышеную и шлет сообщение , потом температура падает до 36 и иконка градусника становится синей, потом опять повышается до 37 и контроллер опять шлет сообщение.
Видимо это нормальная его работа.
Только вот достали эти сообщения уже (более 300 за ночь)
На других подобных серверах (с такими же контроллерами и похожими бекплайнами) установлеными в этом же шкафу температура бэкплейнов колеблется от 32 до 35 градусов.

Нельзя ли как-то изменить предел температуры бэкплайна на который реагирует контроллер с 37 на 38-39 градусов?

turboprop
Advanced member
Сообщения: 244
Зарегистрирован: 18 июн 2010, 11:22
Откуда: C.Петербург

Re: Перегрев контроллера?

Сообщение turboprop » 11 янв 2012, 10:53

насколько я помню можно настроить тип сообщения, т.е. перевести это сообщение из разряда аварийных в разряд информационных. тогда по идее в логах они будут, а отсылаться не должны.
я бы с пристрастием осмотрел корзину и бэкплейн, может, мохнатый шмель какой-нибудь там застрял аккурат на датчике. :) продуть-почистить ну и как предельный вариант - отключить джампером на корзине датчик температуры.

LCF_R
Advanced member
Сообщения: 702
Зарегистрирован: 27 сен 2011, 18:12
Откуда: Москва

Re: Перегрев контроллера?

Сообщение LCF_R » 11 янв 2012, 12:05

turboprop
Можно ссылку на эти слова?
С уважением, Александр.

turboprop
Advanced member
Сообщения: 244
Зарегистрирован: 18 июн 2010, 11:22
Откуда: C.Петербург

Re: Перегрев контроллера?

Сообщение turboprop » 11 янв 2012, 12:24

я задавал вопрос о мониторинге температуры на адаптековском семинаре. был получен такой ответ: 90 - просто информационное предупреждение, 95 - критическое предупреждение. Но сам лично я не проверял. Но то что на 70 ASM ругаться не будет - абсолютно точно. Наибольшую температуру лично наблюдал где-то около 75. ASM не ругался.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Перегрев контроллера?

Сообщение Tert » 11 янв 2012, 13:03

LCF_R
Ссылку найти довольно легко :D

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: Перегрев контроллера?

Сообщение exLH » 11 янв 2012, 14:28

Strannik писал(а):Нельзя ли как-то изменить предел температуры бэкплайна на который реагирует контроллер с 37 на 38-39 градусов?
Нет, нельзя. Это жестко зашито в прошивке экспандера.
Необходимо снизить температуру окружающей среды, чтобы на выходе из бэкплейна было менее 37 градусов.
Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598

Strannik
Advanced member
Сообщения: 436
Зарегистрирован: 19 июл 2007, 15:39
Откуда: г. Тосно

Re: Перегрев контроллера?

Сообщение Strannik » 19 янв 2012, 15:16

Странно в описании
http://www.supermicro.nl/manuals/other/ ... -826EL.pdf
к моему бэкплайну написано

The buzzer alarm is triggered by the following conditions:
Hard drive failure1.
Fan failure2.
System temperature over 45º Celsius.

Почему же у меня он реагирует на 37 градусов.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя