Перегрев контроллера?
Модераторы: Trinity admin`s, Free-lance moderator`s
Перегрев контроллера?
Всем привет!
Имеется сервер на платформе Supermicro 826 кузов
CPU Xeon E5540
Установлено 12 дисков, Adaptec 5445Z
В праздники выключали питание. Сервера пережили это нормально , а вот кондиционеры в серверной нет.
В один из дней кондиционеры не работали достаточно долго, температура в серверной была высокая, утилиты мониторинга писали об этом. Потом кондиционеры включили и температура стала нормальной о чем тоже утилиты мониторинга сообщили (все кроме одной).
На одном из серверов стоит ASM (последняя версия) до сих пор продолжает слать сообщения о превышеной температуре.
Перезапустил службу ASM - не помогло.
Если зайти в сам ASM то температура контроллера 75 градусов - это нормальная температура для этого контроллера. Температура бэкплайна 37 градусов.
Однако графическая пиктограмма градусника горит красным и ASM шлет события типа
"controller 1, channel 2, enclosure 0 temperature is out of the normal range."
температура в серверной 18 градусов.
Все три вентилятора установленные в сервере работают на частоте 5300 RPM (по данным Aida)
Подскажите , можно ли как то дополнительно выяснить , что случилось
- глючит ASM
- температура на бэкплайне действительно высокая
Заранее спасибо!
Имеется сервер на платформе Supermicro 826 кузов
CPU Xeon E5540
Установлено 12 дисков, Adaptec 5445Z
В праздники выключали питание. Сервера пережили это нормально , а вот кондиционеры в серверной нет.
В один из дней кондиционеры не работали достаточно долго, температура в серверной была высокая, утилиты мониторинга писали об этом. Потом кондиционеры включили и температура стала нормальной о чем тоже утилиты мониторинга сообщили (все кроме одной).
На одном из серверов стоит ASM (последняя версия) до сих пор продолжает слать сообщения о превышеной температуре.
Перезапустил службу ASM - не помогло.
Если зайти в сам ASM то температура контроллера 75 градусов - это нормальная температура для этого контроллера. Температура бэкплайна 37 градусов.
Однако графическая пиктограмма градусника горит красным и ASM шлет события типа
"controller 1, channel 2, enclosure 0 temperature is out of the normal range."
температура в серверной 18 градусов.
Все три вентилятора установленные в сервере работают на частоте 5300 RPM (по данным Aida)
Подскажите , можно ли как то дополнительно выяснить , что случилось
- глючит ASM
- температура на бэкплайне действительно высокая
Заранее спасибо!
Re: Перегрев контроллера?
Мог и термодатчик полететь. 75 градусов - это НЕнормально для данного контроллера. Допустимая температура - это до 55 градусов без батареи и 40 градусов с батареей.
С уважением, Александр.
Re: Перегрев контроллера?
По-моему, вы ошибаетесь, предельная температура проца 100.
http://ask.adaptec.com/scripts/adaptec_ ... aqid=15345
55 и 40 это максимальная температура окружающей среды.
а очистка лога не помогает?
http://ask.adaptec.com/scripts/adaptec_ ... aqid=15345
55 и 40 это максимальная температура окружающей среды.
а очистка лога не помогает?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Перегрев контроллера?
100 градусов - это критическая, выше уже кирдык.
Так что он шлет уведомлялки на вполне законных основаниях. Только непонятно, откуда такая температура при работающих вентилях. Может их глазами посмотреть?
Так что он шлет уведомлялки на вполне законных основаниях. Только непонятно, откуда такая температура при работающих вентилях. Может их глазами посмотреть?
Re: Перегрев контроллера?
turboprop,
При температуре 70 он проработает пару месяцев (и то не факт, что стабильно). Допустимо ли назвать такую работу корректной?
При температуре 70 он проработает пару месяцев (и то не факт, что стабильно). Допустимо ли назвать такую работу корректной?
С уважением, Александр.
Re: Перегрев контроллера?
По словам адаптека 70 для самого проца - нормальная рабочая температура. Информационные предупреждения должны выдаваться начиная с 90, а критические с 95.
Но здесь насколько я понимаю проблема генерируется либо корзиной, либо это глюк софта.
если на корзину подключен sideband кабели я бы проверил ещё правильно ли стоят джампера на корзине для SGPIO и стоит ли в биосе контроллера тип управления корзиной SGPIO (Не Auto!)
Но здесь насколько я понимаю проблема генерируется либо корзиной, либо это глюк софта.
если на корзину подключен sideband кабели я бы проверил ещё правильно ли стоят джампера на корзине для SGPIO и стоит ли в биосе контроллера тип управления корзиной SGPIO (Не Auto!)
Re: Перегрев контроллера?
Проблемы не с температурой контроллера , а с температурой бэкплейна.
Это видно даже из сообщений
"controller 1, channel 2, enclosure 0 temperature is out of the normal range."
наблюдая за температурой бэкплейна заметил , что она скачет между 36 и 37 градусами
и это похоже на правду.
Контроллер же реагирует на 37 градусов как на повышеную и шлет сообщение , потом температура падает до 36 и иконка градусника становится синей, потом опять повышается до 37 и контроллер опять шлет сообщение.
Видимо это нормальная его работа.
Только вот достали эти сообщения уже (более 300 за ночь)
На других подобных серверах (с такими же контроллерами и похожими бекплайнами) установлеными в этом же шкафу температура бэкплейнов колеблется от 32 до 35 градусов.
Нельзя ли как-то изменить предел температуры бэкплайна на который реагирует контроллер с 37 на 38-39 градусов?
Это видно даже из сообщений
"controller 1, channel 2, enclosure 0 temperature is out of the normal range."
наблюдая за температурой бэкплейна заметил , что она скачет между 36 и 37 градусами
и это похоже на правду.
Контроллер же реагирует на 37 градусов как на повышеную и шлет сообщение , потом температура падает до 36 и иконка градусника становится синей, потом опять повышается до 37 и контроллер опять шлет сообщение.
Видимо это нормальная его работа.
Только вот достали эти сообщения уже (более 300 за ночь)
На других подобных серверах (с такими же контроллерами и похожими бекплайнами) установлеными в этом же шкафу температура бэкплейнов колеблется от 32 до 35 градусов.
Нельзя ли как-то изменить предел температуры бэкплайна на который реагирует контроллер с 37 на 38-39 градусов?
Re: Перегрев контроллера?
насколько я помню можно настроить тип сообщения, т.е. перевести это сообщение из разряда аварийных в разряд информационных. тогда по идее в логах они будут, а отсылаться не должны.
я бы с пристрастием осмотрел корзину и бэкплейн, может, мохнатый шмель какой-нибудь там застрял аккурат на датчике. продуть-почистить ну и как предельный вариант - отключить джампером на корзине датчик температуры.
я бы с пристрастием осмотрел корзину и бэкплейн, может, мохнатый шмель какой-нибудь там застрял аккурат на датчике. продуть-почистить ну и как предельный вариант - отключить джампером на корзине датчик температуры.
Re: Перегрев контроллера?
я задавал вопрос о мониторинге температуры на адаптековском семинаре. был получен такой ответ: 90 - просто информационное предупреждение, 95 - критическое предупреждение. Но сам лично я не проверял. Но то что на 70 ASM ругаться не будет - абсолютно точно. Наибольшую температуру лично наблюдал где-то около 75. ASM не ругался.
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Перегрев контроллера?
LCF_R
Ссылку найти довольно легко
Ссылку найти довольно легко
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Re: Перегрев контроллера?
Нет, нельзя. Это жестко зашито в прошивке экспандера.Strannik писал(а):Нельзя ли как-то изменить предел температуры бэкплайна на который реагирует контроллер с 37 на 38-39 градусов?
Необходимо снизить температуру окружающей среды, чтобы на выходе из бэкплейна было менее 37 градусов.
Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598
Re: Перегрев контроллера?
Странно в описании
http://www.supermicro.nl/manuals/other/ ... -826EL.pdf
к моему бэкплайну написано
The buzzer alarm is triggered by the following conditions:
Hard drive failure1.
Fan failure2.
System temperature over 45º Celsius.
Почему же у меня он реагирует на 37 градусов.
http://www.supermicro.nl/manuals/other/ ... -826EL.pdf
к моему бэкплайну написано
The buzzer alarm is triggered by the following conditions:
Hard drive failure1.
Fan failure2.
System temperature over 45º Celsius.
Почему же у меня он реагирует на 37 градусов.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя