Глючит (?) Intel Server Management

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
pelenur1
Junior member
Сообщения: 5
Зарегистрирован: 28 фев 2008, 06:16
Откуда: Иркутск
Контактная информация:

Глючит (?) Intel Server Management

Сообщение pelenur1 » 28 фев 2008, 11:06

Добрый день. Хочу спросить совета.

Есть: сервер SR3200, работает 24/7, на нем установлено ПО Intel Server Management.

Недавно проводились работы в сервеной стойке, после чего это самое ПО заныло:

EventLog
Event Type: Warning
Event Source: Local Response Agent
Event Category: None
Event ID: 11
Date:  2/27/2008
Time:  3:52:16 PM
User:  N/A
Computer: SERVER
Description:
DMI Indication
Event Type = Status Changed from OK to Lower Non-Critical
Component Name = Intel Corporation, Baseboard
Group  = Temperature Probe
Severity  = Non-Critical
Instance  = 2
System  = Other
SubSystem = Other
В самом ISM
Chassis SR3200, Critical Error Count 3
Прочитал на сайте Интела информацию по этой теме
PIC monitors chassis door open/closed switches for managed servers that support this feature. The number
of sensors monitored depends on the server chassis. If a server supports chassis sensors, the chassis
intrusion sensor screen displays the current security status.
When a chassis door that includes an open/close switch is opened, the vulnerable state is indicated as a
critical condition in the health branch of the PIC Console, and the requested event actions are carried out.
When all chassis sensor switches are closed, PIC indicates the chassis is secure by updating the health
indicator.
Другими словами, ругается ISM на незакрытый корпус сервера. Но его никто не открывал!

Подскажите, как убрать проблему, или хотя бы где копать.

Заранее спасибо!

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Re: Глючит (?) Intel Server Management

Сообщение Oleg2 » 28 фев 2008, 12:22

pelenur1 писал(а):Добрый день. Хочу спросить совета.

Есть: сервер SR3200, работает 24/7, на нем установлено ПО Intel Server Management.

Недавно проводились работы в сервеной стойке, после чего это самое ПО заныло:

EventLog
Event Type: Warning
Event Source: Local Response Agent
Event Category: None
Event ID: 11
Date:  2/27/2008
Time:  3:52:16 PM
User:  N/A
Computer: SERVER
Description:
DMI Indication
Event Type = Status Changed from OK to Lower Non-Critical
Component Name = Intel Corporation, Baseboard
Group  = Temperature Probe
Severity  = Non-Critical
Instance  = 2
System  = Other
SubSystem = Other
В самом ISM
Chassis SR3200, Critical Error Count 3
Прочитал на сайте Интела информацию по этой теме
PIC monitors chassis door open/closed switches for managed servers that support this feature. The number
of sensors monitored depends on the server chassis. If a server supports chassis sensors, the chassis
intrusion sensor screen displays the current security status.
When a chassis door that includes an open/close switch is opened, the vulnerable state is indicated as a
critical condition in the health branch of the PIC Console, and the requested event actions are carried out.
When all chassis sensor switches are closed, PIC indicates the chassis is secure by updating the health
indicator.

Другими словами, ругается ISM на незакрытый корпус сервера. Но его никто не открывал!

Подскажите, как убрать проблему, или хотя бы где копать.

Заранее спасибо!
Гм. Если раздел Temperature probe И lower non-critial, то, сдаётся мне, серверу стало слегка холодновато. И это с открытием корпуса не связано. Можете снять лог в текстовом виде и вывесить сюда?

pelenur1
Junior member
Сообщения: 5
Зарегистрирован: 28 фев 2008, 06:16
Откуда: Иркутск
Контактная информация:

Сообщение pelenur1 » 28 фев 2008, 12:46

Если честно, первый раз сталкиваюсь с сервером, которому не нравится низкая температура. Сейчас ошибка в ISM висит, но в логах ничего не пишется.

Как выглядит ошибка в ISM
Изображение

Лог из Event однообразен

2/27/2008 2:53:45 PM Local Response Agent Information None 11 N/A SERVER "DMI Indication
Event Type = Status Changed to OK
Component Name = Intel Corporation, Baseboard
Group = Temperature Probe
Severity = OK
Instance = 2
System = Other
SubSystem = Other
"
2/27/2008 2:50:23 PM Local Response Agent Warning None 11 N/A SERVER "DMI Indication
Event Type = Status Changed from OK to Lower Non-Critical
Component Name = Intel Corporation, Baseboard
Group = Temperature Probe
Severity = Non-Critical
Instance = 2
System = Other
SubSystem = Other
"
2/27/2008 2:46:44 PM Local Response Agent Information None 11 N/A SERVER "DMI Indication
Event Type = Status Changed to OK
Component Name = Intel Corporation, Baseboard
Group = Temperature Probe
Severity = OK
Instance = 2
System = Other
SubSystem = Other
"
2/27/2008 2:46:39 PM Local Response Agent Warning None 11 N/A SERVER "DMI Indication
Event Type = Status Changed from OK to Lower Non-Critical
Component Name = Intel Corporation, Baseboard
Group = Temperature Probe
Severity = Non-Critical
Instance = 2
System = Other
SubSystem = Other
"
2/27/2008 2:20:08 PM Application Popup Information None 26 N/A SERVER Application popup: Messenger Service  : Message from SERVER to SERVER on 27.02.2008 13:54:00

Check NIC Health Contributor at server SERVER
2/27/2008 2:12:41 PM Local Response Agent Information None 11 N/A SERVER "DMI Indication
Event Type = Status Changed to OK
Component Name = Intel Corporation, Baseboard
Group = Temperature Probe
Severity = OK
Instance = 2
System = Other
SubSystem = Other
"
2/27/2008 2:12:36 PM Local Response Agent Warning None 11 N/A SERVER "DMI Indication
Event Type = Status Changed from OK to Lower Non-Critical
Component Name = Intel Corporation, Baseboard
Group = Temperature Probe
Severity = Non-Critical
Instance = 2
System = Other
SubSystem = Other
"

pelenur1
Junior member
Сообщения: 5
Зарегистрирован: 28 фев 2008, 06:16
Откуда: Иркутск
Контактная информация:

Сообщение pelenur1 » 06 мар 2008, 09:47

До сих пор проблема не решена. Шеф почему-то читает что это "серьезная ошибка в работе сервера" и требует устранить в кратчайшие сроки...

Может у кого-нибудь есть варианты? напоминаю, вырубать сервак нельзя

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Сообщение Oleg2 » 06 мар 2008, 11:22

pelenur1 писал(а):До сих пор проблема не решена. Шеф почему-то читает что это "серьезная ошибка в работе сервера" и требует устранить в кратчайшие сроки...

Может у кого-нибудь есть варианты? напоминаю, вырубать сервак нельзя
Объясните шефу буквально следующее:
1) На серверных платформах от Intel`а при измерении каких либо плавно меняющихся параметров, существует 4 пороговых значения, переход через которые фиксируется в логе.
Upper critical
Upper non-critical
Lower non-critical
Lover critical

Переход значения параметра через порог non-critical - не означает критическую ошибку сервера, а всего лишь то, что значение измеряемого параметра вышло за пределы оптимального диапазона, но данное изменение не критично.

В вашем случае - как я думаю, это банальное занижение температуры. Попробуйте изменить на пару градусов уставки кондиционера в серверной.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 58 гостей