Есть сервер:
материнка S5000VSA;
2x Xeon 5405;
в корпусе SC5299WS.
OC: SUSE SLES 11.
Версии BIOS, FRU/SDR и т.д свежие, прошито в сентябре.
В последнее время сервер начал наглухо зависать. Примерно раз в день. Иногда чаще.
Смотрю логи, через SEL. И вижу такие фразы:
Код: Выделить всё
Processor /Processor 1 Stat (#0x90) The BMC on S5000VSA has reported an informational deassertion event for Processor 1 Stat. The event has the following information: IERR, Socket designation string from SMBIOS table is not found. There is no recommended action defined for this event. BMC - LUN #0 (Channel #00h)
Processor /Processor 2 Stat (#0x91) The BMC on S5000VSA has reported an informational deassertion event for Processor 2 Stat. The event has the following information: IERR, Socket designation string from SMBIOS table is not found. There is no recommended action defined for this event. BMC - LUN #0 (Channel #00h)
Такое впечатление, что это проблемы с материнкой?
Но из-за чего они могли возникнуть?
Как это можно точно определить?
Пока мне посоветовали поменять процессоры местами. А потом опять смотреть логи.