Есть сервер:
материнка S5000VSA;
2x Xeon 5405;
в корпусе SC5299WS.
OC: SUSE SLES 11.
Версии BIOS, FRU/SDR и т.д свежие, прошито в сентябре.
В последнее время сервер начал наглухо зависать. Примерно раз в день. Иногда чаще.
Смотрю логи, через SEL. И вижу такие фразы:
Код: Выделить всё
Processor /Processor 1 Stat (#0x90)     The BMC on S5000VSA has reported an informational deassertion event for Processor 1 Stat.  The event has the following information: IERR, Socket designation string from SMBIOS table is not found.  There is no recommended action defined for this event.          BMC - LUN #0 (Channel #00h)        
Processor /Processor 2 Stat (#0x91)     The BMC on S5000VSA has reported an informational deassertion event for Processor 2 Stat.  The event has the following information: IERR, Socket designation string from SMBIOS table is not found.  There is no recommended action defined for this event.           BMC - LUN #0 (Channel #00h)Такое впечатление, что это проблемы с материнкой?
Но из-за чего они могли возникнуть?
Как это можно точно определить?
Пока мне посоветовали поменять процессоры местами. А потом опять смотреть логи.





