Зависание сервера Intel SPSH4
Модераторы: Trinity admin`s, Free-lance moderator`s
Зависание сервера Intel SPSH4
Доброго времени суток!
Ситуация следующая:
унаследованный сервер Intel SPSH4, вышедший из строя по причине "40 градусной жары" (единственное что было сказано предыдущими).
Проходит тесты BIOS, SCSI..., меню выбора источника загрузки проходит нормально, работает с CD/FDD нормально (прошивал с дискеты и CD BIOS и Firmware на плате и SCSI).
Проблемы начинаются в следующих случаях:
1. Попытка запустить с Hiren's-a любой программы, которая стартует созданием виртуального диска R и попыткой разархивировать в него программу перед запуском - зависание!
2. Установка ОС. Копирование перед установкой происходит, после перезапуска, выдает окно виндовс начальной загрузки и бегунок зависает.
3. При попытке протестировать сервер с диска, входящего в комплект, тоже зависает, похоже что тоже в процессе разархивации. (не видно)
есть второй рабочий сервер с такой же платой SSH4. С которого было на время установлено: Плата с процессорами, модуль памяти, отключались SCSI.
Что можно сделать?
Ситуация следующая:
унаследованный сервер Intel SPSH4, вышедший из строя по причине "40 градусной жары" (единственное что было сказано предыдущими).
Проходит тесты BIOS, SCSI..., меню выбора источника загрузки проходит нормально, работает с CD/FDD нормально (прошивал с дискеты и CD BIOS и Firmware на плате и SCSI).
Проблемы начинаются в следующих случаях:
1. Попытка запустить с Hiren's-a любой программы, которая стартует созданием виртуального диска R и попыткой разархивировать в него программу перед запуском - зависание!
2. Установка ОС. Копирование перед установкой происходит, после перезапуска, выдает окно виндовс начальной загрузки и бегунок зависает.
3. При попытке протестировать сервер с диска, входящего в комплект, тоже зависает, похоже что тоже в процессе разархивации. (не видно)
есть второй рабочий сервер с такой же платой SSH4. С которого было на время установлено: Плата с процессорами, модуль памяти, отключались SCSI.
Что можно сделать?
Re: Зависание сервера Intel SPSH4
Для начала снять с сервера информацию.Sunman писал(а):Доброго времени суток!
Ситуация следующая:
унаследованный сервер Intel SPSH4, вышедший из строя по причине "40 градусной жары" (единственное что было сказано предыдущими).
Проходит тесты BIOS, SCSI..., меню выбора источника загрузки проходит нормально, работает с CD/FDD нормально (прошивал с дискеты и CD BIOS и Firmware на плате и SCSI).
Проблемы начинаются в следующих случаях:
1. Попытка запустить с Hiren's-a любой программы, которая стартует созданием виртуального диска R и попыткой разархивировать в него программу перед запуском - зависание!
2. Установка ОС. Копирование перед установкой происходит, после перезапуска, выдает окно виндовс начальной загрузки и бегунок зависает.
3. При попытке протестировать сервер с диска, входящего в комплект, тоже зависает, похоже что тоже в процессе разархивации. (не видно)
есть второй рабочий сервер с такой же платой SSH4. С которого было на время установлено: Плата с процессорами, модуль памяти, отключались SCSI.
Что можно сделать?
1) Логи BMC
2) Версии прошивок (BMC, BIOS, FRUSDR).
3) Детально описать действия, которые выполнялись для решения проблемы.
Всё это вывесить сюда. А дальше видно будет.
Sunman
У меня была когда-то аналогичная проблема:
Сервер SRSH4, 2 процессора. Сервак упал, начал разбираться в чем дело. Тоже ставил ОС, копирование происходило, но когда на серваке грузился windows он зависал. Методом перебора выяснилось что проблема в процессоре. Удалил неисправный проц и все стало ОК.
У меня была когда-то аналогичная проблема:
Сервер SRSH4, 2 процессора. Сервак упал, начал разбираться в чем дело. Тоже ставил ОС, копирование происходило, но когда на серваке грузился windows он зависал. Методом перебора выяснилось что проблема в процессоре. Удалил неисправный проц и все стало ОК.
a_shats
Q: Не понимаю, зачем нужно выявлять ошибку методом перебора на сервере, имеющем BMC и пишущем в логи на любой чих
В смысле - когда достаточно установить штатное управление и посмотреть, что собственно происходит.
A: Иногда в логах не отображается неисправность, как в моем случае. Процессор инициализирован и в DOSе работает нормально, но как только загружается windows то сервак зависает и в логах ничего нет.
Q: Не понимаю, зачем нужно выявлять ошибку методом перебора на сервере, имеющем BMC и пишущем в логи на любой чих
В смысле - когда достаточно установить штатное управление и посмотреть, что собственно происходит.
A: Иногда в логах не отображается неисправность, как в моем случае. Процессор инициализирован и в DOSе работает нормально, но как только загружается windows то сервак зависает и в логах ничего нет.
Мне кажется, Вы немного путаете, о чём идёт речь.!Sergey! писал(а):a_shats
Q: Не понимаю, зачем нужно выявлять ошибку методом перебора на сервере, имеющем BMC и пишущем в логи на любой чих
В смысле - когда достаточно установить штатное управление и посмотреть, что собственно происходит.
A: Иногда в логах не отображается неисправность, как в моем случае. Процессор инициализирован и в DOSе работает нормально, но как только загружается windows то сервак зависает и в логах ничего нет.
Коллега имел в виду лог, который ведётся BMC - независимой от центральных процессоров микросхемой управления сервером.
Здесь нюанс в том, что проблема может быть и не в процессоре...!Sergey! писал(а):Oleg2
Я смотрел лог IntelServerManager8.4, он же берет лог из BMC. Так же смотрел лог грузившись с загрузочного диска к материнке через специальную утилиту. Данных о неисправности процессора не было.
Может быть в памяти, в PCI шинах и т.п. Посему, если есть возможность - вывесите сюда лог BMC снятый SelViewer`ом.
Логи BMC ...
Доброго времени суток!
извиняюсь за задержку, искал чем снять, пока не прочитал про SelViewer, так как при загрузке с фирменного диска Intel также происходило зависание, а на сайте интел про SelViewer для SPSH4/SRSH4 ни слова.
1. вот лог BMC:
Version IPMI v1.5
Number of Entries 11
Last Add Time 02/27/2008-17:00:59
Last Erase Time 02/27/2008-16:52:12
Free Space Remaining 65312
Num Time Stamp Sensor Type & Number Event Description Generator ID
1 02/27/2008-16:52:12 Event Logging Disabled #0x09 Log Area Reset/Cleared. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
2 02/27/2008-16:52:41 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
3 02/27/2008-16:55:42 System Event #0x83 OEM System Boot Event. Asserted Event. BIOS (Channel #00h)
4 02/27/2008-16:57:06 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
5 02/27/2008-16:57:09 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
6 02/27/2008-16:58:30 System Event #0x83 OEM System Boot Event. Asserted Event. BIOS (Channel #00h)
7 02/27/2008-16:59:02 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
8 02/27/2008-16:59:21 System Firmware Progress #0x06 System Firmware Error (POST Error). POST Code: 0210. Asserted Event. BMC - LUN #0 (Channel #00h)
9 02/27/2008-16:59:43 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
10 02/27/2008-16:59:46 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
11 02/27/2008-17:00:59 System Event #0x83 OEM System Boot Event. Asserted Event. BIOS (Channel #00h)
2. Версии прошивок:
c Intelа скачивал "Пакет системных обновлений (BIOS14.0, BMC0.28, FRUSDR 5.6.A) [SSH4_SUP_051904.EXE]" из него создал 3 дискеты. С каждой выполнил что требовалось.
BMC Firmware Version 0.28 (Bootblock Version 0.07)
BIOS SSH40.86B.0097.P14.0405141707 Rel.14.0
FRUSDR 5.6.A
3. Действия, которые выполнялись:
есть еще сервер SRSH4, с него переставлял процессорную плату, в которую вставлял тоже от него же память, и выдергивал scsi контроллер SRCU32(без него).
извиняюсь за задержку, искал чем снять, пока не прочитал про SelViewer, так как при загрузке с фирменного диска Intel также происходило зависание, а на сайте интел про SelViewer для SPSH4/SRSH4 ни слова.
1. вот лог BMC:
Version IPMI v1.5
Number of Entries 11
Last Add Time 02/27/2008-17:00:59
Last Erase Time 02/27/2008-16:52:12
Free Space Remaining 65312
Num Time Stamp Sensor Type & Number Event Description Generator ID
1 02/27/2008-16:52:12 Event Logging Disabled #0x09 Log Area Reset/Cleared. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
2 02/27/2008-16:52:41 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
3 02/27/2008-16:55:42 System Event #0x83 OEM System Boot Event. Asserted Event. BIOS (Channel #00h)
4 02/27/2008-16:57:06 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
5 02/27/2008-16:57:09 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
6 02/27/2008-16:58:30 System Event #0x83 OEM System Boot Event. Asserted Event. BIOS (Channel #00h)
7 02/27/2008-16:59:02 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
8 02/27/2008-16:59:21 System Firmware Progress #0x06 System Firmware Error (POST Error). POST Code: 0210. Asserted Event. BMC - LUN #0 (Channel #00h)
9 02/27/2008-16:59:43 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
10 02/27/2008-16:59:46 Power Unit #0x02 Fully Redundant. Transition to OK. Asserted Event. BMC - LUN #0 (Channel #00h)
11 02/27/2008-17:00:59 System Event #0x83 OEM System Boot Event. Asserted Event. BIOS (Channel #00h)
2. Версии прошивок:
c Intelа скачивал "Пакет системных обновлений (BIOS14.0, BMC0.28, FRUSDR 5.6.A) [SSH4_SUP_051904.EXE]" из него создал 3 дискеты. С каждой выполнил что требовалось.
BMC Firmware Version 0.28 (Bootblock Version 0.07)
BIOS SSH40.86B.0097.P14.0405141707 Rel.14.0
FRUSDR 5.6.A
3. Действия, которые выполнялись:
есть еще сервер SRSH4, с него переставлял процессорную плату, в которую вставлял тоже от него же память, и выдергивал scsi контроллер SRCU32(без него).
Процесс зависание выглядит следующим образом:
например, при попытке установить W2kSrv завис. с клавиатуры не реагирует. после аппаратного сброса (//). скази контроллер выдает сигналы, а на экране висит картинка приветствия биоса "Intel Server Board..." полоски строчки сверху и <Esc>.. <F2>.. снизу. (90% случаев). После выключения-включения опять идет всё нормально до начала загрузки.
например, при попытке установить W2kSrv завис. с клавиатуры не реагирует. после аппаратного сброса (//). скази контроллер выдает сигналы, а на экране висит картинка приветствия биоса "Intel Server Board..." полоски строчки сверху и <Esc>.. <F2>.. снизу. (90% случаев). После выключения-включения опять идет всё нормально до начала загрузки.
ПРОБЛЕМА НАЙДЕНА
при подключении через КВМ переключатель виснет, даже с другого порта КВМ,
при подключении клавиатуры напрямую, зависания не происходит.
я в шоке.
попробую другой кабель для КВМ ...
при подключении клавиатуры напрямую, зависания не происходит.
я в шоке.
попробую другой кабель для КВМ ...
В логе ошибка 0210. Если погуглить http://www.google.ru/search?hl=ru&q=Sys ... &aq=-1&oq=
то по первым двум ссылкам можно узнать, что она означает:
На Интеле ничего не находит, но видимо коды совпадают.
то по первым двум ссылкам можно узнать, что она означает:
Код: Выделить всё
0210: Stuck Key Keyboard connection error
КОНЦОВКА РАЗБОРКИ
Дальнейшие изыскания привели к следующим фактам:
- через KVM переключатель на 3-х серверах работает нормально, на этом приводит к "залипанию клавиатуры", т.е. не дает работать. использование кабеля KVM от другого сервера в той же стойке, приводит тоже к "залипанию".
- без мыши от KVM в этом сервере тоже залипания не происходит.
- напрямую мышь подключил к серверу - зависает, без мыши не зависает.
...
в чём может быть проблема на серваке!? сгорел мышиный порт и придётся ставить ещё одну мышку с USB?
- через KVM переключатель на 3-х серверах работает нормально, на этом приводит к "залипанию клавиатуры", т.е. не дает работать. использование кабеля KVM от другого сервера в той же стойке, приводит тоже к "залипанию".
- без мыши от KVM в этом сервере тоже залипания не происходит.
- напрямую мышь подключил к серверу - зависает, без мыши не зависает.
...
в чём может быть проблема на серваке!? сгорел мышиный порт и придётся ставить ещё одну мышку с USB?
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 26 гостей