Снова sds2 + SC5100

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
andi
Power member
Сообщения: 42
Зарегистрирован: 20 май 2003, 10:07

Снова sds2 + SC5100

Сообщение andi » 06 окт 2004, 09:36

Здравствуйте.
Опять я и мой сервер. Вобщем непонятно каким путем, но добился безсбойной работы сервера до 3-4-5 месяцев. По прошествию этого времени он замерзает (описание здесь)
Я выдергиваю второй проц, потом ставлю наместо. Перепрошиваю BMC, FRU, Bios и он опять 3-4-5 месяцев пашет.
Впринципе это ничего (на все уходит около часа, это некритично), но я собираюсь сменить работу и хотелось бы избавить последователя от этого.
Появилась мысля связанная с работой блока питания.
Может нехватает мощи?
У меня стоит блок питания на 350 ватт.
В сервере мать sds2+2xP3-1133MHz+2xSegeate Barracuda 36ES 18Гб.
Хватает ли на пике мощности БП?
Как это проверить? (какие можно туда БП поставить?)

И еще, после "замерзания", он просто так не заводится.
Выдергиваем из розетки, вставляем вилку, нажимаем "power". Вентиляторы заводятся, потом немного затихают (система контроля, значит работет). И все, не изображение ни писков, ничего.
Если выдернуть проц. из второго разъема (ну и заглушку туда поставить) и включить, то все сразу заводится. После этого можно ставить второй проц. и тоже все заведется. Но если не перешить BMC/FRU/BIOS то после загрузки ОС или через 5-10-15 минут ее работы (даже без подключений клиентов), он опять "замерзнет".[/url]

Аватара пользователя
Dmitry
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 867
Зарегистрирован: 22 авг 2002, 16:12
Откуда: St.Petersburg
Контактная информация:

Сообщение Dmitry » 06 окт 2004, 12:08

Перечитал все заново.
Мысли только о:
- прошивках,
- контактах,
- наличии дополнительных pci карт,
- настройках биоса
- сервис паки?

А что кажет Intel® Server Control v3.5.2 ?
В логах самой системы чего-нибудь успевает проскочить?

andi
Power member
Сообщения: 42
Зарегистрирован: 20 май 2003, 10:07

Сообщение andi » 07 окт 2004, 09:53

1. Все прошивки самые свежие с сайта производителя

SDS2 Server
Baseboard Management Controller (BMC)
Firmware Version 0.32
(Bootblock Version 0.06)
Release Notes - October 31, 2002

Important Information about
FRUSDR SDS2 Load Utility With Support Files
Version DS-5.0.E

RELEASE NOTES FOR the Intel® Server Board SDS2 BIOS RELEASE 3.2 BUILD 52
Created on February 27, 2003

2. Контакты. Если имеются ввиду контакты на процессорах, то окислений и повреждений незамеченно.

3. Дополнительных карт нет. Используются только встроенные устройства (контроллер SCSI, и LAN-адаптер).

4. Настройки биоса сброшены и изменено только порядок загрузки (с жесткого диска), и вовыод диагностики при загрузке.

5. Сервис пак на Win2000AS только 3-й. Версия винды английская.

Intel® Server Control v3.5.2
Кажет что все впорядке. Иногда показывает что крышка передняя открыта (неплотно прилегает).
НО я так думаю это никакого отношения к системе не имеет.

В логах самой системы чего-нибудь успевает проскочить?
В логах тоже все тихо, никаких сообщений.

Аватара пользователя
Dmitry
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 867
Зарегистрирован: 22 авг 2002, 16:12
Откуда: St.Petersburg
Контактная информация:

Сообщение Dmitry » 07 окт 2004, 11:04

Вроде все правильно.
Ладно, еще мысли.

Как насчет питания? В смысле через UPS, какой?
Паста на кулерах-процах хорошо прилегает?, не высохла?
Есть ли на плате конденсаторы визуально чуть вспучившиеся?

Память пробовали под ДОС прогнать Testmem?

Попробуйте запустить BurnIn test с максимальной нагрузкой на процы, память. (и соткрытой крышкой). При этом ISC запущен и результат смотрим по нему.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Сообщение Stranger03 » 07 окт 2004, 12:31

Dmitry писал(а):Вроде все правильно.
У меня было как-то такое. Мыслей несколько:
1. Выключить ACPI совсем, если это возможно.
2. Если нет, попробовать использовать ядро без поддержки ACPI (есс-но сделать full-backup).
3. Проверить память. Если можно - то поменять на заведомо рабочую.
4. Проверить на перегрев. Возможно тут какая-то собака порылась.
5. Проверить БП, если возможно разобрать, прочистить, проверить визуально кондеры.
6. Проверить кондеры на мат. плате.
7. Проверить импульсником напряжение в сети.
Вот как бы так. У меня похожие проблемы, вылечились заменой памяти.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 11 гостей