SuperMicro SuperServer 6040 и БП с 3 модулями SP-352TP

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Аватара пользователя
umanski
member
Сообщения: 25
Зарегистрирован: 12 авг 2005, 14:48

SuperMicro SuperServer 6040 и БП с 3 модулями SP-352TP

Сообщение umanski » 01 дек 2005, 20:13

SuperMicro SuperServer 6040 и БП с 3 модулями SP-352TP

Всем доброго времени суток!

Давно сотрудничаю с Тринити, много у меня от них в хозяйстве x86-ых машин, вот, есть у меня и SuperMicro SuperServer 6040, а в нем есть место под 3 модуля блоков питания. Входы к ним на задней панели, а сами модули вынимаются и вставляются со стороны передней.

Насколько я понимаю, схема там примерно следущая (со стороны морды, слева направо).
БП-А, левый модуль, нижний вход на задней панели
БП-Б, средний модуль, средний вход
БП-В, правый, верхний.

У меня стоит 2 БП с надписью SP-352TP - на позициях А и Б. Модуля В нет, вместо него заглушка.

Прихожу утром нынче на службу и вижу - на БП-А горит красная лампочка, орет словно fast-busy от АТСки... На БП-Б горит зеленая лампочка. На экране ничего, совсем ничего. В логах сервера (FreeBSD) ничего. Последняя запись вечерняя, а упал в 02.30. Выключаю машине все электричество, все включается, все нормально, корку НЕ поднимает, fsck-ает диски - и начинает работать. В логах, повторю, вчерашний вечер - и сегодняшняя загрузка около 10 утра. Типа - одномоментно ушел в астрал - и все.

У нас сейчас ставят новые UPSы, машина была подключена в БП-А с нового УПСа, а в БП-Б со старого. Сглючил, я напомню, БП-А, слева который. Но ни один другой комп, включенный в новый УПС, и ни один другой комп, включенный в старый, проблем не испытывали (даже машины с ровно 1 блоком питания).

Короче, я озадачен... Коллеги, в чем дело, что делать и что смотреть? На помощь!  :shock:

Машина довольно важная и каждый ее глюк чреват моим гемороем с ней и еще с несколькими другими...

Вадим Уманский
ЗАО "Комкор-ТВ"

P.S.
  1. Я махнул местами кабели питания (орало, но не глюкнуло и не выключилось). Теперь "старое" питание воткнуто в нижний коннектор (левый БП-А), а "новое" в средний коннектор (средний БП-Б). Вдруг что случится - может, что и пойму...
  2. Собираюсь заказать еще 2 шт. SP-352TP, поставить вместо БП-А и поставить БП-В вместо заглушки, а нынешний (возможно, глючный) БП-А снять и положить в ящик на черный день. Здравая идея?
P.P.S. Все рассказал как было. "За что купил, за то и продаю". В чем дело - не знаю...
:confused:
Последний раз редактировалось umanski 03 дек 2005, 16:26, всего редактировалось 2 раза.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 дек 2005, 15:05

Вадим, а что Вы в контору-то не стукнулись? У Шапиро мои контакты есть.

Теперь к телу. Машина от лета 2002 - гарантия кончилась, а то бы мы просто поменяли все что надо.
Что могло произойти с блоками - ума не приложу, совершенно нестандартное поведение. Т.к. непонятно что произошло, то лучше не покупать блоки, а сразу корпус (дороже, но вернее - ведь может быть и трещина в кроссбаре например) - могу предложить SC742S-600.

Но, сдается мне, проблема может быть совсем не в блоке. Насколько я вижу по базе, в этой машине на самом деле стоит мама P4DL6, которая была славна похожими приколами (вырубалась внезапно или начинали датчики перегрева орать - правда непонятно почему лампочка на БП загорелась).
Из совместимых матерей у нас есть X5DP8-G2 - заведомо безглючная.

Но т.к. система эта у Вас критически важная (afaik она у Вас NFS шлюзом к файберной дисковой стояла), то лучше всего просто поставить новую машину (оно вернее будет, да и пора бы обновить уже - кстати дисковая у Вас тоже ровесница динозавров :) ). Например, 5015P-TR с двуядерным PentiumD и саташным зеркалом. (посмотрите только чтобы сетевых портов-слотов хватило, а то можно и более габаритную машину поставить).

Аватара пользователя
umanski
member
Сообщения: 25
Зарегистрирован: 12 авг 2005, 14:48

Сообщение umanski » 02 дек 2005, 15:22

gs писал(а):Машина от лета 2002 - гарантия кончилась, а то бы мы просто поменяли все что надо.
Из спортивного интереса - а платная постгарантийка бывает?
Что могло произойти с блоками - ума не приложу, совершенно нестандартное поведение. Т.к. непонятно что произошло, то лучше не покупать блоки, а сразу корпус (дороже, но вернее - ведь может быть и трещина в кроссбаре например) - могу предложить SC742S-600.
ОК, подумаем... Вы имеете в виду, что можно переставить все в новый корпус и запустить систему "как есть"?
Но, сдается мне, проблема может быть совсем не в блоке.
Будем посмотреть... если что - попробую переставить блоки, освободив проблемный слот - вдруг кроссбар не совсем на голову ушиблен...
Насколько я вижу по базе, в этой машине на самом деле стоит мама P4DL6, которая была славна похожими приколами (вырубалась внезапно или начинали датчики перегрева орать - правда непонятно почему лампочка на БП загорелась).
Никогда раньше такого не было. Щаз случилось вот... Пока хочется попробовать методом исключения подтвердить или отсечь кривизну модуля БП и приходящего на него питания... например...
Из совместимых матерей у нас есть X5DP8-G2 - заведомо безглючная.

Но т.к. система эта у Вас критически важная (afaik она у Вас NFS шлюзом к файберной дисковой стояла), то лучше всего просто поставить новую машину (оно вернее будет, да и пора бы обновить уже )
Пока по мощности она справляется свободно - если дело решится малой кровью - так будет проще...
( кстати дисковая у Вас тоже ровесница динозавров :) ).
Есть такое дело... Но это будет отдельная эпопея... в свое время...

Сейчас пока пытаюсь доказательно понять относительно этой машинки - ее ли это сбой вообще...

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 дек 2005, 15:45

По поводу постгарантийки - в принципе можно, но мы просто такое не практикуем. Если надо - можем помозговать.

Но мне все больше и больше кажется, что это именно мама. Просто у нас сдохло больше половины этих матерей и все именно с такими симптомами (слава аллаху хоть вовремя это выяснили и продали немного). Так что мы их меняли по первому требованию на серию DPx.

Что до блока питания, то покупка двух модулей и кроссбара влетит баксов в 400-500. К тому же кроссбара в свежем прайсе я что-то не вижу вообще. А блок питания целиком - вообще стоит примерно как корпус. Запчасти по понятным причинам всегда дороже.

В общем, если нет возможности поставить новую машину, то надо разбираться кто из ху. Проблема в том, что я не представляю как это сделать - слишком долго ждать результатов, ведь она может еще год проработать и потом опять квакнет. Разве что разом поменять и корпус и маму - это дешевле новой машины и заведомо решит проблему.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 дек 2005, 16:07

По поводу постгарантийки - если у Вас оборудование эксплуатируется заведомо больше гарантийного срока, имеет смысл еще при покупке нас предупреждать и соглашаться на доп контракт и доплату. Ведь нам же надо к этому быть готовыми - запчасти перед эндофлайфом например затаривать заранее...

Аватара пользователя
umanski
member
Сообщения: 25
Зарегистрирован: 12 авг 2005, 14:48

Сообщение umanski » 02 дек 2005, 16:13

ОК, буду иметь в виду, спасибо.

Вполне бывает, что эксплуатируется дольше - задача осталась, машина работала, справлялась, нареканий к ней не было... "Работает - не трогай!" ;)

Аватара пользователя
umanski
member
Сообщения: 25
Зарегистрирован: 12 авг 2005, 14:48

Сообщение umanski » 03 дек 2005, 16:24

Глюк идентично повторился...

Переставил сглючивший модуль БП из крайнего левого слота в крайний правый, ранее свободный.

Теперь "старое" питание воткнуто в верхний коннектор (правый БП-В), а "новое" в средний коннектор (средний БП-Б). Вместо модуля в слоте БП-А стоит теперь заглушка.

Мама, роди меня обратно!  :slam:

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 дек 2005, 13:30

Повторюсь - это характерное поведение мамы P4DL6...

Аватара пользователя
umanski
member
Сообщения: 25
Зарегистрирован: 12 авг 2005, 14:48

Сообщение umanski » 05 дек 2005, 14:00

gs писал(а):Повторюсь - это характерное поведение мамы P4DL6...
Так Вы полагаете, что следует именно мать менять?
Из совместимых матерей у нас есть X5DP8-G2 - заведомо безглючная.
Что Вы имеете в виду под "совместимостью" ? Насколько они похожи и отличаются? Пересборка ядра и/или переконфигурация системы мне светит при замене матери? Там чипсет не разный?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 дек 2005, 14:08

Думаю, что именно она. На 100% конечно не уверен, но разборки я бы начал именно с нее.

Что касается совместимости, я имел в виду поддержку тех процессоров - более новые мамы с ними не работают. Функционально мамы очень похожи - отличаются чипсетом, интегрированными сказями и сетевухами (вроде бы - за давностью лет уже не помню). Я не спец по фрюхе, но наверно какие-то телодвижения потребуются. Но Вам наверно это не составит проблемы.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 дек 2005, 14:22

Кстати, если я прав насчет мамы, то решать вопрос надо как можно скорее. Пока повторяется типичный, к сожалению, сценарий - вылеты все чаще и чаще, пока не заглохнет навеки...

Аватара пользователя
umanski
member
Сообщения: 25
Зарегистрирован: 12 авг 2005, 14:48

Сообщение umanski » 05 дек 2005, 19:05

Оба раза заглючил один и тот же модуль БП, подкюченный к разным УПСам... может, и он виноват...

А возможно ли получить для тестирования и выяснения виноватого узла модуль БП (заведомо живой) и/или мамку каким-либо образом?

Вы правы, затягивать нельзя...

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 дек 2005, 19:28

БП к сожалению не осталось - слишком давно уже энд оф лайф.

А мамку можно. Стукнитесь в контору - договоримся на потестить.
Меня зовут Игорь Вихренко. Или производственники - Фролов и Лякишев, они в курсе уже.

Аватара пользователя
umanski
member
Сообщения: 25
Зарегистрирован: 12 авг 2005, 14:48

Сообщение umanski » 05 дек 2005, 19:33

Хорошо, завтра стукнусь.

А если окажется, что виновен БП - меняем корпус?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 05 дек 2005, 19:41

Так будет лучше всего. Но скорее всего до этого не дойдет :)

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 20 гостей