глюкодром с inetl SE7520

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
surikk
member
Сообщения: 31
Зарегистрирован: 21 июл 2005, 09:32

глюкодром с inetl SE7520

Сообщение surikk » 21 авг 2006, 16:04

конфига:
SE7520JR2ATA+2 Xeon 3.4 + 6xDDR2 1Gb kingstone Ecc reg

машина отработала  1 год. посреди работы "удалила из системы 5 модулей памяти", о чем записала в логах ISM. и как не в чем не бывало продолжила робить на 1 модулк (1 гиг)

после остановки сервака и визуального осмотра памяти и слотов   собрали все назад - машина вообще не запускается. из дает 3 длинных писка и заирает. индикаторы диагностики выдают:

R-R-R-A ... что соотвествует по описанию
Chekpoint F1 - Recovery file not found.

любые изменения последолвательности количества использования памяти выдают эту ошибку.

*************************************************
сходил к другу - взял памяти 2шт х 1Гб.

память таже кингстон....
вставляю .............запустился - но видете тока 1Гб ...
прещиваю биос - однохерственно.
в билсе из 6 слотов памяти показывает тока 1 "енабле"

добовление в любых вариациях старой памяти приводит к темже 3 длинным гудкам и зависантю на стадии загрузки.

тока ошибка уже будет:
A-A-A-G ... что соотвествует по описанию
Chekpoint EF - Read erroe occurred on media. jump back to checkpoint E9
****************************

собственно пипец-  ниче похожего на моей памяти я не видел.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 21 авг 2006, 16:19

Memory Retest в BIOS попробуйте.

surikk
member
Сообщения: 31
Зарегистрирован: 21 июл 2005, 09:32

Сообщение surikk » 21 авг 2006, 16:28

a_shats писал(а):Memory Retest в BIOS попробуйте.
пробовал.......

KLIM_SPb
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 421
Зарегистрирован: 06 май 2006, 16:33
Откуда: СПб
Контактная информация:

Сообщение KLIM_SPb » 22 авг 2006, 10:55

Вы прошивали только BIOS или полностью SUP?
Если только BIOS, то попробуйте
http://downloadcenter.intel.com/scripts ... s&lang=eng
И сбросте SEL

surikk
member
Сообщения: 31
Зарегистрирован: 21 июл 2005, 09:32

Сообщение surikk » 23 авг 2006, 08:41

новости... так сказать :(

вообщем. так как у меня серваку запустился на 2 новых модулях и при установке в 1А и 2А виделось все 2Г памяти ( к стати почемуто если ставить в 1А+1В видит тока 1 димм тот что в 1А --- но возможно это особенности наполнеия банков - короче на до этого было) я пришел к выводу что сдохла у меня "старая" память.... все 6 модулей!!!  согласитесь - это маловероятный фактор.

проверил:

ставлю в 1А новый - все робит
ставлю старый - не запускается
ставлю 1А новый  и в 1В старый - в биосе пишет "дисеблед" на месте установки старого.

ну что делать - подготовил заявку на замены 6 модулей - отдал конечному пользователю на предворительный тест машину с 2 гигами. надо сказать что она практически сутки у меня на столе работала с иде винта по вин ХРпро... тестил - смотрел параметры системы...
... юзеры воткнули в сервак сказики - все заработало ( винты оин не отдавали - так как у них там ценная инфа)... ну я с чистой совеститью обмыл это дело пивком и негодование помянул кингстон.

буквально чирез пару часов у конечника опять отвалился 1 модуль памяти - уже новый (2А) ... иситема работает тока на 1А .... в логах как и проглый раз пишется " модуль памяти 2А удален из системы"....
мерезагрузка машины - не запускаетя

..я в шоке .....   все думаю - матери сцука память жгет.... в темпе меняю мать  - ставлю еще 2 новых модуля (больше просто уже нет) ....
...у меня все работает.... тестю 4-5 часов..... отдаю конечнику ..... на следующее утро звонят - опять память вылетела....


наблюдается следующаяя закономерность: как тока машина начинает робить на софте клиента (вин2003) - начинает дохнуть память - она потом нигде не робит... даже на новой матери. учитывая что машина у меня на винХР робит норм - закрадыает подозрения на какойто хитруй вирус который убивает память..... я что то не слыхал о таком... но я уже не знаю что думать...
сревер то простейший: 2 проца+мать+память+скази рейд+БП....

процесоры ну ни как не могут влиять на жизнь памяти ни логически ни по питанию... Скази рейд тоже у них нигде не пересекаются запитывающие токи. мать меняли - память тоже (все по 2 раза)
остается БП .. но блин я тоже не вижу путей столь избираельного уничтоджения микросхем.

в ползу теории "вируса" еще тот факт что при работе вылетает вся память сколько бы ее не было - но остается 1шт в слоте 1А --- и мено его нужно использовать если у вас всего 1 модуль ДДР. если вынуть 1А - то все машина не запустится даже если все 5 других стоят. и то что после презогрузки умирает и 1А - тоже ... злой умысел

surikk
member
Сообщения: 31
Зарегистрирован: 21 июл 2005, 09:32

Сообщение surikk » 31 авг 2006, 16:33

можете смеяться и хмыкать - но проблема до сих пор не решена....
пока есть не рабочий сервер и 10 дохлых модулей памяти:(

Astrons
Junior member
Сообщения: 17
Зарегистрирован: 02 окт 2004, 23:08
Откуда: Рига, Латвия
Контактная информация:

Сообщение Astrons » 31 авг 2006, 21:27


surikk
member
Сообщения: 31
Зарегистрирован: 21 июл 2005, 09:32

Сообщение surikk » 06 сен 2006, 22:25

Astrons писал(а):Не оно? http://support.intel.com/support/mother ... 022502.htm
хмм...

если можно - то точный тех превод...

потому как я не понял что происходит с памятью.... ну ижет конфликт ПО и в результате идет отключение --- а дальше?

почему у меня после етих глюков память умирает физически ?
я так понимамю есди ПО хочет оключить модуль - то он ключает его порт на матери, а не лезет в саму память ....

Astrons
Junior member
Сообщения: 17
Зарегистрирован: 02 окт 2004, 23:08
Откуда: Рига, Латвия
Контактная информация:

Сообщение Astrons » 06 сен 2006, 22:36

Выдержка из текста:

In some cases, memory DIMMs have been damaged and no longer function properly.

Если в 2 словах, то в некоторых случаях память повреждается и больше не работает...

Происходит тогда, когда более одной программы лезет в SPD памяти...

surikk
member
Сообщения: 31
Зарегистрирован: 21 июл 2005, 09:32

Сообщение surikk » 08 сен 2006, 13:15

Astrons писал(а):Выдержка из текста:

In some cases, memory DIMMs have been damaged and no longer function properly.

Если в 2 словах, то в некоторых случаях память повреждается и больше не работает...

Происходит тогда, когда более одной программы лезет в SPD памяти...
в принципе это сразу и предположил - тока думал о злом вирусе...

тогда 2 риторических вопроса:
1. что сделать что бы этого не было больше?
2. как втюхать кигстоне по браку назад поставшику (10 планок :)) ?

хотя ответы я думаю меня не слишком будут радовать

Dzuba
Advanced member
Сообщения: 94
Зарегистрирован: 16 ноя 2005, 13:02
Откуда: Kiev

Сообщение Dzuba » 08 сен 2006, 14:38

могу сказать, что у меня такаяже ситуация: горела память на SE7520DB2
меняли мать, меняли БП, поставщики грешат на корпус 5300BRP
http://forum.windowsfaq.ru/showthread.p ... post388235

Dzuba
Advanced member
Сообщения: 94
Зарегистрирован: 16 ноя 2005, 13:02
Откуда: Kiev

Сообщение Dzuba » 08 сен 2006, 14:41


surikk
member
Сообщения: 31
Зарегистрирован: 21 июл 2005, 09:32

Сообщение surikk » 10 сен 2006, 10:03

официальная рекомендация  - не юзать програмы имеющие доступ к СПД памяти... тоесть интел сам рекомендует не юзать ИСМ вообще ..

причем данная мать не попадает под брак - и менять ее на халявы на другую модель без етой глючной микрухи не хотят. конечника естесно ето не устраивает - он хочте имеьт 100% надежный сервак без ограничений использования ПО - тем более что у них ИСМ стоит везде и является рабочим инструментом управления группы серверов.


мне чесно говоря не понятна политика интел....отпадает всякое желание работать на таких условиях... потому что дело идет к возрату сервера от клиента стоимостью 11К баксов после года эксплуатации..
ну или мы сами за свой счет поменяем мать на смежную модель.

кингстоне согласились обменять по браку не смотря на очивидную вину "чужих глюков" - респект
3.Ы. по слухам у кингстоне это далеко не первый случай и вообще явление распространное при использовании етих матерей.

Astrons
Junior member
Сообщения: 17
Зарегистрирован: 02 окт 2004, 23:08
Откуда: Рига, Латвия
Контактная информация:

Сообщение Astrons » 10 сен 2006, 11:23

:idea: Intel server boards that do not have a mBMC or server boards that have an Intel® Management Module
installed are not subject to this Action Alert...

Надо ставить этот модуль (60$) и проблем не будет... (хочется верить) ;)

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 17 гостей