Форум Тринити

Открытый технический форум по серверам и системам хранения данных, кластерным решениям, SAN, NAS.
Microsemi infortrend storage
Текущее время: 11 дек 2018, 07:24

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 14 ] 
Автор Сообщение
СообщениеДобавлено: 11 мар 2017, 05:53 
Не в сети
Junior member

Зарегистрирован: 11 мар 2017, 05:41
Сообщения: 7
Откуда: Novosibirsk
сервер на плате Supermicro x9DRL-3f работал 3 года. вдруг стали сыпаться ошибки памяти. Ни тесты Вин 2008R2 не проходят, ни GoldMemory. Стоит 8 планок по 4 гига. Стал искать сбойную. При любых вариантах (количество планок и их размещение) шли ошибки.
Проблему нашел в сетевых контроллерах. На плате 2 порта 82574l. Пока нет активности на портах - нет ошибок памяти (линк может быть поднят, но обмен не идет). Как только пошел обмен в сетевухе, так сразу ошибки памяти (в любом порту). Пока отключил встроенные сетевые перемычками на плате и поставил внешнюю PCI (как временное решение).
Есть ли смысл/возможность прошить ROM сетевух?
Что вообще произошло?
BIOS сбрасывал не помогло.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 13:30 
Не в сети
Junior member

Зарегистрирован: 26 апр 2012, 13:43
Сообщения: 16
Откуда: Moscow
У меня три года работало-работало, а потом стали отваливаться по очереди встроенные 82574 - причем отваливались так, что только полная перезагрузка помогала.

На сайте Супермикро куча всяких решений, но мне ничего не помогало..

Отключил карты, воткнул внешнюю i210 и успокоился. Хотя мне тоже долго не давала покоя мысль, что как же так - три года отпахало, а потом отвалилось. Причем, это сервер с Hyper-V был - там ни единого изменения не было, ни единого драйвера не обновилось и ни одного апдейта не накатилось.. Там и перезагрузок то за 3 года было 2 штуки, а вот поди ж ты.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 13:40 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 14 ноя 2003, 17:25
Сообщения: 13040
Откуда: СПб, Екатеринбург
Сервера не знаю, мало их продаем, но ноутбуки ХП грешат отвалом сетевых адаптеров. Приходится докупать внешние модули. Так что Микра не одинока в данном вопросе.

_________________
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 14:01 
Не в сети
Junior member

Зарегистрирован: 11 мар 2017, 05:41
Сообщения: 7
Откуда: Novosibirsk
Да понятно, когда сетевые просто отваливаются, но причем тут память? И оба адаптера сразу, чудеса. Внешнюю сетевуху куда подключать? В PCI-E CPU или PCI-E PCH ? Есть какая нибудь статистика (быстрее/медленнее, надежнее )? То что сразу оба чипа 82574 глючат, не может указывать на проблемы с PCH ? (покупать сетевую или искать на замену материнку)?


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 14:17 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 14 ноя 2003, 17:25
Сообщения: 13040
Откуда: СПб, Екатеринбург
Winlin_ писал(а):
(покупать сетевую или искать на замену материнку)?

Ну надо признать, что на Микре такое не часто встречается. В моей практике вы если не первый, то где-то близко. У ХП частенько. Так что какой-то вменяемый совет дать трудно. Сервер уже не гарантийный?

_________________
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 14:40 
Не в сети
Junior member

Зарегистрирован: 11 мар 2017, 05:41
Сообщения: 7
Откуда: Novosibirsk
как обычно гарантия кончилась 2 месяца назад :( . Боюсь как бы сам РСН не подпалился. Да и вообще не понят но это софтовая проблема или железная.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 14:54 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 14 ноя 2003, 17:25
Сообщения: 13040
Откуда: СПб, Екатеринбург
Winlin_ писал(а):
как обычно гарантия кончилась 2 месяца назад :( .

Это заговор, :mrgreen: . А если серьезно, то с внешней сетевухой вполне может отработать еще года 3. Но само собой, гарантий никто не даст. В данной ситуации настраивайте ежедневный бекап и молитесь, чтобы не рухнуло. Ну или можно подобрать не сильно дорогой однопроцессорный серверок. Думаю по производительности будет не хуже, а может и лучше.

_________________
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 15:00 
Не в сети
Junior member

Зарегистрирован: 11 мар 2017, 05:41
Сообщения: 7
Откуда: Novosibirsk
Да бекапы наще все :) ежедневно делаются, а что по поводу в какой PCI-E ставить внешнюю сетевуху. (процессорный или РСН) ?


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 15:08 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 14 ноя 2003, 17:25
Сообщения: 13040
Откуда: СПб, Екатеринбург
Winlin_ писал(а):
а что по поводу в какой PCI-E ставить внешнюю сетевуху. (процессорный или РСН) ?

Честно, не знаю, 8). Опять же, работает и ладно, :)

_________________
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 16:35 
Не в сети
Advanced member

Зарегистрирован: 18 июн 2010, 11:22
Сообщения: 229
Откуда: C.Петербург
ещё стандартная рекомендация - почистить контакты процессора. т.к. контроллер памяти и pcie в процессоре, то плохой контакт в сокете может приводить к самым разнообразным глюкам.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 18:29 
Не в сети
Junior member

Зарегистрирован: 11 мар 2017, 05:41
Сообщения: 7
Откуда: Novosibirsk
а как это делается (чистить сокет или сам проц, как чистить сокет вообще не представляю)? и что реально бывает что процессор, которого никто не трогает, вдруг теряет контакт?

Вообще я после появления проблемы процессоры местами переставлял и по одному оставлял, пока нашел что это сеть (ситуация не менялась).


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 13 мар 2017, 19:13 
Не в сети
Advanced member

Зарегистрирован: 18 июн 2010, 11:22
Сообщения: 229
Откуда: C.Петербург
Winlin_ писал(а):
а как это делается (чистить сокет или сам проц, как чистить сокет вообще не представляю)? и что реально бывает что процессор, которого никто не трогает, вдруг теряет контакт?

Вообще я после появления проблемы процессоры местами переставлял и по одному оставлял, пока нашел что это сеть (ситуация не менялась).


сам сокет надо посмотреть под разными углами зрения, если есть какая-то ножка не совсем прямая, то будет видно. имеет смысл протереть спиртом контакты на процессоре.
да, очень редко, но бывает. но если уже меняли процессора местами, и проблема осталась, то вряд ли это поможет.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 14 мар 2017, 04:23 
Не в сети
Junior member

Зарегистрирован: 11 мар 2017, 05:41
Сообщения: 7
Откуда: Novosibirsk
Запустил на ночь GoldMemory 7.85
прошел тест - ошибок не выдал, но в System Event Log появилась запись " Memory| Event = Uncorrectable ECC@DIMME1(CPU2)"

как два этих события могут быть одновременно? Тест прошел , а память с ошибкой.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 22 окт 2017, 20:45 
Не в сети
Junior member

Зарегистрирован: 11 мар 2017, 05:41
Сообщения: 7
Откуда: Novosibirsk
вот здесь viewtopic.php?f=2&t=23790

написано что IPMI 3.48 есть для этой платы, а на сайте только 3.39. 3.48 точно подойдет?


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 14 ] 

Часовой пояс: UTC + 3 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и гости: 6


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB