Intel SRCSAS144e сбои

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
metredat
Junior member
Сообщения: 7
Зарегистрирован: 25 июн 2009, 12:53
Откуда: Msk

Intel SRCSAS144e сбои

Сообщение metredat » 25 июн 2009, 13:09

При перекачке файлов между логическими дисками массива происходят ошибки файловой системы (например копирование прерывется по ошибке), перезагрузка сервера решает проблему но лишь на время. Стоит Intel SRCSAS144e (1.12.170-0471) 4 диска Fujitsu mba3147rc в raid5. Вопрос - виноват-ли контроллер и стоит-ли обновлять прошивку?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Intel SRCSAS144e сбои

Сообщение gs » 25 июн 2009, 13:11

Ну начать стоит с верификации массива.
А потом обновить прошивку и драйвер.

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: Intel SRCSAS144e сбои

Сообщение Black-Dragon » 25 июн 2009, 13:50

metredat писал(а):При перекачке файлов между логическими дисками массива происходят ошибки файловой системы
Может быть от проблем с памятью (ОЗУ), либо глюки ОС, в том числе не по вине самой ОС (например, у нас было такое: кто-то экспериментировал и ставил "драйвера" не поддерживаемых ОС ФС, в итоге куча файлов и папок были убиты. Правда, было это не на сервере, конечно, а на личном ПК "преступника").

metredat
Junior member
Сообщения: 7
Зарегистрирован: 25 июн 2009, 12:53
Откуда: Msk

Re: Intel SRCSAS144e сбои

Сообщение metredat » 25 июн 2009, 14:00

Black-Dragon писал(а):
metredat писал(а):При перекачке файлов между логическими дисками массива происходят ошибки файловой системы
Может быть от проблем с памятью (ОЗУ), либо глюки ОС, в том числе не по вине самой ОС (например, у нас было такое: кто-то экспериментировал и ставил "драйвера" не поддерживаемых ОС ФС, в итоге куча файлов и папок были убиты. Правда, было это не на сервере, конечно, а на личном ПК "преступника").
ОЗУ тестировал memtest86 все ок Prime95 работает несколько часов, подозрения однозначно на дисковую подсистему...

metredat
Junior member
Сообщения: 7
Зарегистрирован: 25 июн 2009, 12:53
Откуда: Msk

Re: Intel SRCSAS144e сбои

Сообщение metredat » 25 июн 2009, 14:10

gs писал(а):Ну начать стоит с верификации массива.
А потом обновить прошивку и драйвер.
пробовали и перемонтировать массив и переставляли винду с разными версиями raid драйвера, причем ошибка такого характера, что первые пару часов что угодно с сервером делай - все работает, а часа через 4 начинают лететь ошибки...

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Intel SRCSAS144e сбои

Сообщение gs » 25 июн 2009, 14:52

Что имеется в виду под перемонтированием массива?

metredat
Junior member
Сообщения: 7
Зарегистрирован: 25 июн 2009, 12:53
Откуда: Msk

Re: Intel SRCSAS144e сбои

Сообщение metredat » 25 июн 2009, 15:19

gs писал(а):Что имеется в виду под перемонтированием массива?
массив был удален и создан заново

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: Intel SRCSAS144e сбои

Сообщение Black-Dragon » 25 июн 2009, 15:20

Если на 100% уверены, что не ОЗУ (указанные вами тесты устарели, IMHO, и не очень подходят под новые чипсеты\платформы), то могут быть также: перегрев (CPU, RAM, HDD, чего угодно), глюки БП.

Попробуйте с открытым корпусом в охлаждаемом помещении.

metredat
Junior member
Сообщения: 7
Зарегистрирован: 25 июн 2009, 12:53
Откуда: Msk

Re: Intel SRCSAS144e сбои

Сообщение metredat » 25 июн 2009, 16:22

Black-Dragon писал(а):Если на 100% уверены, что не ОЗУ (указанные вами тесты устарели, IMHO, и не очень подходят под новые чипсеты\платформы), то могут быть также: перегрев (CPU, RAM, HDD, чего угодно), глюки БП.

Попробуйте с открытым корпусом в охлаждаемом помещении.
сервер стоит в отдельном помещении без окон с кондиционером, температура в комнате +18, порекомендуйте тесты под серверное железо (чипсет 5000, память 4х4Gb процы Xeon'ы 45-микронные E5430 2 шт - темп. проц.ядер 45гр.)

Аватара пользователя
DeadMazay
Advanced member
Сообщения: 1743
Зарегистрирован: 20 сен 2007, 15:07
Откуда: Новосибирск, Мск
Контактная информация:

Re: Intel SRCSAS144e сбои

Сообщение DeadMazay » 25 июн 2009, 16:33

metredat писал(а):
Black-Dragon писал(а):Если на 100% уверены, что не ОЗУ (указанные вами тесты устарели, IMHO, и не очень подходят под новые чипсеты\платформы), то могут быть также: перегрев (CPU, RAM, HDD, чего угодно), глюки БП.

Попробуйте с открытым корпусом в охлаждаемом помещении.
сервер стоит в отдельном помещении без окон с кондиционером, температура в комнате +18, порекомендуйте тесты под серверное железо (чипсет 5000, память 4х4Gb процы Xeon'ы 45-микронные E5430 2 шт - темп. проц.ядер 45гр.)
у вас диски как подключены... кузов и корзинка какие?

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: Intel SRCSAS144e сбои

Сообщение Black-Dragon » 25 июн 2009, 16:43

Пардон, проглядел, memtest86 нормальный тест, показалось testmem (очень старый тест).
А вообще, на прогрев и стабильность можно попробовать Intel Burn Test и встроенный в RMMA тест памяти.

Если память и ЦПУ пройдут тесты, проверьте температуру дисков и неплохо бы ещё поменять кабели плюс БП. Больше ничего придумать не могу (учитывая, что вы несколько раз переставляли систему, и наверняка, мусора в ней особого нет, проблема, скорее всего железная, а не софтовая. Хотя драйвера\прошивки тоже не помешало бы обновить).

metredat
Junior member
Сообщения: 7
Зарегистрирован: 25 июн 2009, 12:53
Откуда: Msk

Re: Intel SRCSAS144e сбои

Сообщение metredat » 25 июн 2009, 17:07

DeadMazay писал(а):у вас диски как подключены... кузов и корзинка какие?
диски подключены через корзину AXX6DRV3GEXP, корпус Intel SC5400BRP корзины AXX6DRV3GEXP и AXX4DRV3GEXP (б/п intel 830W) кстати корзины тоже не помешало-бы перепрошить?

Аватара пользователя
DeadMazay
Advanced member
Сообщения: 1743
Зарегистрирован: 20 сен 2007, 15:07
Откуда: Новосибирск, Мск
Контактная информация:

Re: Intel SRCSAS144e сбои

Сообщение DeadMazay » 25 июн 2009, 17:40

metredat писал(а):
DeadMazay писал(а):у вас диски как подключены... кузов и корзинка какие?
диски подключены через корзину AXX6DRV3GEXP, корпус Intel SC5400BRP корзины AXX6DRV3GEXP и AXX4DRV3GEXP (б/п intel 830W) кстати корзины тоже не помешало-бы перепрошить?
угу... прошить корзины (мать тоже, если не последние прошивки)... контроллер (естественно бэкап нужен)... перед прошавкой корзины читать инструкцию, дабы не потерять массив

metredat
Junior member
Сообщения: 7
Зарегистрирован: 25 июн 2009, 12:53
Откуда: Msk

Re: Intel SRCSAS144e сбои

Сообщение metredat » 14 сен 2009, 10:34

был приобретен контроллер intel srcsasrb, новая корзина, сменен кабель между контроллером и корзиной, установлены все новые прошивки, система стала работать быстрее но ошибка копирования осталась. Остается грешить на матплату и порт pci-e на ней - это аппаратно (еще на сервере стоит kaspersky file server Enterprise Edition и Гарант при выключении одного из них ошибка становится реже при выключении обоих практически сходит на нет - все ПО лицензионное, если ошибку вызывает ПО ????), есть ли еще идеи как решить проблему???

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 25 гостей