Intel SRCSAS144e сбои
Модераторы: Trinity admin`s, Free-lance moderator`s
Intel SRCSAS144e сбои
При перекачке файлов между логическими дисками массива происходят ошибки файловой системы (например копирование прерывется по ошибке), перезагрузка сервера решает проблему но лишь на время. Стоит Intel SRCSAS144e (1.12.170-0471) 4 диска Fujitsu mba3147rc в raid5. Вопрос - виноват-ли контроллер и стоит-ли обновлять прошивку?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Intel SRCSAS144e сбои
Ну начать стоит с верификации массива.
А потом обновить прошивку и драйвер.
А потом обновить прошивку и драйвер.
-
- Advanced member
- Сообщения: 507
- Зарегистрирован: 17 апр 2009, 00:49
- Откуда: Yerevan
Re: Intel SRCSAS144e сбои
Может быть от проблем с памятью (ОЗУ), либо глюки ОС, в том числе не по вине самой ОС (например, у нас было такое: кто-то экспериментировал и ставил "драйвера" не поддерживаемых ОС ФС, в итоге куча файлов и папок были убиты. Правда, было это не на сервере, конечно, а на личном ПК "преступника").metredat писал(а):При перекачке файлов между логическими дисками массива происходят ошибки файловой системы
Re: Intel SRCSAS144e сбои
ОЗУ тестировал memtest86 все ок Prime95 работает несколько часов, подозрения однозначно на дисковую подсистему...Black-Dragon писал(а):Может быть от проблем с памятью (ОЗУ), либо глюки ОС, в том числе не по вине самой ОС (например, у нас было такое: кто-то экспериментировал и ставил "драйвера" не поддерживаемых ОС ФС, в итоге куча файлов и папок были убиты. Правда, было это не на сервере, конечно, а на личном ПК "преступника").metredat писал(а):При перекачке файлов между логическими дисками массива происходят ошибки файловой системы
Re: Intel SRCSAS144e сбои
пробовали и перемонтировать массив и переставляли винду с разными версиями raid драйвера, причем ошибка такого характера, что первые пару часов что угодно с сервером делай - все работает, а часа через 4 начинают лететь ошибки...gs писал(а):Ну начать стоит с верификации массива.
А потом обновить прошивку и драйвер.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Intel SRCSAS144e сбои
Что имеется в виду под перемонтированием массива?
Re: Intel SRCSAS144e сбои
массив был удален и создан зановоgs писал(а):Что имеется в виду под перемонтированием массива?
-
- Advanced member
- Сообщения: 507
- Зарегистрирован: 17 апр 2009, 00:49
- Откуда: Yerevan
Re: Intel SRCSAS144e сбои
Если на 100% уверены, что не ОЗУ (указанные вами тесты устарели, IMHO, и не очень подходят под новые чипсеты\платформы), то могут быть также: перегрев (CPU, RAM, HDD, чего угодно), глюки БП.
Попробуйте с открытым корпусом в охлаждаемом помещении.
Попробуйте с открытым корпусом в охлаждаемом помещении.
Re: Intel SRCSAS144e сбои
сервер стоит в отдельном помещении без окон с кондиционером, температура в комнате +18, порекомендуйте тесты под серверное железо (чипсет 5000, память 4х4Gb процы Xeon'ы 45-микронные E5430 2 шт - темп. проц.ядер 45гр.)Black-Dragon писал(а):Если на 100% уверены, что не ОЗУ (указанные вами тесты устарели, IMHO, и не очень подходят под новые чипсеты\платформы), то могут быть также: перегрев (CPU, RAM, HDD, чего угодно), глюки БП.
Попробуйте с открытым корпусом в охлаждаемом помещении.
- DeadMazay
- Advanced member
- Сообщения: 1743
- Зарегистрирован: 20 сен 2007, 15:07
- Откуда: Новосибирск, Мск
- Контактная информация:
Re: Intel SRCSAS144e сбои
у вас диски как подключены... кузов и корзинка какие?metredat писал(а):сервер стоит в отдельном помещении без окон с кондиционером, температура в комнате +18, порекомендуйте тесты под серверное железо (чипсет 5000, память 4х4Gb процы Xeon'ы 45-микронные E5430 2 шт - темп. проц.ядер 45гр.)Black-Dragon писал(а):Если на 100% уверены, что не ОЗУ (указанные вами тесты устарели, IMHO, и не очень подходят под новые чипсеты\платформы), то могут быть также: перегрев (CPU, RAM, HDD, чего угодно), глюки БП.
Попробуйте с открытым корпусом в охлаждаемом помещении.
-
- Advanced member
- Сообщения: 507
- Зарегистрирован: 17 апр 2009, 00:49
- Откуда: Yerevan
Re: Intel SRCSAS144e сбои
Пардон, проглядел, memtest86 нормальный тест, показалось testmem (очень старый тест).
А вообще, на прогрев и стабильность можно попробовать Intel Burn Test и встроенный в RMMA тест памяти.
Если память и ЦПУ пройдут тесты, проверьте температуру дисков и неплохо бы ещё поменять кабели плюс БП. Больше ничего придумать не могу (учитывая, что вы несколько раз переставляли систему, и наверняка, мусора в ней особого нет, проблема, скорее всего железная, а не софтовая. Хотя драйвера\прошивки тоже не помешало бы обновить).
А вообще, на прогрев и стабильность можно попробовать Intel Burn Test и встроенный в RMMA тест памяти.
Если память и ЦПУ пройдут тесты, проверьте температуру дисков и неплохо бы ещё поменять кабели плюс БП. Больше ничего придумать не могу (учитывая, что вы несколько раз переставляли систему, и наверняка, мусора в ней особого нет, проблема, скорее всего железная, а не софтовая. Хотя драйвера\прошивки тоже не помешало бы обновить).
Re: Intel SRCSAS144e сбои
диски подключены через корзину AXX6DRV3GEXP, корпус Intel SC5400BRP корзины AXX6DRV3GEXP и AXX4DRV3GEXP (б/п intel 830W) кстати корзины тоже не помешало-бы перепрошить?DeadMazay писал(а):у вас диски как подключены... кузов и корзинка какие?
- DeadMazay
- Advanced member
- Сообщения: 1743
- Зарегистрирован: 20 сен 2007, 15:07
- Откуда: Новосибирск, Мск
- Контактная информация:
Re: Intel SRCSAS144e сбои
угу... прошить корзины (мать тоже, если не последние прошивки)... контроллер (естественно бэкап нужен)... перед прошавкой корзины читать инструкцию, дабы не потерять массивmetredat писал(а):диски подключены через корзину AXX6DRV3GEXP, корпус Intel SC5400BRP корзины AXX6DRV3GEXP и AXX4DRV3GEXP (б/п intel 830W) кстати корзины тоже не помешало-бы перепрошить?DeadMazay писал(а):у вас диски как подключены... кузов и корзинка какие?
Re: Intel SRCSAS144e сбои
был приобретен контроллер intel srcsasrb, новая корзина, сменен кабель между контроллером и корзиной, установлены все новые прошивки, система стала работать быстрее но ошибка копирования осталась. Остается грешить на матплату и порт pci-e на ней - это аппаратно (еще на сервере стоит kaspersky file server Enterprise Edition и Гарант при выключении одного из них ошибка становится реже при выключении обоих практически сходит на нет - все ПО лицензионное, если ошибку вызывает ПО ????), есть ли еще идеи как решить проблему???
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 25 гостей