!!!ПОМОГИТЕ!!! - Писк сервера

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
antonz
Junior member
Сообщения: 7
Зарегистрирован: 07 фев 2006, 15:45

!!!ПОМОГИТЕ!!! - Писк сервера

Сообщение antonz » 07 фев 2006, 16:31

Конфигурация сервера: мать - X6DVA-4G, i7320, 2PCIx, 1PCI, 1PCI4x, 6DDR, 2SATA, ATI8Mb, 2LAN1000, LSI 53C1020 - одноканальный SCSI,
SCSI контроллер Adaptec ASR-2130SLP 128Mb OEM, харды - Fujitsu MAT3073NC 73Gb 10000rpm SCSI U320 SCA 80 pin - 5 штук, корзина - SC823S-550LP, 550W, Low Profile, HS6SCSI, FDD, w/o CD.

Проблема: После установки на сервере RAID 5 и OC Win2003Ser, ставил его на тестирование. Сервак начинает пищать на тестах файловой системы - сигнализируя, что выпал один из дисков. Однако ОС работает. После перезагрузки Adaptec говорит, что массив нарушен (degraded). При проверке дисков утилитой Adaptec обнаруживаются ошибки на нескольких дисках, а также показывает вывалившиеся диск или диски (каждый раз разные). Была заменена Мать и SCSI адаптер, перепрошивал все, но ничего не помогает. Потом Поменял винты на HP'ые - 3 шт (чтобы RAID 5 поставить) - сервер также запищал на тестах файловой системы. После установки обратно винтов (5 шт. Fuji) и запуске с CD фирмовой утилиты Adaptec Sorage Manager, утилита показала ошибки SMART всех пяти дисков!!! Может ли такое вообще быть? Однако я создал этой утилитой RAID 5.

Вопрос: Что же все-таки неисправно - винты, корзина или кабель? Может быть дело в совместимости прошивок матери и adaptec? Помогите пожалуйста!!!

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 07 фев 2006, 16:36

Первым делом я бы кабель сменил.

antonz
Junior member
Сообщения: 7
Зарегистрирован: 07 фев 2006, 15:45

Сообщение antonz » 07 фев 2006, 17:11

Но ведь массив создается, диски определяются, ОС тоже встает!!! Неужели после этого можно грешить на кабель?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 07 фев 2006, 17:18

На кабель можно грешить почти всегда. Вы не меняли только контроллер,  кабель и корзину. Значит кто-то из них ху.
Попробуйте понизить частоту скази шины на ступень - поставить U160 (80MHz). Это часто помогает локализовать чисто сказевые проблемы. Т.е. если проблема исчезнет, значит скорее всего кабель-корзина. Правда если она не исчезнет, подозрение с них снимать все же нельзя.
Также может плющить контроллер или корзину - например микротрещина или еще что. Редко, но бывало.

antonz
Junior member
Сообщения: 7
Зарегистрирован: 07 фев 2006, 15:45

Сообщение antonz » 08 фев 2006, 09:09

Ясно.  Только не понятно следствием чего являютя ошибки SMART всех хардов?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 09 фев 2006, 12:23

Если плющит скази шину, то могут быть любые ошибки и Вы, возможно, еще отделались легким испугом. Правда я на 100% не уверен на кабельную систему, но очень на то похоже.

antonz
Junior member
Сообщения: 7
Зарегистрирован: 07 фев 2006, 15:45

Сообщение antonz » 13 фев 2006, 08:51

Уменьшил частоту SCSI до U160 - глюков стало меньше, но проблема не исчезла, все равно периодически вылетает диск. Поменяли кабель (стоял обычный с двумя разъемами, сейчас с терминатором на конце) - не помогает. И SMART ошибки в статусе дисков не изчезли. Может быть  попробовать поменять еще какие-нибудь хитрые установки (кеширование записи, strip size)? При проверке дисков adaptec'овской утилитой, на некоторых дисках обнаруживаются ошибки, которые исправляются только форматированием. Причем ошибки возникают каждый раз после сбоя на разных дисках и обнаруживаются в начале диска. На сервере уже заменено все кроме корзины и дисков. И еще один момент, создание массива идет как-то вяло. Раньше процесс занимал 2ч, сейчас это растягивается на 3ч.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 13 фев 2006, 10:34

стоял обычный с двумя разъемами, сейчас с терминатором на конце
Зачем? Терминатор в данном случае не нужен  :!:
Если у Вас проблемы с дисками (причем на физическом уровне), почему так категорически не хочется диски таки заменить  :?:  Или Вы надеетесь на чудо и исправить битые диски настройками на контроллере?

antonz
Junior member
Сообщения: 7
Зарегистрирован: 07 фев 2006, 15:45

Сообщение antonz » 13 фев 2006, 12:27

Я так понял, что терминатор отрицательно сказывается на работе или он не оказывает существенного влияния?

antonz
Junior member
Сообщения: 7
Зарегистрирован: 07 фев 2006, 15:45

Сообщение antonz » 14 фев 2006, 08:52

Вчера вечером сервер снова запищал, выпал из массива 3 диск. Сейчас ребилдится. Прикрепил еще все логи (адаптековские и виндовые), может они что-нибудь прояснят. Уже поменяли все кроме БП и дисков.
Вложения
Events.doc
(47 КБ) 594 скачивания

antonz
Junior member
Сообщения: 7
Зарегистрирован: 07 фев 2006, 15:45

Сообщение antonz » 26 фев 2006, 09:32

Опять по поводу сервака. Мне удалось решить проблему со SMART ошибками всех дисков путем сброса этих показаний. После этого сервер стал работать стабильнее (выдержал тестирование четверг, пятницу - 2000 циклов). Затем я перезагрузился и проверил поверхность дисков - ошибок на них не было. Я решил еще раз задать тесты и после загрузки ОС, зайдя в Adaptec Storage
Manager, на моих глазах вылетел 3 диск, массив был нарушен (degraded). Есть ли еще какое-нибудь средство, кроме ручной установки частоты?

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и 23 гостя