SRCS16 RAID10 раз в неделю отваливается один HDD

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Jack_Pot
Junior member
Сообщения: 11
Зарегистрирован: 10 апр 2008, 20:33
Откуда: Тольятти

SRCS16 RAID10 раз в неделю отваливается один HDD

Сообщение Jack_Pot » 10 апр 2008, 21:15

Всем привет!
Пару лет исправно работал Интеловский контроллер SRCS16 с четырьмя SATA дисками, собранными в RAID 10. Вдруг начал периодически отваливаться один и тот же диск. Замена на такой же новый ни к чему не приводит: диск после ребилда включается, работает до ближайших выходных (как назло, суббота или воскресенье), а каждый понедельник начинается с писка из серверной :( . Пятый диск в хот свап поставить не могу, так как места нет больше в корпусе. Диски WD Raptor, отвалившийся вытаскиваю, прогоняю утилитой от WD, пишет, что все Ok. Если принудительно запускаю консистенси чек, все проходит нормально, но опять же, до ближайших выходных....
Может ли кто-нибудь посоветовать решение?

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Сообщение KAI » 11 апр 2008, 08:37

ожет быть проблема в sata кабеле или бэкплейне. начните с кабеля, хотя бы просто переткните, если есть возможность замените. после этого меняйте бэкплейн. совсем грустный вариант - битый порт на контроллере. все возможно.

Jack_Pot
Junior member
Сообщения: 11
Зарегистрирован: 10 апр 2008, 20:33
Откуда: Тольятти

Сообщение Jack_Pot » 11 апр 2008, 09:42

KAI,
спасибо за ответ, SATA кабель я уже пробовал менять - не помогло. Почитал доки к контроллеру, там сказано,  что инфа о дисках содержится как на самих HDD, так и на контроллере, и что если массив в рабочем состоянии, то можно переткнуть этот диск в другой порт контроллера. Собираюсь это попробовать сделать, только хочу сначала на всякий случай прогнать консистенси чек перед этой процедурой. Порты свободные есть на контроллере.
На этом сервере запущен MegaServ, который при сбое валит в лог вот что:
Adapter 1 Channel 1 Target 3:
Physical Drive WDC     WD740GD-00FLA2  31.0 is in FAILED state. Reason_0=Fail by host. Reason_1=Command timeout. Reason_2=Select timeout. Reason_3=Failed command. Reason_4=Failed command. Reason_5=Failed command. Reason_6=Failed command. Reason_7=Command timeout. Reason_8=Command timeout.
Не наведет ли это вас на другие мысли?

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Сообщение KAI » 11 апр 2008, 10:32

Только эксперимент :-) Timeout это косвено подтверждает. Смените порт. Но более вероятно - порт в бэкплайне.

Jack_Pot
Junior member
Сообщения: 11
Зарегистрирован: 10 апр 2008, 20:33
Откуда: Тольятти

Сообщение Jack_Pot » 11 апр 2008, 11:21

Просветите, pls, что такое бекплайн. К своему стыду не совсем понимаю этот термин :(

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Сообщение KAI » 11 апр 2008, 11:43

собственно это текстолитовая пластина с разъемами SATA для HOT PLUG подключения дисков
Последний раз редактировалось KAI 11 апр 2008, 11:55, всего редактировалось 1 раз.

Jack_Pot
Junior member
Сообщения: 11
Зарегистрирован: 10 апр 2008, 20:33
Откуда: Тольятти

Сообщение Jack_Pot » 11 апр 2008, 11:54

спасибо за исчерпывающий ответ :)
буду пробовать менять порты.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 24 гостя