Отваливается корзина/винты в SROMSAS18E

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
ramka
Junior member
Сообщения: 4
Зарегистрирован: 20 авг 2012, 18:57
Откуда: Москва

Отваливается корзина/винты в SROMSAS18E

Сообщение ramka » 20 авг 2012, 19:28

Добрый день.

Имеется сервер Intel.
Intel SC5400, 5U Tower, 670W (SC5400BASE)
MB S5000PSLROMB (плата Raid SROMBSAS18E)
Ключ активации INTEL SAS RAID AXXRAK18E
корзина на 4 винта AXX4DRV3GEXP
корзина на 6 винтов AXX6DRV3GEXP

В корзине на 4 винта живет рейд 10 (VD0).
В корзине на 6 винтов живут винты (VD2 и VD3, оба одиночные raid0 и VD1 рейд1 из двух винтов + hotspare).
Поменял BBU на свежую (т.к. старая попросила замены от старости) и начались проблемы.

При первом включении в рейд-биос сказал, что "отсутствуют VD1, VD2 и VD3 (всё что в корзине на 6 винтов) - "Продолжайте и я их забуду или выключите сервер, проверьте и включайте".
Я выключил/включил сервер - контроллер их нормально увидел.
Потом делал несколько перезагрузок - в 50% случаев он их не видел опять.

При этом рейд10, который в корзине на 4 винта видится и работает без проблем.
Проблемы только со всеми винтами в корзине на 6 дисков.

Далее включил сервер (с работающими VD2 и VD3 а VD1 вынул, т.к. ненужен в данный момент), все работало.
Через несколько часов VD2 (одиночный винт, рейд 0) отвалился. Попробовал его "force online" - не захотел.

А затем и VD3 (одиночный винт, рейд 0) отвалился.
Ребут, не видит VD2 и VD3, ок, пусть забывает их (т.к. работать надо, а основные данные на VD0 корзине на 4, которые не отваливаются).
В результате в WebRaidConsole только корзина на 4 винта с рейдом плюс один из винтов из второй корзины в состоянии Uncofigured Bad:
Изображение

При этом у меня куча Warning'ов типа
Controller ID: 0 PD Reset: PD = :17, Error = 3, Path = 50:01:e6:71:46:db:a0:0b
Controller ID: 0 PD Reset: PD = : :0, Error = 3, Path = 50:01:e6:71:46:db:a0:01
Controller ID: 0 Error: : :0 (Error 240)
Controller ID: 0 Command timeout on PD: PD = : :0 - No addtional sense information, CDB = 0x28 0x00 0x02 0x89 0x50 0x00 0x00 0x08 0x00 0x00 , Sense = 50:01:e6:71:46:db:a0:01, Path =

И немного событий Fatal:
Controller ID: 0 VD is now OFFLINE VD 2
Controller ID: 0 VD is now OFFLINE VD 3
Controller ID: 0 Fatal firmware error: Line 205 in ../../raid/mfihw.c
Controller ID: 0 Fatal firmware error: Driver detected possible FW hang, halting FW.
и пару Critical
Controller ID: 0 SAS topology error: SMP timeout

В чем скорее всего проблема? Что посоветуете?

Garra-67
Advanced member
Сообщения: 111
Зарегистрирован: 20 янв 2008, 14:48
Откуда: Smolensk

Re: Отваливается корзина/винты в SROMSAS18E

Сообщение Garra-67 » 20 авг 2012, 22:00

Сата винты в корзинах этих работать не будут нормально, только САС.
Был у меня опыт, выкинул в помойку и купил норм корпус -)

ramka
Junior member
Сообщения: 4
Зарегистрирован: 20 авг 2012, 18:57
Откуда: Москва

Re: Отваливается корзина/винты в SROMSAS18E

Сообщение ramka » 20 авг 2012, 23:03

Около года работали.
Да и насколько я понимаю, корзина сама отвалилась как-то.
И SAS винты (массив VD1, который я вынул сразу тоже отвалились вместе с двумя SATA).

Garra-67
Advanced member
Сообщения: 111
Зарегистрирован: 20 янв 2008, 14:48
Откуда: Smolensk

Re: Отваливается корзина/винты в SROMSAS18E

Сообщение Garra-67 » 20 авг 2012, 23:18

Сообщения вида PD Reset: PD и Unexpected sense: PD - сразу намекают, что есть какието проблемы и не нужно ждать когда все развалится. Это особенность работы сата дисков, САС протокол частично совместим с сата, и на команды, которые диск не понимает он дает многократно Unexpected sense: PD после чего уход в PD Reset.
У рейда тоже есть таймауты доступа диска, если такой ресет укладываетя в этот таймаут то проносит, если нет, массив разваливается.

ramka
Junior member
Сообщения: 4
Зарегистрирован: 20 авг 2012, 18:57
Откуда: Москва

Re: Отваливается корзина/винты в SROMSAS18E

Сообщение ramka » 21 авг 2012, 02:38

Воткнул три SAS винта в корзину на 6 дисков а один из двух SATA вынул.
Сделал Scan Foreign Configuration.
Три SAS винта появились как VirtualDrive, а на SATA винт (был одиночный рейд0) сказал Fail на Scan Foreign Configuration.
Но при этом в WebRaidConsole2 я вижу в древовидной структуре, что они не в корзине а сами по себе (раньше вроде были как другие 4 SAS винта ы другой корзине).
Изображение

Разве они не должны отображаться в корзине?

==========================================
Updated
Выключил сервер.
Вынул Рейд контроллер, и из него BBU и ключ активации. Собрал обратно (Вычитал, что это помогает от долгого FW initialization при включении компьютера. Помогло кстати от этого).
Загрузился.
Винты стали отображаться в корзине. И номера слотов стали правильными.
Изображение

Вы думаете, что винты могут отображаться то в корзине, то вне корзины из-за наличия САТА диска?

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 31 гость