Отваливается корзина/винты в SROMSAS18E
Модераторы: Trinity admin`s, Free-lance moderator`s
Отваливается корзина/винты в SROMSAS18E
Добрый день.
Имеется сервер Intel.
Intel SC5400, 5U Tower, 670W (SC5400BASE)
MB S5000PSLROMB (плата Raid SROMBSAS18E)
Ключ активации INTEL SAS RAID AXXRAK18E
корзина на 4 винта AXX4DRV3GEXP
корзина на 6 винтов AXX6DRV3GEXP
В корзине на 4 винта живет рейд 10 (VD0).
В корзине на 6 винтов живут винты (VD2 и VD3, оба одиночные raid0 и VD1 рейд1 из двух винтов + hotspare).
Поменял BBU на свежую (т.к. старая попросила замены от старости) и начались проблемы.
При первом включении в рейд-биос сказал, что "отсутствуют VD1, VD2 и VD3 (всё что в корзине на 6 винтов) - "Продолжайте и я их забуду или выключите сервер, проверьте и включайте".
Я выключил/включил сервер - контроллер их нормально увидел.
Потом делал несколько перезагрузок - в 50% случаев он их не видел опять.
При этом рейд10, который в корзине на 4 винта видится и работает без проблем.
Проблемы только со всеми винтами в корзине на 6 дисков.
Далее включил сервер (с работающими VD2 и VD3 а VD1 вынул, т.к. ненужен в данный момент), все работало.
Через несколько часов VD2 (одиночный винт, рейд 0) отвалился. Попробовал его "force online" - не захотел.
А затем и VD3 (одиночный винт, рейд 0) отвалился.
Ребут, не видит VD2 и VD3, ок, пусть забывает их (т.к. работать надо, а основные данные на VD0 корзине на 4, которые не отваливаются).
В результате в WebRaidConsole только корзина на 4 винта с рейдом плюс один из винтов из второй корзины в состоянии Uncofigured Bad:
При этом у меня куча Warning'ов типа
Controller ID: 0 PD Reset: PD = :17, Error = 3, Path = 50:01:e6:71:46:db:a0:0b
Controller ID: 0 PD Reset: PD = : :0, Error = 3, Path = 50:01:e6:71:46:db:a0:01
Controller ID: 0 Error: : :0 (Error 240)
Controller ID: 0 Command timeout on PD: PD = : :0 - No addtional sense information, CDB = 0x28 0x00 0x02 0x89 0x50 0x00 0x00 0x08 0x00 0x00 , Sense = 50:01:e6:71:46:db:a0:01, Path =
И немного событий Fatal:
Controller ID: 0 VD is now OFFLINE VD 2
Controller ID: 0 VD is now OFFLINE VD 3
Controller ID: 0 Fatal firmware error: Line 205 in ../../raid/mfihw.c
Controller ID: 0 Fatal firmware error: Driver detected possible FW hang, halting FW.
и пару Critical
Controller ID: 0 SAS topology error: SMP timeout
В чем скорее всего проблема? Что посоветуете?
Имеется сервер Intel.
Intel SC5400, 5U Tower, 670W (SC5400BASE)
MB S5000PSLROMB (плата Raid SROMBSAS18E)
Ключ активации INTEL SAS RAID AXXRAK18E
корзина на 4 винта AXX4DRV3GEXP
корзина на 6 винтов AXX6DRV3GEXP
В корзине на 4 винта живет рейд 10 (VD0).
В корзине на 6 винтов живут винты (VD2 и VD3, оба одиночные raid0 и VD1 рейд1 из двух винтов + hotspare).
Поменял BBU на свежую (т.к. старая попросила замены от старости) и начались проблемы.
При первом включении в рейд-биос сказал, что "отсутствуют VD1, VD2 и VD3 (всё что в корзине на 6 винтов) - "Продолжайте и я их забуду или выключите сервер, проверьте и включайте".
Я выключил/включил сервер - контроллер их нормально увидел.
Потом делал несколько перезагрузок - в 50% случаев он их не видел опять.
При этом рейд10, который в корзине на 4 винта видится и работает без проблем.
Проблемы только со всеми винтами в корзине на 6 дисков.
Далее включил сервер (с работающими VD2 и VD3 а VD1 вынул, т.к. ненужен в данный момент), все работало.
Через несколько часов VD2 (одиночный винт, рейд 0) отвалился. Попробовал его "force online" - не захотел.
А затем и VD3 (одиночный винт, рейд 0) отвалился.
Ребут, не видит VD2 и VD3, ок, пусть забывает их (т.к. работать надо, а основные данные на VD0 корзине на 4, которые не отваливаются).
В результате в WebRaidConsole только корзина на 4 винта с рейдом плюс один из винтов из второй корзины в состоянии Uncofigured Bad:
При этом у меня куча Warning'ов типа
Controller ID: 0 PD Reset: PD = :17, Error = 3, Path = 50:01:e6:71:46:db:a0:0b
Controller ID: 0 PD Reset: PD = : :0, Error = 3, Path = 50:01:e6:71:46:db:a0:01
Controller ID: 0 Error: : :0 (Error 240)
Controller ID: 0 Command timeout on PD: PD = : :0 - No addtional sense information, CDB = 0x28 0x00 0x02 0x89 0x50 0x00 0x00 0x08 0x00 0x00 , Sense = 50:01:e6:71:46:db:a0:01, Path =
И немного событий Fatal:
Controller ID: 0 VD is now OFFLINE VD 2
Controller ID: 0 VD is now OFFLINE VD 3
Controller ID: 0 Fatal firmware error: Line 205 in ../../raid/mfihw.c
Controller ID: 0 Fatal firmware error: Driver detected possible FW hang, halting FW.
и пару Critical
Controller ID: 0 SAS topology error: SMP timeout
В чем скорее всего проблема? Что посоветуете?
Re: Отваливается корзина/винты в SROMSAS18E
Сата винты в корзинах этих работать не будут нормально, только САС.
Был у меня опыт, выкинул в помойку и купил норм корпус -)
Был у меня опыт, выкинул в помойку и купил норм корпус -)
Re: Отваливается корзина/винты в SROMSAS18E
Около года работали.
Да и насколько я понимаю, корзина сама отвалилась как-то.
И SAS винты (массив VD1, который я вынул сразу тоже отвалились вместе с двумя SATA).
Да и насколько я понимаю, корзина сама отвалилась как-то.
И SAS винты (массив VD1, который я вынул сразу тоже отвалились вместе с двумя SATA).
Re: Отваливается корзина/винты в SROMSAS18E
Сообщения вида PD Reset: PD и Unexpected sense: PD - сразу намекают, что есть какието проблемы и не нужно ждать когда все развалится. Это особенность работы сата дисков, САС протокол частично совместим с сата, и на команды, которые диск не понимает он дает многократно Unexpected sense: PD после чего уход в PD Reset.
У рейда тоже есть таймауты доступа диска, если такой ресет укладываетя в этот таймаут то проносит, если нет, массив разваливается.
У рейда тоже есть таймауты доступа диска, если такой ресет укладываетя в этот таймаут то проносит, если нет, массив разваливается.
Re: Отваливается корзина/винты в SROMSAS18E
Воткнул три SAS винта в корзину на 6 дисков а один из двух SATA вынул.
Сделал Scan Foreign Configuration.
Три SAS винта появились как VirtualDrive, а на SATA винт (был одиночный рейд0) сказал Fail на Scan Foreign Configuration.
Но при этом в WebRaidConsole2 я вижу в древовидной структуре, что они не в корзине а сами по себе (раньше вроде были как другие 4 SAS винта ы другой корзине).
Разве они не должны отображаться в корзине?
==========================================
Updated
Выключил сервер.
Вынул Рейд контроллер, и из него BBU и ключ активации. Собрал обратно (Вычитал, что это помогает от долгого FW initialization при включении компьютера. Помогло кстати от этого).
Загрузился.
Винты стали отображаться в корзине. И номера слотов стали правильными.
Вы думаете, что винты могут отображаться то в корзине, то вне корзины из-за наличия САТА диска?
Сделал Scan Foreign Configuration.
Три SAS винта появились как VirtualDrive, а на SATA винт (был одиночный рейд0) сказал Fail на Scan Foreign Configuration.
Но при этом в WebRaidConsole2 я вижу в древовидной структуре, что они не в корзине а сами по себе (раньше вроде были как другие 4 SAS винта ы другой корзине).
Разве они не должны отображаться в корзине?
==========================================
Updated
Выключил сервер.
Вынул Рейд контроллер, и из него BBU и ключ активации. Собрал обратно (Вычитал, что это помогает от долгого FW initialization при включении компьютера. Помогло кстати от этого).
Загрузился.
Винты стали отображаться в корзине. И номера слотов стали правильными.
Вы думаете, что винты могут отображаться то в корзине, то вне корзины из-за наличия САТА диска?
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 87 гостей