проблема с LSI MegaRAID 320-2 (отваливаются диски)

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

проблема с LSI MegaRAID 320-2 (отваливаются диски)

Сообщение exLH » 18 фев 2004, 11:17

Добрый день, господа!

Вопрос к специалистам:

Возникла проблема с LSI MegaRAID 320-2 (прошивка последняя с сайта - 49.76-50 Build 54)- после продолжительной работы начали странным образом отваливаться диски:

GAM пишет примерно такое в "NVRAM Log":
SeqNo=5 ctl=2 chn=0 tgt=2 lun=0 Event= 1C:MLXEV_PHYSDEV_REQSENSE
logged at Feb 17 01:35:51 2004
Sense Data:
CC:70 KEY:0B ASC:47 ASCQ:00
70 00 0B 00 00 00 00 28 00 00
00 00 47 00 00 00 00 00 2A 00
04 44 63 80 00 00 53 00 00 00
00 00 00 00 00 00 00 00 00 00

после этого диск переходит в состояние DEAD. После замены и ребилда - то же самое.

Подключено 10 дисков Fujitsu MAS3367NC в интелловские корзины (про проблему с SAF-TE в курсе - там новые стоят). Объединены в RAID 1+0 (или 0+1 ну не помню я, как там у LSI это называется :oops: ).

Вопрос, собственно, простой - как жить дальше, кого винить?
Заранее спасибо.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 18 фев 2004, 11:21

Шлейф, терминация ?... Заменять шлейф пробовали ?
Впечатление такое, что нулевой канал отваливается...

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 18 фев 2004, 12:50

В дополнение - есть ли закономерность? Ругается на конкретные винты, корзину?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 18 фев 2004, 12:59

Спасибо за быструю реакцию.

Заменять шлейф не пробовали - выключать никак нельзя. :( Ребилдить можно - в даун никак. Пока проявилось на 2х соседних дисках (tgt1, tgt2) в одной корзине. Проявилось дважды - пока набираем статистику.

Из LSI написали, что после прошивки фирмвари надо делать "CTRL + M - Objects - Adapter - Then load the factory defaults", ибо дословно "The 1L26 firmware added new features which used additional NVRAM space. This area is were firmware keep track of drive status. Because this area is new, it contain garbage data." Но фирмварь уже месяца как 3-4 назад была обновлена, поэтому не думаю, что проблема здесь, хотя теперь буду и на рэйдах load defaults делать после прошивки, а не только на матерях. :) раньше было почему-то неочевидно. :wink:

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 18 фев 2004, 14:08

Тогда возможно это кабель или корзина. К сожалению это без остановки отловить не получится :(
Вообще в таких случаях долго ковыряться приходится.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 18 фев 2004, 14:26

Что ж, будем пытаться ковырять дальше.

Как кибальчиши: нам бы день простоять, да ночь продержаться. :)

Кстати, от LSI еще один комментарий поступил (переводить, если позволите, не буду, но, если все это действительно так, то информация весьма интересная):
This issue has been seen in some customers site that status of disks are not recorded in NVRAM Space after few months of the upgrade. It caused numerous problems in rebuilding using Hot Spare and disks going offline or marked as failed.
Так что они настоятельно рекомендуют чистить мусор в NVRAM. Жаль только, что все равно попробовать не могу сейчас. :(

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»