проблема с LSI MegaRAID 320-2 (отваливаются диски)
Модераторы: Trinity admin`s, Free-lance moderator`s
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
проблема с LSI MegaRAID 320-2 (отваливаются диски)
Добрый день, господа!
Вопрос к специалистам:
Возникла проблема с LSI MegaRAID 320-2 (прошивка последняя с сайта - 49.76-50 Build 54)- после продолжительной работы начали странным образом отваливаться диски:
GAM пишет примерно такое в "NVRAM Log":
SeqNo=5 ctl=2 chn=0 tgt=2 lun=0 Event= 1C:MLXEV_PHYSDEV_REQSENSE
logged at Feb 17 01:35:51 2004
Sense Data:
CC:70 KEY:0B ASC:47 ASCQ:00
70 00 0B 00 00 00 00 28 00 00
00 00 47 00 00 00 00 00 2A 00
04 44 63 80 00 00 53 00 00 00
00 00 00 00 00 00 00 00 00 00
после этого диск переходит в состояние DEAD. После замены и ребилда - то же самое.
Подключено 10 дисков Fujitsu MAS3367NC в интелловские корзины (про проблему с SAF-TE в курсе - там новые стоят). Объединены в RAID 1+0 (или 0+1 ну не помню я, как там у LSI это называется ).
Вопрос, собственно, простой - как жить дальше, кого винить?
Заранее спасибо.
Вопрос к специалистам:
Возникла проблема с LSI MegaRAID 320-2 (прошивка последняя с сайта - 49.76-50 Build 54)- после продолжительной работы начали странным образом отваливаться диски:
GAM пишет примерно такое в "NVRAM Log":
SeqNo=5 ctl=2 chn=0 tgt=2 lun=0 Event= 1C:MLXEV_PHYSDEV_REQSENSE
logged at Feb 17 01:35:51 2004
Sense Data:
CC:70 KEY:0B ASC:47 ASCQ:00
70 00 0B 00 00 00 00 28 00 00
00 00 47 00 00 00 00 00 2A 00
04 44 63 80 00 00 53 00 00 00
00 00 00 00 00 00 00 00 00 00
после этого диск переходит в состояние DEAD. После замены и ребилда - то же самое.
Подключено 10 дисков Fujitsu MAS3367NC в интелловские корзины (про проблему с SAF-TE в курсе - там новые стоят). Объединены в RAID 1+0 (или 0+1 ну не помню я, как там у LSI это называется ).
Вопрос, собственно, простой - как жить дальше, кого винить?
Заранее спасибо.
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Спасибо за быструю реакцию.
Заменять шлейф не пробовали - выключать никак нельзя. Ребилдить можно - в даун никак. Пока проявилось на 2х соседних дисках (tgt1, tgt2) в одной корзине. Проявилось дважды - пока набираем статистику.
Из LSI написали, что после прошивки фирмвари надо делать "CTRL + M - Objects - Adapter - Then load the factory defaults", ибо дословно "The 1L26 firmware added new features which used additional NVRAM space. This area is were firmware keep track of drive status. Because this area is new, it contain garbage data." Но фирмварь уже месяца как 3-4 назад была обновлена, поэтому не думаю, что проблема здесь, хотя теперь буду и на рэйдах load defaults делать после прошивки, а не только на матерях. раньше было почему-то неочевидно.
Заменять шлейф не пробовали - выключать никак нельзя. Ребилдить можно - в даун никак. Пока проявилось на 2х соседних дисках (tgt1, tgt2) в одной корзине. Проявилось дважды - пока набираем статистику.
Из LSI написали, что после прошивки фирмвари надо делать "CTRL + M - Objects - Adapter - Then load the factory defaults", ибо дословно "The 1L26 firmware added new features which used additional NVRAM space. This area is were firmware keep track of drive status. Because this area is new, it contain garbage data." Но фирмварь уже месяца как 3-4 назад была обновлена, поэтому не думаю, что проблема здесь, хотя теперь буду и на рэйдах load defaults делать после прошивки, а не только на матерях. раньше было почему-то неочевидно.
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Что ж, будем пытаться ковырять дальше.
Как кибальчиши: нам бы день простоять, да ночь продержаться.
Кстати, от LSI еще один комментарий поступил (переводить, если позволите, не буду, но, если все это действительно так, то информация весьма интересная):
This issue has been seen in some customers site that status of disks are not recorded in NVRAM Space after few months of the upgrade. It caused numerous problems in rebuilding using Hot Spare and disks going offline or marked as failed.
Так что они настоятельно рекомендуют чистить мусор в NVRAM. Жаль только, что все равно попробовать не могу сейчас.
Как кибальчиши: нам бы день простоять, да ночь продержаться.
Кстати, от LSI еще один комментарий поступил (переводить, если позволите, не буду, но, если все это действительно так, то информация весьма интересная):
This issue has been seen in some customers site that status of disks are not recorded in NVRAM Space after few months of the upgrade. It caused numerous problems in rebuilding using Hot Spare and disks going offline or marked as failed.
Так что они настоятельно рекомендуют чистить мусор в NVRAM. Жаль только, что все равно попробовать не могу сейчас.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 6 гостей