Что происходит с RAID массивом (LSILogic 320-2,12 IBM DDYS)?
Модераторы: Trinity admin`s, Free-lance moderator`s
Что происходит с RAID массивом (LSILogic 320-2,12 IBM DDYS)?
В нашей фирме эксплуатируется файл сервер с raid массивом следующей аппаратной конфигурации:
- Курпус для raid массива покупался в фирме Меdiann
- RAID контроллер LSILogic 320-2, 64Mb, BBU
- 12 IBM DDYS T36950M, Revision S96H
Тип массива: RAID5 + 1 HotSpare
Обнаружил в логе программы MegaRaid Power Console Plus 5.00b сообщения:
Log Started.
- Sat Mar 22 18:01:35 2003
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 27 38 04
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 16 dc e6
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 16 dc e6
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 16 dc e7
18 00 00 00 00 11 00
Обратился к Drive Properties диска Ch 2 ID 3.
Параметр Media Error = 5.
Другие параметры: Termination = Narrow, Speed = 320Mb
Посмотрев в Properties других дисков обнаружил, что у некоторых параметры Termination = Wide, Speed = Not Supported
Сделал BackUp информации я запустил Consistency Check. В лог добавились сообщения:
Check Consistency Started on Logical Drive 1 - Sat Mar 22 18:19:45 2003
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:37:58 2003
f0 00 03 00 33 af 2a
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 1 with the following sense key - Sat Mar 22 21:32:06 2003
f0 00 03 02 28 2f 40
18 00 00 00 00 11 00
Check Consistency Finished on Logical Drive 1 - Sun Mar 23 00:39:29 2003
Drive Properties диска Ch 2 ID 1.
Media Error = 1, Termination = Wide, Speed = Not Supported
Что происходит с массивом? Физическое повреждение винчестеров Ch 2 ID 3 и Ch 2 ID 1?
Почему у винчестеров в массиве разный параметр Termination?
Что делать? Куда думать?
Спасибо.
- Курпус для raid массива покупался в фирме Меdiann
- RAID контроллер LSILogic 320-2, 64Mb, BBU
- 12 IBM DDYS T36950M, Revision S96H
Тип массива: RAID5 + 1 HotSpare
Обнаружил в логе программы MegaRaid Power Console Plus 5.00b сообщения:
Log Started.
- Sat Mar 22 18:01:35 2003
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 27 38 04
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 16 dc e6
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 16 dc e6
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:01:35 2003
f0 00 03 00 16 dc e7
18 00 00 00 00 11 00
Обратился к Drive Properties диска Ch 2 ID 3.
Параметр Media Error = 5.
Другие параметры: Termination = Narrow, Speed = 320Mb
Посмотрев в Properties других дисков обнаружил, что у некоторых параметры Termination = Wide, Speed = Not Supported
Сделал BackUp информации я запустил Consistency Check. В лог добавились сообщения:
Check Consistency Started on Logical Drive 1 - Sat Mar 22 18:19:45 2003
NOTIFY:Check Condition on Ch 2 ID 3 with the following sense key - Sat Mar 22 18:37:58 2003
f0 00 03 00 33 af 2a
18 00 00 00 00 11 00
NOTIFY:Check Condition on Ch 2 ID 1 with the following sense key - Sat Mar 22 21:32:06 2003
f0 00 03 02 28 2f 40
18 00 00 00 00 11 00
Check Consistency Finished on Logical Drive 1 - Sun Mar 23 00:39:29 2003
Drive Properties диска Ch 2 ID 1.
Media Error = 1, Termination = Wide, Speed = Not Supported
Что происходит с массивом? Физическое повреждение винчестеров Ch 2 ID 3 и Ch 2 ID 1?
Почему у винчестеров в массиве разный параметр Termination?
Что делать? Куда думать?
Спасибо.
- Dmitry
- Сотрудник Тринити
- Сообщения: 867
- Зарегистрирован: 22 авг 2002, 16:12
- Откуда: St.Petersburg
- Контактная информация:
Да уж...
Самое простое все разобрать и собрать заново. Стереть конфигурацию из RAID и дисков (диски подключены). Проверить все перемычки на HDD и способ терминации корзин (если имеются) и правильность ее. Кабели на загибы и повреждения и главное на поддержку стандарта U160 или U160
Параметры должны быть Termination = Wide, Speed = 160MB
Что вообще за корпус? Корзины тянут Ultra 160 ?
Самое простое все разобрать и собрать заново. Стереть конфигурацию из RAID и дисков (диски подключены). Проверить все перемычки на HDD и способ терминации корзин (если имеются) и правильность ее. Кабели на загибы и повреждения и главное на поддержку стандарта U160 или U160
Параметры должны быть Termination = Wide, Speed = 160MB
Что вообще за корпус? Корзины тянут Ultra 160 ?
Корпус покупался в компании Mediann. Модель Iridium.
В корпусе установлены 4 штуки case на 3 диска.
Реального производителя к сожалению незнаю.
Одним из требованием было работа на скорости 160 и жескими дисками IBM 10000 об.
С этим массивом в прошлом году уже случалась крупная авария. Картина была несколько другой, чем сейчас.
Контроллер был AMI MegaRAID 1600 128MB, BBU.
Периодически разные диски вылетали в offline. В какой-то момент они стали offline все одновременно. В ходе спасательной операции данные спасти не удалось. При попытке заного создать новый массив типа RAID5 или RAID3 он рассыпался на глазах. После окончания операции его формирования и запуска Consistency Check сразу несколько дисков становились offline.
Созданные массивы типа RAID0 или RAID1 работали несколько суток нормально.
Собрав все данные, было принято решение заменить контролер.
Новый контроллер Фирмы LSI 320-2.
Сейчас ситуация носит описанный в первом сообщении характер.
В корпусе установлены 4 штуки case на 3 диска.
Реального производителя к сожалению незнаю.
Одним из требованием было работа на скорости 160 и жескими дисками IBM 10000 об.
С этим массивом в прошлом году уже случалась крупная авария. Картина была несколько другой, чем сейчас.
Контроллер был AMI MegaRAID 1600 128MB, BBU.
Периодически разные диски вылетали в offline. В какой-то момент они стали offline все одновременно. В ходе спасательной операции данные спасти не удалось. При попытке заного создать новый массив типа RAID5 или RAID3 он рассыпался на глазах. После окончания операции его формирования и запуска Consistency Check сразу несколько дисков становились offline.
Созданные массивы типа RAID0 или RAID1 работали несколько суток нормально.
Собрав все данные, было принято решение заменить контролер.
Новый контроллер Фирмы LSI 320-2.
Сейчас ситуация носит описанный в первом сообщении характер.
Замена контроллера принципиально исправила ситуацию.
Как я уже говорил, на прошлом контроллере массивы RAID5 вообще разваливались на глазах.
С новым контроллером массив проработал месяца 4 и сейчас начались проблемы.
Попробую подсмотреть или сфотографировать марку корзин.
Что значит "попарная терминация" ?
Как я уже говорил, на прошлом контроллере массивы RAID5 вообще разваливались на глазах.
С новым контроллером массив проработал месяца 4 и сейчас начались проблемы.
Попробую подсмотреть или сфотографировать марку корзин.
Что значит "попарная терминация" ?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
У вас стоит 4 корзины на 2 канала. Т.е. по 2 на канал. В этом случае терминация должна быть ВКЛЮЧЕНА на тех корзинах, которые ближе к концу кабеля и ВЫКЛЮЧЕНА на ближних. Если кабель с терминатором, то выключена везде. Некоторые корзины позволяют это делать, некоторые нет. Потому был и вопрос - тип корзины. Разного рода автоматическая терминация - источник постоянных глюков.
Медиан у нас брал достаточно много корзин Супермикро CSE-031 - если там они, то все можно вкл\выкл вручную. Но сборщик просто мог ошибиться при конфигурировании. Так что проверьте.
Может быть серьезная проблема, если корзины интеловские, где нет ручного переключения.
А то, что несколько месяцев все работало - еще не показатель. Свалиться может в любой момент.
Медиан у нас брал достаточно много корзин Супермикро CSE-031 - если там они, то все можно вкл\выкл вручную. Но сборщик просто мог ошибиться при конфигурировании. Так что проверьте.
Может быть серьезная проблема, если корзины интеловские, где нет ручного переключения.
А то, что несколько месяцев все работало - еще не показатель. Свалиться может в любой момент.
- Ant
- Advanced member
- Сообщения: 113
- Зарегистрирован: 02 сен 2003, 16:06
- Откуда: St.Petersburg
- Контактная информация:
PCP
2Serge:
Я так понимаю, что речь идёт о MegaRaid Server-е, т.к. в Client-е никакого пароля нет. Так вот при установке Server-а задаётся пароль для удалённого администрирования, который потом нужен для Full Access-а (View Only пароля не требует)... Может вы просто забыли его?
Я так понимаю, что речь идёт о MegaRaid Server-е, т.к. в Client-е никакого пароля нет. Так вот при установке Server-а задаётся пароль для удалённого администрирования, который потом нужен для Full Access-а (View Only пароля не требует)... Может вы просто забыли его?

Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя