Интересная проблема с LSI MegaRAID ROMB

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
xl
Junior member
Сообщения: 4
Зарегистрирован: 24 янв 2006, 03:35
Откуда: Якутск

Интересная проблема с LSI MegaRAID ROMB

Сообщение xl » 17 дек 2008, 05:40

Контроллер: LSI MegaRAID SAS PCI-E ROMB + IB2364 BackPlane. Прошивка: 1.12.172-0470 (8.0.1-0038).
Создан RAID5 на 6 дисках WDC WD7500AAKS-04G30. Поделен на два LUNа, на 200ГБ (системный раздел) и 3,21ТБ (GPT диск, раздел с данными).
OS: Windows Server 2003 R2 SP2 / Windows Server 2008 SP1

При записи информации в любой из разделов, либо при копировании информации из раздела в раздел возникают следующие проблемы:
Гаснет индикатор активности на одном из дисков, например, диск на порте 5, при этом в лог контроллера идут следующие сообщения:

Код: Выделить всё

ID = 724
SEQUENCE NUMBER = 158531
TIME = 16-12-2008 15:20:58
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   Int.Ports 0-3:1:5 - Invalid field in CDB,   CDB   =    0x15  0x11  0x00  0x00  0x10  0x00     ,   Sense   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00 
ID = 723
SEQUENCE NUMBER = 158530
TIME = 16-12-2008 15:20:58
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   Int.Ports 0-3:1:5 - Power on, reset, or bus device reset occurred,   CDB   =    0x00  0x00  0x00  0x00  0x00  0x00     ,   Sense   =    0x70  0x00  0x06  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x29  0x00  0x00  0x00  0x00  0x00 
ID = 722
SEQUENCE NUMBER = 158529
TIME = 16-12-2008 15:20:56
LOCALIZED MESSAGE = Controller ID:  0  PD Reset:   PD       =   Int.Ports 0-3:1:5,   Error       =   3,   Path   =       50:0a:0d:10:00:00:24:49
ID = 721
SEQUENCE NUMBER = 158528
TIME = 16-12-2008 15:20:56
LOCALIZED MESSAGE = Controller ID:  0  Command timeout on PD:   PD       =   Int.Ports 0-3:1:5 - No addtional sense information,   CDB   =    0x28  0x00  0x00  0x41  0x0a  0x73  0x00  0x00  0x05  0x00     ,   Sense   =   ,   Path   =       50:0a:0d:10:00:00:24:49
Те же сообщения идут от мониторинга в логи винды.
Еще в логах найдено сообщение:

Код: Выделить всё

Log Name:      System
Source:        megasas
Event ID:      129
Task Category: None
Level:         Warning
Keywords:      Classic
Computer:      26L2233B2-06
Description:
Reset to device, \Device\RaidPort0, was issued.
Затем индикатор начинает работать и показывает продолжение активности на этом диске.
После этого, спустя 5-10 секунд гаснет другой диск, в лог идут те же сообщения с номером порта «погасшего» диска.
Диски «выпадают» в произвольном порядке, при этом система продолжает работать.
Но, эти «выпадения» подвешивают систему, при копировании видно, как в этот момент падает скорость записи на массив,
начинает тормозить прорисовка графических объектов в Windows (окон, иконок).
Консистенси чек проходит без проблем.
По всем дискам:
Media Error Count: 0
Other Error Count: 0
Predictive Failure Count: 0
Диски проверяли отдельно, с ними все нормально.

Что это может быть? Что за сообщения в логе? Гугль не помог :(

Update: на драйверах 3.8.0.64 сообщения в логи не идут, но визуально картина та же, скорость записи в рейд (файлы 30-500мб) не выше 8МБ/с, система так же тормозит.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 18 дек 2008, 13:54

Скорее всего нелюбовь контроллера с дисками. Но посколько ВД мы не пользуем, то просто не знаю, что сказать...

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 19 дек 2008, 10:58

А я бы рекомендовал проверить мощьность блоки питания.
у вас винчестеры в штатный рестарт уходят. такое бывает при недостаточной величине одного из оборных напряжений (+5/+12) скорее всего 5в, оно чаще кончается.

xl
Junior member
Сообщения: 4
Зарегистрирован: 24 янв 2006, 03:35
Откуда: Якутск

Сообщение xl » 21 дек 2008, 11:03

Питание проверил первым делом, с ним все ок.
А проблема решилась заменой всего сервера через поставщика (дело судя по всему было в BackPlane, который отдельно поменять не было возможности).

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 21 гость