Проблема с постоянными перезагрузками Adaptec 5405Z
Модераторы: Trinity admin`s, Free-lance moderator`s
Проблема с постоянными перезагрузками Adaptec 5405Z
Добрый день, уважаемые форумчане!
В один прекрасный момент перестали работать несколько серверов.
Виртуальные сервера крутятся на ESX 4.1.
В результате выяснилось что проблема возникает на RAID контроллере сервера.
После загрузки raid bios, можно посмотреть конфигурацию массивов.
Все диски в нормальном состоянии, отвалившихся нет. Дисков 16 штук.
Конфигурация массивов следующая
диски 0-1-2-3 объединены в RAID 5EE (нарезаны lun is0, is1, system)
диски 4-5-6-7-8-9 RAID 5EE (lun is2, is3, is4, is5)
диски 10-11-12-13-14-15 RAID 5EE (lun is6, is7, is8, is9)
Контроллер Adaptec 5405Z Версия прошивки [18252]
Периодически в 8-10 минут с ошибкой вылетает raid bios
с сообщением Controller Kernel Stopped Running. Press any key to continue.
После перезагрузки, статусы некоторых lun меняются на BULDING/VERIFING, на других OPTIMAL.
Причем было is7, is8, is9 - статус OPTIMAL, то после аварийного завершения
работы контролера данные lun могут сменить статус на BULDING/VERIFING.
В каждый момент времени из всех lun в OPTIMAL статусе только 3 штуки.
UPS присутствует, проблем с дисками нет. Ничего не изменялось в конфигурации raid и
самого сервера более нескольких месяцев.
Прошу помощи у специалистов, в чем может быть причина такого поведения контроллера?
Как можно восстановить его нормальную работу или понадобиться замена?
В один прекрасный момент перестали работать несколько серверов.
Виртуальные сервера крутятся на ESX 4.1.
В результате выяснилось что проблема возникает на RAID контроллере сервера.
После загрузки raid bios, можно посмотреть конфигурацию массивов.
Все диски в нормальном состоянии, отвалившихся нет. Дисков 16 штук.
Конфигурация массивов следующая
диски 0-1-2-3 объединены в RAID 5EE (нарезаны lun is0, is1, system)
диски 4-5-6-7-8-9 RAID 5EE (lun is2, is3, is4, is5)
диски 10-11-12-13-14-15 RAID 5EE (lun is6, is7, is8, is9)
Контроллер Adaptec 5405Z Версия прошивки [18252]
Периодически в 8-10 минут с ошибкой вылетает raid bios
с сообщением Controller Kernel Stopped Running. Press any key to continue.
После перезагрузки, статусы некоторых lun меняются на BULDING/VERIFING, на других OPTIMAL.
Причем было is7, is8, is9 - статус OPTIMAL, то после аварийного завершения
работы контролера данные lun могут сменить статус на BULDING/VERIFING.
В каждый момент времени из всех lun в OPTIMAL статусе только 3 штуки.
UPS присутствует, проблем с дисками нет. Ничего не изменялось в конфигурации raid и
самого сервера более нескольких месяцев.
Прошу помощи у специалистов, в чем может быть причина такого поведения контроллера?
Как можно восстановить его нормальную работу или понадобиться замена?
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Проблема с постоянными перезагрузками Adaptec 5405Z
OlegIvy
Проблем может быть много, но с бОльшей долей вероятности аппаратная. Хотя можете попробовать перепрошить на свежую фирмварь.
Проблем может быть много, но с бОльшей долей вероятности аппаратная. Хотя можете попробовать перепрошить на свежую фирмварь.
Re: Проблема с постоянными перезагрузками Adaptec 5405Z
Перепрошил на последнюю с официального сайта. Проходит 15-16 минут и контроллер зависает до следующей перезагрузки. Вынул 13,14,15 диски из корзины. После этого контроллер перестал виснуть. Удалось слить часть данных. Складывается впечатление что ошибки на лунах приводят к выпадению ядра контроллера. Завтра буду дальше проверять.
Re: Проблема с постоянными перезагрузками Adaptec 5405Z
было такое на 6805 - контроллер пришлось прошивать в hda mode flash, после этого он перестал выпадать с ошибкой и стало понятно, что проблема с одним из дисков - контроллер его просто помечал как недоступный.
Re: Проблема с постоянными перезагрузками Adaptec 5405Z
Доброго дня всем.
В данный момент контроллер работает. Отключили 6 дисков, работает уже несколько часов. Перетягиваем данные.
Большое подозрение что он просто не справлялся с нагрузкой по BUILDING/VERIFING. Возможно виноват какой-то диск.
Этого определить не удалось. В разных сочетаниях все массивы доступны и работают. Только не все сразу при подключенных 16 дисках.
Не будем больше использовать 5EE, очень долго происходят операции обслуживания.
Всем откликнувшимся спасибо. Тему можно закрывать.
В данный момент контроллер работает. Отключили 6 дисков, работает уже несколько часов. Перетягиваем данные.
Большое подозрение что он просто не справлялся с нагрузкой по BUILDING/VERIFING. Возможно виноват какой-то диск.
Этого определить не удалось. В разных сочетаниях все массивы доступны и работают. Только не все сразу при подключенных 16 дисках.
Не будем больше использовать 5EE, очень долго происходят операции обслуживания.
Всем откликнувшимся спасибо. Тему можно закрывать.
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: Проблема с постоянными перезагрузками Adaptec 5405Z
Это наиболее вероятная часто встречаемая ошибка.OlegIvy писал(а):Возможно виноват какой-то диск.
П.С. исправьте город в профиле.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 36 гостей