Adaptec 5405 Controller Kernel Stopped Running

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
dmitry2
Junior member
Сообщения: 5
Зарегистрирован: 12 авг 2007, 14:31
Откуда: Екатеринбург
Контактная информация:

Adaptec 5405 Controller Kernel Stopped Running

Сообщение dmitry2 » 06 мар 2014, 12:22

Добрый день!
Около 4 лет работал сервер с Adaptec 5405 с массивами RAID10 и RAID6 на одном наборе из 12 HDD Seagate (10+2 HotSpare). Вчера решили добавить еще 1 массив на 4 дисках Hitachi . После установки диски появились в ASM, была запущена их очистка (Clean). В тот же момент из массива выпал один из дисков Seagate, начался rebuild, который остановился на 98%. После этого индикаторы активности HDD молчали, с интервалом минут в 5 на них пробегали огни как при инициализации контроллера. ОС не реагировала на клавиатуру и мышь. После перезагрузки сервера, контроллер выдал ошибку Controller Kernel Stopped Running. Повторные перезагрузки завершились так же. При полностью отключенных дисках контроллер стартует нормально (требует принять новую конфигурация), позволяет зайти в ACU. Путем перебора было выяснено, что при отключении 4 новых дисков и 1 отвалившегося контроллер стартует и требует принять новую конфигурацию. При этом в ACU массивы отсутствуют, хотя диски видны. Соответственно вопрос, что лучше сделать дальше? Стоит ли обновлять прошивку (текущая версия 5.2.0-17544), стоит ли соглашаться на принятие новой конфигурации.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение Tert » 06 мар 2014, 14:20

dmitry2
Отключите все диски от контроллера и загрузите его.
Пусть он полностью очистит свой флеш от старых конфигураций.
Потом подключите диски с данными (без сбойного диска) и загрузитесь.
В случае успешной загрузки сделайте бекап.
Потом вставьте сбойный диск и сделайте на него Rebuild. В случае нормального завершения работы обновите прошивку, драйвер и ASM и потом подключайте новые диски.

Ну и рекомендую периодически прогонять проверку целостности массивов.

dmitry2
Junior member
Сообщения: 5
Зарегистрирован: 12 авг 2007, 14:31
Откуда: Екатеринбург
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение dmitry2 » 06 мар 2014, 18:10

Tert писал(а):dmitry2
Отключите все диски от контроллера и загрузите его.
Пусть он полностью очистит свой флеш от старых конфигураций.
Т.е. отключить все диски, принять новую конфигурацию при загрузке, выключить систему и опять включить с уже подключенными дисками (за исключением выпавшего из массива)?

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение Stranger03 » 07 мар 2014, 10:32

dmitry2 писал(а):Т.е. отключить все диски, принять новую конфигурацию при загрузке, выключить систему и опять включить с уже подключенными дисками (за исключением выпавшего из массива)?
Можно сделать так:
1. все выключаем
2. отключаем диски
3. замыкаем контакт рекавери на контроллере, он войдет в режим восстановления
4. загружаем, перешиваем, получаем девственно чистый контроллер с последней прошивкой
5. подключаем диски без сбойнувшего, грузимся, ничего не нажимаем, контроллер сам все найдет
6. фулл бекап
7. ставим диск, из АСМ говорим ребилд на него, смотрим на результат
Можно как Илья написал. Прошивку я бы обновил.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение Tert » 07 мар 2014, 13:04

Stranger03
Контроллер входит в ступор из-за кривой информации на диске. Такое на старых контроллерах бывает.
Сейчас вроде Adaptec это поправил.
Поэтому я бы никакие прошивки в рекавери режиме и т.п. не обновлял, пока не будет сделан архив данных.

Главное - вначале полностью очистить контроллер от информации о дисках, а потом подключить только старые диски без сбойного и загрузиться с массива в режиме Degraded/
Если данные будут сняты, то уже можно обновлять прошивки и т.п.

Хотя лучше всего пересоздать все массивы заново.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение Stranger03 » 07 мар 2014, 15:13

Tert писал(а):Stranger03
Ты забыл как меня зовут? :)
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение gs » 07 мар 2014, 15:55

Да ты у нас уже сто лет не был :)

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение Stranger03 » 11 мар 2014, 09:17

gs писал(а):Да ты у нас уже сто лет не был :)
Работа, :).....
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

dmitry2
Junior member
Сообщения: 5
Зарегистрирован: 12 авг 2007, 14:31
Откуда: Екатеринбург
Контактная информация:

Re: Adaptec 5405 Controller Kernel Stopped Running

Сообщение dmitry2 » 23 мар 2014, 09:11

Tert писал(а):Stranger03
Контроллер входит в ступор из-за кривой информации на диске. Такое на старых контроллерах бывает.
Сейчас вроде Adaptec это поправил.
Поэтому я бы никакие прошивки в рекавери режиме и т.п. не обновлял, пока не будет сделан архив данных.

Главное - вначале полностью очистить контроллер от информации о дисках, а потом подключить только старые диски без сбойного и загрузиться с массива в режиме Degraded/
Для обратной связи.
Очистка контроллера от информации о дисках не помогла - при последующем подключении дисков (за исключением выпавшего из массива) ошибка появилась опять. Тоже самое при отключение выпавшего диска и hotspare (на который шел ребилд после сбоя). Обновление прошивки до последней версии в recovery режиме. Подключение дисков за исключением выпавшего - массивы находятся, но позже возникает та же ошибка. После загрузки с отключенными выпавшим и hotspare дисками контроллер и система стартовали нормально. После ребилда все работает без проблем.
Большое спасибо за помощь.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и 11 гостей