Adaptec 5805, проблемы с массивом
Модераторы: Trinity admin`s, Free-lance moderator`s
Adaptec 5805, проблемы с массивом
Добрый день.
Имеем рейд-контроллер Adaptec 5805, на котором у нас создано 3 логических массива - Raid5EE, Raid5EE и Raid1. Так же имеются 2 global hotspare диска.
Сегодня заметили, что на втором Raid5EE-массиве (состоит из шести дисков Seagate ST31000340NS) один из дисков появился с иконкой ! (при этом диск находится в состоянии Optimal) и рейд-массив перешел в состояние Degraded. Сами диски при этом, включая сбойный диск, показываются в Adaptec Storage Manager как Optimal. При этом на сбойном диске в "Статусе" 10 medium error и 271 aborted commands. Функции контекстного меню, чтобы выполнить Fix для массива или дисков массива недоступны. Так же ни один из дисков массива нельзя отметить как Failed, эти функции недоступны.
Что было сделано:
1. "Испорченный" диск был проинициализирован, после чего перешел в состояние Ready. Хотспейр диски для ребилда при этом не подхватились, массив так же находится в состоянии Degraded.
2. Пробовали назначить проинициализированный "испорченный" диск как dedicated hotspare для этого массива - тоже самое, массив не ребилдится.
3. Пометили этот диск как failed
Через Adaptec Storage Manager скачали support-archive. В нём, несмотря на неправильное время, видно, что после манипуляций с "испорченным" диском начался ранее прерваный процесс ребилда и некий процесс "компакт". Вот информация из лога (файл лога прикладываю к письму):
April 12, 2012 10:32:36 AM CEST INF sds Previously interrupted rebuild of a RAID-5 set restarted the build operation: controller 1, logical device 1
April 12, 2012 10:32:36 AM CEST INF sds Container changed: controller 1, logical device 1
April 12, 2012 10:32:51 AM CEST INF 358:A01C-S--L01 sds Compaction preempted: controller 1, logical device 1 ("R5EE-2").
April 12, 2012 10:33:04 AM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
и теперь приблизительно раз в 10-15 минут появляется строчка:
April 12, 2012 12:13:31 PM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
April 12, 2012 12:30:59 PM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
April 12, 2012 12:39:30 PM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
Может быть Вы сможете подсказать, что это за процесс "Compact logical disk" ? И как узнать, действительно ли запущен ребилд (adaptec storage manager не показывает) ? Ну и собственно как безболезненно решить проблему и перевести рейд-массив в состояние Optimal ?
Заранее спасибо за ответы.
Имеем рейд-контроллер Adaptec 5805, на котором у нас создано 3 логических массива - Raid5EE, Raid5EE и Raid1. Так же имеются 2 global hotspare диска.
Сегодня заметили, что на втором Raid5EE-массиве (состоит из шести дисков Seagate ST31000340NS) один из дисков появился с иконкой ! (при этом диск находится в состоянии Optimal) и рейд-массив перешел в состояние Degraded. Сами диски при этом, включая сбойный диск, показываются в Adaptec Storage Manager как Optimal. При этом на сбойном диске в "Статусе" 10 medium error и 271 aborted commands. Функции контекстного меню, чтобы выполнить Fix для массива или дисков массива недоступны. Так же ни один из дисков массива нельзя отметить как Failed, эти функции недоступны.
Что было сделано:
1. "Испорченный" диск был проинициализирован, после чего перешел в состояние Ready. Хотспейр диски для ребилда при этом не подхватились, массив так же находится в состоянии Degraded.
2. Пробовали назначить проинициализированный "испорченный" диск как dedicated hotspare для этого массива - тоже самое, массив не ребилдится.
3. Пометили этот диск как failed
Через Adaptec Storage Manager скачали support-archive. В нём, несмотря на неправильное время, видно, что после манипуляций с "испорченным" диском начался ранее прерваный процесс ребилда и некий процесс "компакт". Вот информация из лога (файл лога прикладываю к письму):
April 12, 2012 10:32:36 AM CEST INF sds Previously interrupted rebuild of a RAID-5 set restarted the build operation: controller 1, logical device 1
April 12, 2012 10:32:36 AM CEST INF sds Container changed: controller 1, logical device 1
April 12, 2012 10:32:51 AM CEST INF 358:A01C-S--L01 sds Compaction preempted: controller 1, logical device 1 ("R5EE-2").
April 12, 2012 10:33:04 AM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
и теперь приблизительно раз в 10-15 минут появляется строчка:
April 12, 2012 12:13:31 PM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
April 12, 2012 12:30:59 PM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
April 12, 2012 12:39:30 PM CEST INF sds Running: Compact logical disk - 0%. Controller 1, logical device 1
Может быть Вы сможете подсказать, что это за процесс "Compact logical disk" ? И как узнать, действительно ли запущен ребилд (adaptec storage manager не показывает) ? Ну и собственно как безболезненно решить проблему и перевести рейд-массив в состояние Optimal ?
Заранее спасибо за ответы.
- Вложения
-
- Support4.zip
- (361.33 КБ) 365 скачиваний
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Adaptec 5805, проблемы с массивом
jeff
Вообще то RAID 5EE - это массив с HotSpare диском и выделять отдельный дополнительный диск для него не стоит. Только там свободное пространство размазано по всем дискам. Поэтому у вас и не подключаются выделенные HotSpare диски.
Процесc компакт - это как раз сворачивание массива на меньшее число дисков с удалением сбойного диска и свободного пространства с него.
Кстати, проверьте и остальные диски на наличие ошибок.
Вообще то RAID 5EE - это массив с HotSpare диском и выделять отдельный дополнительный диск для него не стоит. Только там свободное пространство размазано по всем дискам. Поэтому у вас и не подключаются выделенные HotSpare диски.
Процесc компакт - это как раз сворачивание массива на меньшее число дисков с удалением сбойного диска и свободного пространства с него.
Кстати, проверьте и остальные диски на наличие ошибок.
Re: Adaptec 5805, проблемы с массивом
спасибо за оперативный ответ.
а не могли бы вы подсказать, какой теперь алгоритм действий должен быть с моей стороны, чтобы вернуть всё в прежнее состояние - то есть чтобы у меня снова был RAID5EE в состоянии Optimal?
а не могли бы вы подсказать, какой теперь алгоритм действий должен быть с моей стороны, чтобы вернуть всё в прежнее состояние - то есть чтобы у меня снова был RAID5EE в состоянии Optimal?
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Adaptec 5805, проблемы с массивом
jeff
По крайней мере, еще один диск (номер 9QJ6RNFX) близок к сбою.
Обязательно выключите кеширование записи на дисках.
По крайней мере, еще один диск (номер 9QJ6RNFX) близок к сбою.
Обязательно выключите кеширование записи на дисках.
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Adaptec 5805, проблемы с массивом
Дождитесь завершения процедуры компакт. Но она очень долгая.
Я рекомендую просто скопировать данные с массива в другое место и пересоздать массив. Будет намного быстрее.
Ну и создавайте обычный RAID 5 + HotSpare. Работает надежнее.
P.S. Обновите прошивку на контроллере. Очень старая. Ну и заодно драйвер и ASM.
Я рекомендую просто скопировать данные с массива в другое место и пересоздать массив. Будет намного быстрее.
Ну и создавайте обычный RAID 5 + HotSpare. Работает надежнее.
P.S. Обновите прошивку на контроллере. Очень старая. Ну и заодно драйвер и ASM.
Re: Adaptec 5805, проблемы с массивом
к сожалению, сейчас переключить режим кеширования Adaptec Storage Manager мне не позволяет - эти опции недоступны для данного массива.
правильно я понимаю, что после завершения процесса "компакт" мой рейд 5ee превратится в обычный 5ый рейд в состоянии Optimal?
правильно я понимаю, что после завершения процесса "компакт" мой рейд 5ee превратится в обычный 5ый рейд в состоянии Optimal?
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Adaptec 5805, проблемы с массивом
jeff
После завершения процедуры будет обычный RAID 5.
Надо выключить кеширование не всего массива, а кеширование на каждом диске.
После завершения процедуры будет обычный RAID 5.
Надо выключить кеширование не всего массива, а кеширование на каждом диске.
Re: Adaptec 5805, проблемы с массивом
Ещё раз здравствуйте.
Прикупил два новых диска, выбрал WD из HCL-листа для данного контроллера. Проинициализировал новый диск, подключив его в ту же корзину, что и предыдущий испорченный; включил режим copyback, и выполнил rescan - массив за несколько часов отребилдился в Optimal.
В итоге сейчас все массивы в состоянии Optimal, диски тоже, и у всех массивов есть как прежде 2 global хостпейр на замену.
Но вот что странно - снаружи, у сервера на всех дисках этого раннее сломанного массива, кроме нового замененного WD, мигают синий и красный светодиоды.
Раньше светодиоды мигали только у хотспейр дисков. Не подскажете, что это может значить?
Прикупил два новых диска, выбрал WD из HCL-листа для данного контроллера. Проинициализировал новый диск, подключив его в ту же корзину, что и предыдущий испорченный; включил режим copyback, и выполнил rescan - массив за несколько часов отребилдился в Optimal.
В итоге сейчас все массивы в состоянии Optimal, диски тоже, и у всех массивов есть как прежде 2 global хостпейр на замену.
Но вот что странно - снаружи, у сервера на всех дисках этого раннее сломанного массива, кроме нового замененного WD, мигают синий и красный светодиоды.
Раньше светодиоды мигали только у хотспейр дисков. Не подскажете, что это может значить?
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 54 гостя