Контроллер Adaptec 5805 не запускает регенерацию

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

SergKz
Junior member
Сообщения: 2
Зарегистрирован: 04 июн 2014, 07:20

Контроллер Adaptec 5805 не запускает регенерацию

Сообщение SergKz » 04 июн 2014, 07:35

(поиском и листанием форума аналогичной ситуации не нашёл, покажите если не увидел)

Из-за неисправности UPS (бывает и такое, ага, если устройство снабжено предохранителем - то первым сгорает устройство, защищая предохранитель) произошло аварийное отключение хранилища с 16-ю винтами на контроллере 5805.
Соответственно один массив RAID5 из 10 дисков выпал в Degraded.
После старта один из дисков не увиделся, и началась регенерация на запасной.
НО! тут подоспела ещё одна авария по питанию, после которой массив остался в состоянии Degraded, но и регенерация прекратилась. Неопознающийся диск был заменён на ПОЛНОСТЬЮ АНАЛОГИЧНЫЙ, система перезапущена. Регенерация не идёт. Подождали час - не идёт. Новый диск был отмечен как Dedicated Hot Spare для сломавшегося массива - регенерация не запускается.
Смотрю через arcconf список текущих задач - ничего не выполняется.
Через Adaptec Storage Manager пункты меню "verify" и "verify with fix" для деградированного массива недоступны (серые, неактивные).
А, да - система Windows Storage Server 2008 x64.

Так и висит уже больше суток вот в таком виде:
===
C:\Program Files\Adaptec\Adaptec Storage Manager>arcconf getconfig 1 ld 2
Controllers found: 1
----------------------------------------------------------------------
Logical device information
----------------------------------------------------------------------
Logical device number 2
Logical device name : Vol2_16TB
RAID level : 5
Status of logical device : Degraded
Size : 17141750 MB
Stripe-unit size : 256 KB
Read-cache mode : Enabled
MaxCache preferred read cache setting : Enabled
MaxCache read cache setting : Disabled
Write-cache mode : Enabled (write-back)
Write-cache setting : Enabled (write-back) when protected by battery/ZMM
Partitioned : Yes
Protected by Hot-Spare : Yes
Dedicated Hot-Spare : 0,22
Global Hot-Spare : 0,23
Bootable : No
Failed stripes : No
Power settings : Disabled
--------------------------------------------------------
Logical device segment information
--------------------------------------------------------
Segment 0 : Present (Controller:1,Enclosure:0,Slot:5) JK11A8B9HH9W1F
Segment 1 : Present (Controller:1,Enclosure:0,Slot:6) JK11A4B8HBU63W
Segment 2 : Present (Controller:1,Enclosure:0,Slot:7) JK11A4B8H9RELW
Segment 3 : Present (Controller:1,Enclosure:0,Slot:8) JK11A8B9HGXTWF
Segment 4 : Present (Controller:1,Enclosure:0,Slot:9) JK11A8B9HGXW4F
Segment 5 : Present (Controller:1,Enclosure:0,Slot:10) JK11A8B9HG1WVF
Segment 6 : Present (Controller:1,Enclosure:0,Slot:11) JK11A4B8H9RAWW
Segment 7 : Present (Controller:1,Enclosure:0,Slot:12) JK11A8B9HGXR0F
Segment 8 : Present (Controller:1,Enclosure:0,Slot:13) JK11A8B9HGXWRF
Segment 9 : Missing

Command completed successfully.
====

То есть запасные диски для массива контроллер видит, но регенерировать массив на них не считает нужным.

arcconf rescan 1 делал - не помогло, только подвесило всё хранилище на 5 минут.

Куда ещё можно пнуть контроллер, чтобы он запустил регенерацию?


update: в суппорте Adaptec, что интересно, ответили, но рекомендации сводятся к трём вариантам:
1. Сбэкапить весь массив целиком (16 терабайт, ага), уничтожить логический диск и пересобрать, потом залить из бэкапа. Невозможно - бэкапить такой объём некуда.
2. Зайти в BIOS в меню дисковых утилит и отформатировать не желающий активироваться запасной диск низкоуровневым форматом. Пока не делал.
2. Отсоединить корзину от контроллера, через инженерное меню BIOS контроллера очистить NVRAM, потом присоединить корзину обратно. Контроллер по задумке на голый конфиг поднимет инфу с дисков. Честно говоря - БОЯЗНО.
3. Как оказалось, ни по логам, ни какими-то командами или менюшками, в том числе инженерного меню BIOS, НЕВОЗМОЖНО во-первых точно сказать, почему контроллер не желает запускать регенерацию, во-вторых НЕВОЗМОЖНО принудительно запустить эту саму регенерацию. Умный сука (с)

update2: многократное назначение запасного диска то Spare, то Dedicated Spare, то инициализация, то очистка - ни к чему не привели.

update3: состояние диска контроллер оценивает как нормальное, ошибок нет. В логах (support archive) присутствует некоторое количество сообщений ILLEGAL COMMAND в том числе и про этот диск, и про другие. Диски из листа совместимости (HCL).

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Tert » 06 июн 2014, 17:59

SergKz
Прошивка на контроллере последняя?
В одной из последних версий прошивки на 5xxx исправлялась похожая проблема.

SergKz
Junior member
Сообщения: 2
Зарегистрирован: 04 июн 2014, 07:20

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение SergKz » 06 июн 2014, 18:05

Tert писал(а):SergKz
Прошивка на контроллере последняя?
В одной из последних версий прошивки на 5xxx исправлялась похожая проблема.
Из письма от суппорта адаптек:

"Имеется возможность обновить БИОС контроллера на более новую версию, но я не хочу Вам это предложить, пока мы попытаемя потратить все остальные возможности. Я понимаю Вашу осторожность ....."

К тому же у меня версия 5.2-0 (18948), на сайте адаптека более новой нету.
http://www.adaptec.com/en-us/downloads/ ... +5805.html
Если только где-то в других языковых версиях или каких-то бетах...

Be_HaPPY_
member
Сообщения: 31
Зарегистрирован: 20 авг 2012, 19:31
Откуда: П-Камчатский

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Be_HaPPY_ » 17 апр 2015, 06:08

Аналогичная проблема у меня на 3 разных серверах. Контроллеры 5805 и 5805Q, версия прошивки последняя, что есть на сайте.
Винты в серверах разные - SAS 300 15k, SAS 600 15k, SATA 3Т WD RE.
Объединяет их только одно - backplane с экспандером Supermicro и версия прошивки 5.2.0 (18948).

Раз в полгода-год контроллер выплевывает один произвольный винт (каждый раз винты разные) и запускает rebuild только если перезагрузиться и войти в BIOS контроллера. Иногда приходится выбрав массив Ctrl+R нажать чтобы принудительно запустить rebuild. Через виндовую утилиту сделать это невозможно, все пункты неактивны.
У единственного сервера с таким контроллером, на котором такое не наблюдается - backplane без экспандера.
Кстати, с внешним экспандером (Chenbro на таком же чипе, как и эти в Supermicro) тоже раз была беда - вместо данных каша на всех винтах (заметили во время резервного копирования).
2015.04.17_00h53m56s_001_.jpg
2015.04.17_14h47m03s_001_.jpg
2015.04.17_14h47m22s_002_.jpg
2015.04.17_14h47m34s_003_.jpg
2015.04.17_14h47m48s_004_.jpg
2015.04.17_14h49m44s_005_.jpg
2015.04.17_15h01m14s_006_.jpg

Аватара пользователя
Don_Fear
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 70
Зарегистрирован: 28 авг 2013, 16:35
Откуда: Екатеринбург

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Don_Fear » 17 апр 2015, 10:17

А какая у вас версия прошивки контроллера?

Be_HaPPY_
member
Сообщения: 31
Зарегистрирован: 20 авг 2012, 19:31
Откуда: П-Камчатский

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Be_HaPPY_ » 17 апр 2015, 10:30

На картинках есть: 5.2.0 (18948) - это последняя, которая есть на сайте.
Контроллеров с другой версией у меня нет.
Сейчас после перезагрузки и принудительного Ctrl+R идет rebuild раздела, который на картинках Degraded.

Аватара пользователя
Don_Fear
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 70
Зарегистрирован: 28 авг 2013, 16:35
Откуда: Екатеринбург

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Don_Fear » 17 апр 2015, 10:32

A support-log контроллера можете выложить?

Be_HaPPY_
member
Сообщения: 31
Зарегистрирован: 20 авг 2012, 19:31
Откуда: П-Камчатский

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Be_HaPPY_ » 17 апр 2015, 10:40

Да, вот он:
Support.rar
(675.92 КБ) 298 скачиваний

maverlife
Advanced member
Сообщения: 186
Зарегистрирован: 28 янв 2014, 08:31
Откуда: Иркутск

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение maverlife » 17 апр 2015, 11:08

еще драйвер старенький, http://www.adaptec.com/en-us/speed/raid ... rt_zip.php.

Be_HaPPY_
member
Сообщения: 31
Зарегистрирован: 20 авг 2012, 19:31
Откуда: П-Камчатский

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Be_HaPPY_ » 17 апр 2015, 11:12

These drivers are Microsoft Certified for:
- Adaptec RAID 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8405, 8805, 8885, 8885Q, 81605ZQ using Firmware/BIOS b32033
А у меня 5805. Для него последний тот, что стоит у меня (во всяком случае, так написано на сайте адаптека).

maverlife
Advanced member
Сообщения: 186
Зарегистрирован: 28 янв 2014, 08:31
Откуда: Иркутск

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение maverlife » 17 апр 2015, 11:15

поставьте этот )

Be_HaPPY_
member
Сообщения: 31
Зарегистрирован: 20 авг 2012, 19:31
Откуда: П-Камчатский

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Be_HaPPY_ » 17 апр 2015, 11:37

Обновил. Но вряд ли влияет драйвер: ибо Windows у меня только на одном проблемном сервере, на остальных - ESX и та же проблема.

Аватара пользователя
Don_Fear
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 70
Зарегистрирован: 28 авг 2013, 16:35
Откуда: Екатеринбург

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Don_Fear » 17 апр 2015, 12:47

2Be_HaPPY_

Скажите, а на других контроллерах диски поримерно такие-же или иные?
И если иные, то какие?

Be_HaPPY_
member
Сообщения: 31
Зарегистрирован: 20 авг 2012, 19:31
Откуда: П-Камчатский

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Be_HaPPY_ » 17 апр 2015, 13:08

Другие - SAS Fujitsu на 300 ГБ 15к об. и SAS Seagate на 600 ГБ 15k об.
Модели через vSphere не посмотреть, могу узнать лишь в понедельник.
Кстати, замечено, что чем больше объем, тем чаще проблема: на 300 было лишь 2 раза за 4 года, 600 раз 5 за 4 года, а 3 ТБ после установки их в сервер продержались меньше, чем 6 мес.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Контроллер Adaptec 5805 не запускает регенерацию

Сообщение Tert » 17 апр 2015, 13:11

Be_HaPPY_
Выключите кеширование записи на дисках.
А то так и будете ловить сбои.

Кроме того, учтите, что у бекплейнов с экспандером от LSI на 3 Гб есть проблема с дисками SATA на 6 Гб.
Они запускаются на 1,5 Гб и могут произвольно отваливаться в массивах. От контроллера это не зависит, т.к. связано с ошибкой в чипе экспандера.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 30 гостей