Целы ли данные после Degraded - Rebuilding - Optimal

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
DMU
member
Сообщения: 20
Зарегистрирован: 28 май 2013, 21:26
Откуда: Москва

Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение DMU » 28 май 2013, 21:51

Добрый день.
Запищал Adaptec 5805 (8 хардов WD по 2TB), когда зашел в ASM увидел, что ребилдится 5 хард, оба логических диска C (System) и D (Data) ребилдятся... Если после завершения процесса ребилдинга все (харды и логические диски) станут Optimal, могу я считать, что все данные целы ?

Часть лога:
Controller event logs:
---------------------------

Device event log for controller 1

Vendor/Model S/N (20 chars max) WWN (SAS only) DeviceID(T:L) Parity errors Link errors HW errors Cmd aborts Medium errors SMART error SMART warnings
WDC WD2003FY WD-WMAUR0559444 0000000000000000 5(5:0) 0 10 0 0 0 false 0



------------------------------------------------------------------------

Defunct drive event log for controller 1

Date and time Vendor/Model S/N (20 chars max) WWN (SAS only) Failure code Description
April 08, 2013 6:53:28 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:25:10 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:25:43 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:26:35 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:27:13 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:02:27 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:03:04 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:03:39 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
May 28, 2013 6:11:32 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding



------------------------------------------------------------------------

Soft event log for controller 1

May 28, 2013 6:11:32 PM MSD INF User-PC Drive removed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:32 PM MSD WRN User-PC An error occurred while accessing the logical device: controller 1, logical device 0
May 28, 2013 6:11:32 PM MSD WRN User-PC An error occurred while accessing the logical device: controller 1, logical device 1
May 28, 2013 6:11:32 PM MSD ERR User-PC Drive in a RAID-5 set failed: controller 1, logical device 0
May 28, 2013 6:11:32 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:32 PM MSD ERR User-PC Drive in a RAID-5 set failed: controller 1, logical device 1
May 28, 2013 6:11:32 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:33 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:11:33 PM MSD WRN User-PC RAID-5 failover operation failed because there are no failover devices assigned to this RAID-5 set: controller 1, logical device 0
May 28, 2013 6:11:33 PM MSD WRN User-PC RAID-5 failover operation failed because there are no failover devices assigned to this RAID-5 set: controller 1, logical device 1
May 28, 2013 6:11:44 PM MSD INF User-PC New device found: controller 1, channel 0, SCSI device ID 5, LUN 0
May 28, 2013 6:11:44 PM MSD INF User-PC Sense data: Illegal request (INVALID FIELD IN PARAMETER LIST). Controller 1, channel 0, SCSI device ID 5, LUN 0, cdb [15 10 00 00 10 00 00 00 02 00 00 00], data [70 00 05 00 00 00 00 00 00 00 00 00 26 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00]
May 28, 2013 6:11:44 PM MSD INF User-PC Drive inserted: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:12:05 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:12:08 PM MSD INF User-PC Failover disk changed: controller 1, logical device 0
May 28, 2013 6:12:08 PM MSD INF User-PC Failover and rebuild operation started on a RAID-5 set: controller 1, logical device 0
May 28, 2013 6:12:08 PM MSD INF User-PC Container changed: controller 1, logical device 0
May 28, 2013 6:12:13 PM MSD INF User-PC Configuration has changed.
May 28, 2013 6:12:14 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:12:15 PM MSD INF User-PC Failover disk changed: controller 1, logical device 1
May 28, 2013 6:12:15 PM MSD INF User-PC Failover and rebuild operation started on a RAID-5 set: controller 1, logical device 1
May 28, 2013 6:12:16 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:12:20 PM MSD INF User-PC Configuration has changed.
May 28, 2013 6:13:40 PM MSD INF User-PC Container changed: controller 1, logical device 0
May 28, 2013 6:13:41 PM MSD INF User-PC RAID-5 rebuild operation completed successfully: controller 1, logical device 0
May 28, 2013 6:13:46 PM MSD INF User-PC Configuration has changed.

------------------------------------------------------------------------

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение KAI » 28 май 2013, 23:27

1. В первом приближении да.
2. Там еще Consistency Check есть - шаг 2.
3. чекдиск из ОС - шаг 3.
4. проверка данных непосредственно в бою

зы диски из листа совместимости?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение gs » 29 май 2013, 15:31

Верификация после ребилда ничего не даст - при сбоях ребилд бы сам тормознул. Раз до конца дошел успешно, значит бэд страйпов нету и с т.з. контроллера все в порядке. Но это не означает целостность данных с т.з. ОС - при отсутствии ББУ, например, данные могли не дойти до блинов при сбое питания и т.п.

DMU
member
Сообщения: 20
Зарегистрирован: 28 май 2013, 21:26
Откуда: Москва

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение DMU » 29 май 2013, 18:35

gs писал(а):Верификация после ребилда ничего не даст - при сбоях ребилд бы сам тормознул. Раз до конца дошел успешно, значит бэд страйпов нету и с т.з. контроллера все в порядке. Но это не означает целостность данных с т.з. ОС - при отсутствии ББУ, например, данные могли не дойти до блинов при сбое питания и т.п.
Ребилд до конца прошел успешно, последующая верификация тоже (хотя понял из Вашего поста, что смысла запускать не было). ББУ стоит. Сбоя в питании сервера не было. Просто по какой то причине контроллер потерял винт, тут же нашел и запустил ребилдинг. В момент сбоя никакой записи на диск данных D не производилось, а что там делала операционка с системным диском С - наплевать. Могу я считать после всего этого, что данные на диске D целы на 100% ?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение gs » 30 май 2013, 12:12

Все должно быть хорошо.

А абортед коммандс случайно на винтах нету?

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение KAI » 30 май 2013, 12:14

Vendor/Model S/N (20 chars max) WWN (SAS only) DeviceID(T:L) Parity errors Link errors HW errors Cmd aborts Medium errors SMART error SMART warnings
WDC WD2003FY WD-WMAUR0559444 0000000000000000 5(5:0) 0 10 0 0 0 false 0

Согласно первому посту - нету

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение gs » 30 май 2013, 12:23

Не посмотрел...
Получается линк эрроры?

DMU
member
Сообщения: 20
Зарегистрирован: 28 май 2013, 21:26
Откуда: Москва

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение DMU » 30 май 2013, 12:28

gs писал(а):Не посмотрел...
Получается линк эрроры?
Ага... 10 линк эрроров и 3 ребилда - 8 и 18 апреля, 28 мая. Сегодня проверил разъемы-контакты кабелей... Корзин нет, соединение прямое - кабель контроллер-винт... SMART винта отличный.
Последний раз редактировалось DMU 30 май 2013, 12:31, всего редактировалось 2 раза.

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение KAI » 30 май 2013, 12:29

Может просто диск передернуть, типа освежить контакты и все будет путем?
или сменить кабелек (он копеечный)

Gregory
member
Сообщения: 21
Зарегистрирован: 15 май 2008, 11:58
Откуда: Sharjah, UAE
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение Gregory » 02 июн 2013, 10:06

Если партномер дисков WD2002FYPS и приобретены они были в районе лета 2010 года, то вероятно проблема в самих дисках.
У нас проект на 700ТБ с такими дисками был. Контроллер LSISAS2108 (AOC-SAS2LP-H8iR). Версию прошивки дисков к сожалению не помню. Диски Intellipower вероятно снижали скорость из-за простоя, а потом вовремя не отвечали контроллеру. Контроллер помечал диски как BAD, хотя позже тесты показывали, что с дисками все нормально. В результате долгих разборок с WD, пересылкой логов и "порченных" дисков, всю партию заменили. Их спецы проблему не назвали, просто молча заменили.

DMU
member
Сообщения: 20
Зарегистрирован: 28 май 2013, 21:26
Откуда: Москва

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение DMU » 02 июн 2013, 18:47

Gregory писал(а):Если партномер дисков WD2002FYPS и приобретены они были в районе лета 2010 года, то вероятно проблема в самих дисках.
WD2003FYYS

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Re: Целы ли данные после Degraded - Rebuilding - Optimal

Сообщение KAI » 03 июн 2013, 10:06

Type Manufacturer Family Model FW Revision Capacity Speed Standby
Mode
Power-Off
SATA Western Digital WD RE4 WD2003FYYS 01.00D01, 01.01D01 2TB 3G 

т.е. поддерживаются офф. но в случае с WD желательно поддерживать уровень firmware согласно сс

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя