Целы ли данные после Degraded - Rebuilding - Optimal
Модераторы: Trinity admin`s, Free-lance moderator`s
Целы ли данные после Degraded - Rebuilding - Optimal
Добрый день.
Запищал Adaptec 5805 (8 хардов WD по 2TB), когда зашел в ASM увидел, что ребилдится 5 хард, оба логических диска C (System) и D (Data) ребилдятся... Если после завершения процесса ребилдинга все (харды и логические диски) станут Optimal, могу я считать, что все данные целы ?
Часть лога:
Controller event logs:
---------------------------
Device event log for controller 1
Vendor/Model S/N (20 chars max) WWN (SAS only) DeviceID(T:L) Parity errors Link errors HW errors Cmd aborts Medium errors SMART error SMART warnings
WDC WD2003FY WD-WMAUR0559444 0000000000000000 5(5:0) 0 10 0 0 0 false 0
------------------------------------------------------------------------
Defunct drive event log for controller 1
Date and time Vendor/Model S/N (20 chars max) WWN (SAS only) Failure code Description
April 08, 2013 6:53:28 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:25:10 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:25:43 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:26:35 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:27:13 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:02:27 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:03:04 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:03:39 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
May 28, 2013 6:11:32 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
------------------------------------------------------------------------
Soft event log for controller 1
May 28, 2013 6:11:32 PM MSD INF User-PC Drive removed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:32 PM MSD WRN User-PC An error occurred while accessing the logical device: controller 1, logical device 0
May 28, 2013 6:11:32 PM MSD WRN User-PC An error occurred while accessing the logical device: controller 1, logical device 1
May 28, 2013 6:11:32 PM MSD ERR User-PC Drive in a RAID-5 set failed: controller 1, logical device 0
May 28, 2013 6:11:32 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:32 PM MSD ERR User-PC Drive in a RAID-5 set failed: controller 1, logical device 1
May 28, 2013 6:11:32 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:33 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:11:33 PM MSD WRN User-PC RAID-5 failover operation failed because there are no failover devices assigned to this RAID-5 set: controller 1, logical device 0
May 28, 2013 6:11:33 PM MSD WRN User-PC RAID-5 failover operation failed because there are no failover devices assigned to this RAID-5 set: controller 1, logical device 1
May 28, 2013 6:11:44 PM MSD INF User-PC New device found: controller 1, channel 0, SCSI device ID 5, LUN 0
May 28, 2013 6:11:44 PM MSD INF User-PC Sense data: Illegal request (INVALID FIELD IN PARAMETER LIST). Controller 1, channel 0, SCSI device ID 5, LUN 0, cdb [15 10 00 00 10 00 00 00 02 00 00 00], data [70 00 05 00 00 00 00 00 00 00 00 00 26 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00]
May 28, 2013 6:11:44 PM MSD INF User-PC Drive inserted: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:12:05 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:12:08 PM MSD INF User-PC Failover disk changed: controller 1, logical device 0
May 28, 2013 6:12:08 PM MSD INF User-PC Failover and rebuild operation started on a RAID-5 set: controller 1, logical device 0
May 28, 2013 6:12:08 PM MSD INF User-PC Container changed: controller 1, logical device 0
May 28, 2013 6:12:13 PM MSD INF User-PC Configuration has changed.
May 28, 2013 6:12:14 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:12:15 PM MSD INF User-PC Failover disk changed: controller 1, logical device 1
May 28, 2013 6:12:15 PM MSD INF User-PC Failover and rebuild operation started on a RAID-5 set: controller 1, logical device 1
May 28, 2013 6:12:16 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:12:20 PM MSD INF User-PC Configuration has changed.
May 28, 2013 6:13:40 PM MSD INF User-PC Container changed: controller 1, logical device 0
May 28, 2013 6:13:41 PM MSD INF User-PC RAID-5 rebuild operation completed successfully: controller 1, logical device 0
May 28, 2013 6:13:46 PM MSD INF User-PC Configuration has changed.
------------------------------------------------------------------------
Запищал Adaptec 5805 (8 хардов WD по 2TB), когда зашел в ASM увидел, что ребилдится 5 хард, оба логических диска C (System) и D (Data) ребилдятся... Если после завершения процесса ребилдинга все (харды и логические диски) станут Optimal, могу я считать, что все данные целы ?
Часть лога:
Controller event logs:
---------------------------
Device event log for controller 1
Vendor/Model S/N (20 chars max) WWN (SAS only) DeviceID(T:L) Parity errors Link errors HW errors Cmd aborts Medium errors SMART error SMART warnings
WDC WD2003FY WD-WMAUR0559444 0000000000000000 5(5:0) 0 10 0 0 0 false 0
------------------------------------------------------------------------
Defunct drive event log for controller 1
Date and time Vendor/Model S/N (20 chars max) WWN (SAS only) Failure code Description
April 08, 2013 6:53:28 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:25:10 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:25:43 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:26:35 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:27:13 AM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:02:27 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:03:04 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
April 18, 2013 6:03:39 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
May 28, 2013 6:11:32 PM MSD WDC WD2003FY WD-WMAUR0559444 0000000000000000 0x2 Selection timeout: device removed or not responding
------------------------------------------------------------------------
Soft event log for controller 1
May 28, 2013 6:11:32 PM MSD INF User-PC Drive removed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:32 PM MSD WRN User-PC An error occurred while accessing the logical device: controller 1, logical device 0
May 28, 2013 6:11:32 PM MSD WRN User-PC An error occurred while accessing the logical device: controller 1, logical device 1
May 28, 2013 6:11:32 PM MSD ERR User-PC Drive in a RAID-5 set failed: controller 1, logical device 0
May 28, 2013 6:11:32 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:32 PM MSD ERR User-PC Drive in a RAID-5 set failed: controller 1, logical device 1
May 28, 2013 6:11:32 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:11:33 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:11:33 PM MSD WRN User-PC RAID-5 failover operation failed because there are no failover devices assigned to this RAID-5 set: controller 1, logical device 0
May 28, 2013 6:11:33 PM MSD WRN User-PC RAID-5 failover operation failed because there are no failover devices assigned to this RAID-5 set: controller 1, logical device 1
May 28, 2013 6:11:44 PM MSD INF User-PC New device found: controller 1, channel 0, SCSI device ID 5, LUN 0
May 28, 2013 6:11:44 PM MSD INF User-PC Sense data: Illegal request (INVALID FIELD IN PARAMETER LIST). Controller 1, channel 0, SCSI device ID 5, LUN 0, cdb [15 10 00 00 10 00 00 00 02 00 00 00], data [70 00 05 00 00 00 00 00 00 00 00 00 26 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00]
May 28, 2013 6:11:44 PM MSD INF User-PC Drive inserted: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:12:05 PM MSD ERR User-PC Disk failed: controller 1, channel 0, SCSI device ID 5
May 28, 2013 6:12:08 PM MSD INF User-PC Failover disk changed: controller 1, logical device 0
May 28, 2013 6:12:08 PM MSD INF User-PC Failover and rebuild operation started on a RAID-5 set: controller 1, logical device 0
May 28, 2013 6:12:08 PM MSD INF User-PC Container changed: controller 1, logical device 0
May 28, 2013 6:12:13 PM MSD INF User-PC Configuration has changed.
May 28, 2013 6:12:14 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:12:15 PM MSD INF User-PC Failover disk changed: controller 1, logical device 1
May 28, 2013 6:12:15 PM MSD INF User-PC Failover and rebuild operation started on a RAID-5 set: controller 1, logical device 1
May 28, 2013 6:12:16 PM MSD INF User-PC Container changed: controller 1, logical device 1
May 28, 2013 6:12:20 PM MSD INF User-PC Configuration has changed.
May 28, 2013 6:13:40 PM MSD INF User-PC Container changed: controller 1, logical device 0
May 28, 2013 6:13:41 PM MSD INF User-PC RAID-5 rebuild operation completed successfully: controller 1, logical device 0
May 28, 2013 6:13:46 PM MSD INF User-PC Configuration has changed.
------------------------------------------------------------------------
-
- Advanced member
- Сообщения: 450
- Зарегистрирован: 10 окт 2006, 18:35
- Откуда: Киев
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
1. В первом приближении да.
2. Там еще Consistency Check есть - шаг 2.
3. чекдиск из ОС - шаг 3.
4. проверка данных непосредственно в бою
зы диски из листа совместимости?
2. Там еще Consistency Check есть - шаг 2.
3. чекдиск из ОС - шаг 3.
4. проверка данных непосредственно в бою
зы диски из листа совместимости?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Верификация после ребилда ничего не даст - при сбоях ребилд бы сам тормознул. Раз до конца дошел успешно, значит бэд страйпов нету и с т.з. контроллера все в порядке. Но это не означает целостность данных с т.з. ОС - при отсутствии ББУ, например, данные могли не дойти до блинов при сбое питания и т.п.
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Ребилд до конца прошел успешно, последующая верификация тоже (хотя понял из Вашего поста, что смысла запускать не было). ББУ стоит. Сбоя в питании сервера не было. Просто по какой то причине контроллер потерял винт, тут же нашел и запустил ребилдинг. В момент сбоя никакой записи на диск данных D не производилось, а что там делала операционка с системным диском С - наплевать. Могу я считать после всего этого, что данные на диске D целы на 100% ?gs писал(а):Верификация после ребилда ничего не даст - при сбоях ребилд бы сам тормознул. Раз до конца дошел успешно, значит бэд страйпов нету и с т.з. контроллера все в порядке. Но это не означает целостность данных с т.з. ОС - при отсутствии ББУ, например, данные могли не дойти до блинов при сбое питания и т.п.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Все должно быть хорошо.
А абортед коммандс случайно на винтах нету?
А абортед коммандс случайно на винтах нету?
-
- Advanced member
- Сообщения: 450
- Зарегистрирован: 10 окт 2006, 18:35
- Откуда: Киев
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Vendor/Model S/N (20 chars max) WWN (SAS only) DeviceID(T:L) Parity errors Link errors HW errors Cmd aborts Medium errors SMART error SMART warnings
WDC WD2003FY WD-WMAUR0559444 0000000000000000 5(5:0) 0 10 0 0 0 false 0
Согласно первому посту - нету
WDC WD2003FY WD-WMAUR0559444 0000000000000000 5(5:0) 0 10 0 0 0 false 0
Согласно первому посту - нету
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Не посмотрел...
Получается линк эрроры?
Получается линк эрроры?
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Ага... 10 линк эрроров и 3 ребилда - 8 и 18 апреля, 28 мая. Сегодня проверил разъемы-контакты кабелей... Корзин нет, соединение прямое - кабель контроллер-винт... SMART винта отличный.gs писал(а):Не посмотрел...
Получается линк эрроры?
Последний раз редактировалось DMU 30 май 2013, 12:31, всего редактировалось 2 раза.
-
- Advanced member
- Сообщения: 450
- Зарегистрирован: 10 окт 2006, 18:35
- Откуда: Киев
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Может просто диск передернуть, типа освежить контакты и все будет путем?
или сменить кабелек (он копеечный)
или сменить кабелек (он копеечный)
-
- member
- Сообщения: 21
- Зарегистрирован: 15 май 2008, 11:58
- Откуда: Sharjah, UAE
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Если партномер дисков WD2002FYPS и приобретены они были в районе лета 2010 года, то вероятно проблема в самих дисках.
У нас проект на 700ТБ с такими дисками был. Контроллер LSISAS2108 (AOC-SAS2LP-H8iR). Версию прошивки дисков к сожалению не помню. Диски Intellipower вероятно снижали скорость из-за простоя, а потом вовремя не отвечали контроллеру. Контроллер помечал диски как BAD, хотя позже тесты показывали, что с дисками все нормально. В результате долгих разборок с WD, пересылкой логов и "порченных" дисков, всю партию заменили. Их спецы проблему не назвали, просто молча заменили.
У нас проект на 700ТБ с такими дисками был. Контроллер LSISAS2108 (AOC-SAS2LP-H8iR). Версию прошивки дисков к сожалению не помню. Диски Intellipower вероятно снижали скорость из-за простоя, а потом вовремя не отвечали контроллеру. Контроллер помечал диски как BAD, хотя позже тесты показывали, что с дисками все нормально. В результате долгих разборок с WD, пересылкой логов и "порченных" дисков, всю партию заменили. Их спецы проблему не назвали, просто молча заменили.
Re: Целы ли данные после Degraded - Rebuilding - Optimal
WD2003FYYSGregory писал(а):Если партномер дисков WD2002FYPS и приобретены они были в районе лета 2010 года, то вероятно проблема в самих дисках.
-
- Advanced member
- Сообщения: 450
- Зарегистрирован: 10 окт 2006, 18:35
- Откуда: Киев
- Контактная информация:
Re: Целы ли данные после Degraded - Rebuilding - Optimal
Type Manufacturer Family Model FW Revision Capacity Speed Standby
Mode
Power-Off
SATA Western Digital WD RE4 WD2003FYYS 01.00D01, 01.01D01 2TB 3G
т.е. поддерживаются офф. но в случае с WD желательно поддерживать уровень firmware согласно сс
Mode
Power-Off
SATA Western Digital WD RE4 WD2003FYYS 01.00D01, 01.01D01 2TB 3G
т.е. поддерживаются офф. но в случае с WD желательно поддерживать уровень firmware согласно сс
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя