5805 R10 выпал диск

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Flyer
Advanced member
Сообщения: 53
Зарегистрирован: 27 янв 2012, 15:37
Откуда: SPb

5805 R10 выпал диск

Сообщение Flyer » 19 дек 2013, 12:24

Код: Выделить всё

   --------------------------------------------------------
   Controller Version Information
   --------------------------------------------------------
   BIOS                                     : 5.2-0 (18948)
   Firmware                                 : 5.2-0 (18948)
   Driver                                   : 1.1-7 (28000)
   Boot Flash                               : 5.2-0 (18948)
   --------------------------------------------------------
   Controller Battery Information
   --------------------------------------------------------
   Status                                   : Optimal
   Over temperature                         : No
   Capacity remaining                       : 99 percent
   Time remaining (at current draw)         : 1 days, 19 hours, 55 minutes
Из массива выпал диск (ST3600057SS), и тут бы ничего страшного, но:

Код: Выделить всё

Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Unhandled sense code
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Sense Key : Hardware Error [current]
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Add. Sense: Internal target failure
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 98 eb 6d d0 00 00 01 00 00 00
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Unhandled sense code
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Sense Key : Hardware Error [current]
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Add. Sense: Internal target failure
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 98 eb 6e d0 00 00 01 00 00 00
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Unhandled sense code
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Sense Key : Hardware Error [current]
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Add. Sense: Internal target failure
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 98 eb 6f d0 00 00 02 00 00 00
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Unhandled sense code
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Sense Key : Hardware Error [current]
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Add. Sense: Internal target failure
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 98 eb 6e 30 00 00 00 20 00 00
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Unhandled sense code
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Sense Key : Hardware Error [current]
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Add. Sense: Internal target failure
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 98 eb 6e c0 00 00 00 10 00 00
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Unhandled sense code
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Sense Key : Hardware Error [current]
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Add. Sense: Internal target failure
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 98 eb 6d d0 00 00 00 60 00 00
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Unhandled sense code
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Sense Key : Hardware Error [current]
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] Add. Sense: Internal target failure
Dec 18 20:01:03 storage128 kernel: sd 0:0:1:0: [sdb] CDB: Read(16): 88 00 00 00 00 01 98 eb 6e 50 00 00 00 70 00 00
...
Dec 18 20:01:04 storage128 kernel: end_request: critical target error, dev sdb, sector 6860535760
Dec 18 20:01:04 storage128 kernel: end_request: critical target error, dev sdb, sector 6860535888
Dec 18 20:01:04 storage128 kernel: end_request: critical target error, dev sdb, sector 6860536016
Dec 18 20:01:04 storage128 kernel: end_request: critical target error, dev sdb, sector 6860535848
Dec 18 20:01:04 storage128 kernel: end_request: critical target error, dev sdb, sector 6860535864
Dec 18 20:01:04 storage128 kernel: end_request: critical target error, dev sdb, sector 6860535760
Dec 18 20:01:04 storage128 kernel: end_request: critical target error, dev sdb, sector 6860535896
...
Dec 18 20:01:08 storage128 kernel: Buffer I/O error on device dm-0, logical block 211956635
Dec 18 20:01:08 storage128 kernel: lost page write due to I/O error on dm-0
...
и как результат

Код: Выделить всё

Dec 18 20:01:09 storage128 kernel: Aborting journal on device dm-0-8.
Dec 18 20:01:09 storage128 kernel: EXT4-fs error (device dm-0): ext4_journal_start_sb: Detected aborted journal
Dec 18 20:01:09 storage128 kernel: EXT4-fs (dm-0): Remounting filesystem read-only
Выпал один диск из зеркала, почему контроллер не смог продолжить работу на оставшемся, а передал ошибку выше?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: 5805 R10 выпал диск

Сообщение gs » 19 дек 2013, 16:07

А что говорит контроллер?

Flyer
Advanced member
Сообщения: 53
Зарегистрирован: 27 янв 2012, 15:37
Откуда: SPb

Re: 5805 R10 выпал диск

Сообщение Flyer » 19 дек 2013, 16:31

Код: Выделить всё

      deadDriveEntry
          vendorID ....................................... SEAGATE
          rtcSeconds ..................................... 29
          rtcMinutes ..................................... 5
          rtcHours ....................................... 19
          rtcDay ......................................... 15
          rtcMonth ....................................... 7
          rtcYear ........................................ 2013
          serialNumber ................................... 3SL19XM700009108HZPY
          productID ...................................... ST360005
          wwn ............................................ 5000c5002849d6f4
          failureReasonCode .............................. 4

Код: Выделить всё

      driveErrorEntry
          smartError ..................................... false
          vendorID ....................................... SEAGATE
          serialNumber ................................... 3SL19XM700009108HZPY
          wwn ............................................ 5000c5002849d6f4
          deviceID ....................................... 15
          productID ...................................... ST360005
          numParityErrors ................................ 0
          linkFailures ................................... 0
          hwErrors ....................................... 1
          abortedCmds .................................... 5
          mediumErrors ................................... 0
          smartWarning ................................... 0
Т.е., диск-то он выкинул и работу на одном продолжил, но передав "наверх" ошибку, из-за чего ФС перемонтировалась в RO.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: 5805 R10 выпал диск

Сообщение gs » 19 дек 2013, 16:58

Что в логе контроллера?
Нет ли упоминаний "bad stripe"?

Flyer
Advanced member
Сообщения: 53
Зарегистрирован: 27 янв 2012, 15:37
Откуда: SPb

Re: 5805 R10 выпал диск

Сообщение Flyer » 19 дек 2013, 17:01

В arcconf getlogs нашёл только это.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: 5805 R10 выпал диск

Сообщение gs » 19 дек 2013, 17:03

В ASM есть "support log".

Flyer
Advanced member
Сообщения: 53
Зарегистрирован: 27 янв 2012, 15:37
Откуда: SPb

Re: 5805 R10 выпал диск

Сообщение Flyer » 19 дек 2013, 17:07

ASM не стоит.

По диску, который стоял в паре с выпавшим, проблем нет, в SMART чисто, long selftest прошёл без ошибок.

Flyer
Advanced member
Сообщения: 53
Зарегистрирован: 27 янв 2012, 15:37
Откуда: SPb

Re: 5805 R10 выпал диск

Сообщение Flyer » 20 дек 2013, 10:43

Тут ещё подумалось, а логи-то на sda в это время писались беспроблемно, хотя sda - R10 из тех же 12 физических дисков, что и sdb.
Т.е., проблема не в экспандере и не в линках.
Из sda проблемный диск просто выкинуло, как и должно было быть.
А вот sdb почему-то возвращал ошибки.
"Особенность" прошивки или/и aacraid?

Flyer
Advanced member
Сообщения: 53
Зарегистрирован: 27 янв 2012, 15:37
Откуда: SPb

Re: 5805 R10 выпал диск

Сообщение Flyer » 13 янв 2014, 15:38

На самом диске - 204 ремапа (до отвала было 0) и десяток
[3,11,0] или [3,16,0] Require Write or Reassign Blocks command

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 53 гостя