Там Adaptec RAID 3805/256
Стоит 8 винтов в raid5ee
Судя по всему, начал помирать один из винтов - периодически уходит в аут.
Проблема в том, что debian в момент ухода в аут этого винта уходит за ним следом, сообщая
Код: Выделить всё
Jun 22 06:55:55 82.193.141.166 kernel: aacraid: Host adapter reset request. SCSI hang ?
Jun 22 06:56:56 82.193.141.166 syslogd: /var/log/kern.log: Input/output error
Jun 22 06:56:56 82.193.141.166 kernel: aacraid: SCSI bus appears hung
Jun 22 06:56:56 82.193.141.166 syslogd: /var/log/messages: Input/output error
Jun 22 06:56:56 82.193.141.166 sendmail[29503]: n5M0u1VZ029503: SYSERR(converter): collect: Cannot write ./dfn5M0u1VZ029503 (fsync, uid=1005, gid=105): Input/output error
Jun 22 06:56:56 82.193.141.166 syslogd: /var/log/mail.warn: Cannot allocate memory
Jun 22 06:56:56 82.193.141.166 syslogd: /var/log/mail.err: Input/output error
Jun 22 06:56:56 82.193.141.166 sendmail[29503]: n5M0u1VZ029503: SYSERR(converter): queueup: cannot create queue file ./qfn5M0u1VZ029503, euid=1005, fd=-1, fp=0x0: Read-only file system
Jun 22 06:56:56 82.193.141.166 kernel: end_request: I/O error, dev sda, sector 4294966779
Jun 22 06:56:56 82.193.141.166 kernel: sd 0:0:0:0: rejecting I/O to offline device
Может быть кто-то сталкивался с таким моментом?
Как решать? Новое ядро, какие-то другие драйвера, может?
На сервере стоит debian etch, aacraid as is.
Все что нашлось в интернетах похожего - говорит о старых багах в aacraid которые были поправлены три-четыре года назад и все патчи давно есть в ядрах, более старых, чем 2.6.18 из etch. Ума не приложу, что делать.
Больше года серверу, работал все время в одном и том же режиме, единственное что менялось - росла нагрузка вместе с ростом проекта.