aacraid, debian и rejecting I/O to offline device
Модераторы: Trinity admin`s, Free-lance moderator`s
-
- Advanced member
- Сообщения: 507
- Зарегистрирован: 17 апр 2009, 00:49
- Откуда: Yerevan
Re: aacraid, debian и rejecting I/O to offline device
Диски менять (пока ) не надо, надо обновить только прошивку\драйвер, да и кабели заменить\потыкать не мешает. Хотя, одно и то же время выхода из строя говорит о софтовой природе проблемы. Может вообще, вирус .
Re: aacraid, debian и rejecting I/O to offline device
Диски менять надо. Потому что один диск вообще не видится контроллером, а на другом как-то необычно горят лампочки (описываю со слов другого человека, потому без подробностей) и на нем же счетчик каких-то прерванных операций и сбоев media ненулевой (на остальных - нулевой).Black-Dragon писал(а):Диски менять (пока ) не надо, надо обновить только прошивку\драйвер, да и кабели заменить\потыкать не мешает. Хотя, одно и то же время выхода из строя говорит о софтовой природе проблемы. Может вообще, вирус .
Вирус? На линуксе? На веб-сервере, который без монитора, клавиатуры и графической среды?
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: aacraid, debian и rejecting I/O to offline device
Абортед коммандс - знаменитая фишка сигейтов серии 7200.11. Угадал?
-
- Advanced member
- Сообщения: 507
- Зарегистрирован: 17 апр 2009, 00:49
- Откуда: Yerevan
Re: aacraid, debian и rejecting I/O to offline device
А смайлик для кого стоит?buggzy писал(а):Вирус? На линуксе? На веб-сервере, который без монитора, клавиатуры и графической среды?
Насчёт дисков я написал в контексте проблемы, повторяющейся в одно и то же время. Там не диски виноваты.
- DeadMazay
- Advanced member
- Сообщения: 1743
- Зарегистрирован: 20 сен 2007, 15:07
- Откуда: Новосибирск, Мск
- Контактная информация:
Re: aacraid, debian и rejecting I/O to offline device
я кстати не заметил модели винтов прицепленных к контроллеру... (я плохо вижу или их не озвучивали??)
Re: aacraid, debian и rejecting I/O to offline device
Вроде озвучивал, ST350032. Написано, что 3805 из поддерживает.
На одном из винтов порядка 10 сбоев media и порядка 70 aborted. На остальных - по нулям.
На одном из винтов порядка 10 сбоев media и порядка 70 aborted. На остальных - по нулям.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: aacraid, debian и rejecting I/O to offline device
Эти диски вроде есть в HCL, но лучше их избегать.
- DeadMazay
- Advanced member
- Сообщения: 1743
- Зарегистрирован: 20 сен 2007, 15:07
- Откуда: Новосибирск, Мск
- Контактная информация:
Re: aacraid, debian и rejecting I/O to offline device
поди прошивка SD15buggzy писал(а):Вроде озвучивал, ST350032. Написано, что 3805 из поддерживает.
На одном из винтов порядка 10 сбоев media и порядка 70 aborted. На остальных - по нулям.
-
- Junior member
- Сообщения: 17
- Зарегистрирован: 02 май 2007, 08:38
- Откуда: Екатеринбург
- Контактная информация:
Re: aacraid, debian и rejecting I/O to offline device
Сервер в "Тринити" собирали и комплектовали.gs писал(а):Эти диски вроде есть в HCL, но лучше их избегать.
Re: aacraid, debian и rejecting I/O to offline device
Посмотрел, что на серваке выполняется в тот момент, когда он обычно дохнет. Оказалось, выполняется скрипт, обновляющий базу данных для быстрого поиска файлов на диске (updatedb). В планировщике его не заметил, потому что запрятан далеко и запускается за пол-часа до кризиса.
Прибил процесс. Сегодня сервер не упал.
Возможно, дело в том, что этот скрипт пробегается по всей файловой системе и по пути контроллер или драйвер натыкаются на что-нибудь нехорошее, от чего драйвер виснет. Это объясняет, почему проблема возникала в один и тот же момент времени ежедневно.
Прибил процесс. Сегодня сервер не упал.
Возможно, дело в том, что этот скрипт пробегается по всей файловой системе и по пути контроллер или драйвер натыкаются на что-нибудь нехорошее, от чего драйвер виснет. Это объясняет, почему проблема возникала в один и тот же момент времени ежедневно.
-
- Advanced member
- Сообщения: 507
- Зарегистрирован: 17 апр 2009, 00:49
- Откуда: Yerevan
Re: aacraid, debian и rejecting I/O to offline device
Ну вот, видите.buggzy писал(а):Оказалось, выполняется скрипт, обновляющий базу данных для быстрого поиска файлов на диске (updatedb). В планировщике его не заметил, потому что запрятан далеко и запускается за пол-часа до кризиса.Прибил процесс. Сегодня сервер не упал.
Теперь обновите драйвер и прошивку(и). Возможно, поможет.
Кстати, вы consistency check когда-нибудь делали (особенно в последние пару месяцев)?
Re: aacraid, debian и rejecting I/O to offline device
это где? делал verify, ничего нового не написало, только про bad stripes.Black-Dragon писал(а):Кстати, вы consistency check когда-нибудь делали (особенно в последние пару месяцев)?
-
- Advanced member
- Сообщения: 507
- Зарегистрирован: 17 апр 2009, 00:49
- Откуда: Yerevan
Re: aacraid, debian и rejecting I/O to offline device
Это то же самое.buggzy писал(а):это где? делал verify, ничего нового не написало, только про bad stripes.
Я просто думаю, может есть "старые" данные, которые от редкого использования "истёрлись" ибо:
В общем, причина проблемы может быть в (логической) поврежденности данных. Правда, драйвер себя всё равно так вести не должен, но сама причина IMHO не в нём.buggzy писал(а):Возможно, дело в том, что этот скрипт пробегается по всей файловой системе и по пути контроллер или драйвер натыкаются на что-нибудь нехорошее, от чего драйвер виснет.
Вам надо, в первую очередь, как-то решить проблему с bad stripes. Ну и драйвер обновить не мешает. Может новый корректнее отнесётся к подобным проблемам.
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Re: aacraid, debian и rejecting I/O to offline device
Пересоздавайте массив. Bad stripes это плохо и неизлечимо.buggzy писал(а):только про bad stripes.
Re: aacraid, debian и rejecting I/O to offline device
bad stripes возникли, вероятнее всего, из-за физического сбоя одного или нескольких дисков. после исправления сбоя (замены дисков), понятно дело, данные все равно нельзя будет восстановить. но разве массив после этого нельзя будет использовать вообще? как-то это непонятно.exLH писал(а):Пересоздавайте массив. Bad stripes это плохо и неизлечимо.buggzy писал(а):только про bad stripes.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 19 гостей