aacraid, debian и rejecting I/O to offline device

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: aacraid, debian и rejecting I/O to offline device

Сообщение Black-Dragon » 24 июн 2009, 12:06

Диски менять (пока :) ) не надо, надо обновить только прошивку\драйвер, да и кабели заменить\потыкать не мешает. Хотя, одно и то же время выхода из строя говорит о софтовой природе проблемы. Может вообще, вирус :D .

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 24 июн 2009, 12:23

Black-Dragon писал(а):Диски менять (пока :) ) не надо, надо обновить только прошивку\драйвер, да и кабели заменить\потыкать не мешает. Хотя, одно и то же время выхода из строя говорит о софтовой природе проблемы. Может вообще, вирус :D .
Диски менять надо. Потому что один диск вообще не видится контроллером, а на другом как-то необычно горят лампочки (описываю со слов другого человека, потому без подробностей) и на нем же счетчик каких-то прерванных операций и сбоев media ненулевой (на остальных - нулевой).

Вирус? На линуксе? На веб-сервере, который без монитора, клавиатуры и графической среды?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение gs » 24 июн 2009, 13:12

Абортед коммандс - знаменитая фишка сигейтов серии 7200.11. Угадал?

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: aacraid, debian и rejecting I/O to offline device

Сообщение Black-Dragon » 24 июн 2009, 14:09

buggzy писал(а):Вирус? На линуксе? На веб-сервере, который без монитора, клавиатуры и графической среды?
А смайлик для кого стоит?

Насчёт дисков я написал в контексте проблемы, повторяющейся в одно и то же время. Там не диски виноваты.

Аватара пользователя
DeadMazay
Advanced member
Сообщения: 1743
Зарегистрирован: 20 сен 2007, 15:07
Откуда: Новосибирск, Мск
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение DeadMazay » 24 июн 2009, 14:10

я кстати не заметил модели винтов прицепленных к контроллеру... (я плохо вижу :) или их не озвучивали??)

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 24 июн 2009, 14:16

Вроде озвучивал, ST350032. Написано, что 3805 из поддерживает.

На одном из винтов порядка 10 сбоев media и порядка 70 aborted. На остальных - по нулям.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение gs » 24 июн 2009, 14:31

Эти диски вроде есть в HCL, но лучше их избегать.

Аватара пользователя
DeadMazay
Advanced member
Сообщения: 1743
Зарегистрирован: 20 сен 2007, 15:07
Откуда: Новосибирск, Мск
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение DeadMazay » 24 июн 2009, 15:25

buggzy писал(а):Вроде озвучивал, ST350032. Написано, что 3805 из поддерживает.

На одном из винтов порядка 10 сбоев media и порядка 70 aborted. На остальных - по нулям.
поди прошивка SD15

Данила Ш.
Junior member
Сообщения: 17
Зарегистрирован: 02 май 2007, 08:38
Откуда: Екатеринбург
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение Данила Ш. » 24 июн 2009, 21:28

gs писал(а):Эти диски вроде есть в HCL, но лучше их избегать.
Сервер в "Тринити" собирали и комплектовали. :)

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 25 июн 2009, 05:04

Посмотрел, что на серваке выполняется в тот момент, когда он обычно дохнет. Оказалось, выполняется скрипт, обновляющий базу данных для быстрого поиска файлов на диске (updatedb). В планировщике его не заметил, потому что запрятан далеко и запускается за пол-часа до кризиса.

Прибил процесс. Сегодня сервер не упал.

Возможно, дело в том, что этот скрипт пробегается по всей файловой системе и по пути контроллер или драйвер натыкаются на что-нибудь нехорошее, от чего драйвер виснет. Это объясняет, почему проблема возникала в один и тот же момент времени ежедневно.

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: aacraid, debian и rejecting I/O to offline device

Сообщение Black-Dragon » 25 июн 2009, 10:01

buggzy писал(а):Оказалось, выполняется скрипт, обновляющий базу данных для быстрого поиска файлов на диске (updatedb). В планировщике его не заметил, потому что запрятан далеко и запускается за пол-часа до кризиса.Прибил процесс. Сегодня сервер не упал.
Ну вот, видите.

Теперь обновите драйвер и прошивку(и). Возможно, поможет.

Кстати, вы consistency check когда-нибудь делали (особенно в последние пару месяцев)?

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 25 июн 2009, 11:00

Black-Dragon писал(а):Кстати, вы consistency check когда-нибудь делали (особенно в последние пару месяцев)?
это где? делал verify, ничего нового не написало, только про bad stripes.

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: aacraid, debian и rejecting I/O to offline device

Сообщение Black-Dragon » 25 июн 2009, 11:09

buggzy писал(а):это где? делал verify, ничего нового не написало, только про bad stripes.
Это то же самое.
Я просто думаю, может есть "старые" данные, которые от редкого использования "истёрлись" ибо:
buggzy писал(а):Возможно, дело в том, что этот скрипт пробегается по всей файловой системе и по пути контроллер или драйвер натыкаются на что-нибудь нехорошее, от чего драйвер виснет.
В общем, причина проблемы может быть в (логической) поврежденности данных. Правда, драйвер себя всё равно так вести не должен, но сама причина IMHO не в нём.
Вам надо, в первую очередь, как-то решить проблему с bad stripes. Ну и драйвер обновить не мешает. Может новый корректнее отнесётся к подобным проблемам.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение exLH » 25 июн 2009, 11:32

buggzy писал(а):только про bad stripes.
Пересоздавайте массив. Bad stripes это плохо и неизлечимо.

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 25 июн 2009, 11:43

exLH писал(а):
buggzy писал(а):только про bad stripes.
Пересоздавайте массив. Bad stripes это плохо и неизлечимо.
bad stripes возникли, вероятнее всего, из-за физического сбоя одного или нескольких дисков. после исправления сбоя (замены дисков), понятно дело, данные все равно нельзя будет восстановить. но разве массив после этого нельзя будет использовать вообще? как-то это непонятно.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 19 гостей