aacraid, debian и rejecting I/O to offline device

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Black-Dragon
Advanced member
Сообщения: 507
Зарегистрирован: 17 апр 2009, 00:49
Откуда: Yerevan

Re: aacraid, debian и rejecting I/O to offline device

Сообщение Black-Dragon » 25 июн 2009, 12:00

buggzy писал(а): но разве массив после этого нельзя будет использовать вообще? как-то это непонятно.
Представьте такую ситуацию: из-за сбоя (не суть важно какой природы) данные не соответствуют своей контрольной сумме. Далее вы меняете диски и делаете ребилд. Но откуда контроллеру знать, верны скопированные данные или контрольная сумма (речь не о контрольной сумме RAID5)? Как была проблема с bad stripes, так и останется (я кстати, не знаю, все ли контроллеры в таких условиях вообще соглашаются на ребилд).

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 25 июн 2009, 12:17

buggzy писал(а):Далее вы меняете диски и делаете ребилд. Но откуда контроллеру знать, верны скопированные данные или контрольная сумма
ни откуда. пусть любую фигню выдает в качестве данных на этом секторе и считает их правильными. один поврежденный сектор - приятнее, чем весь поврежденный логический диск.
Black-Dragon писал(а):я кстати, не знаю, все ли контроллеры в таких условиях вообще соглашаются на ребилд
когда извлекли и вставили обратно один из дисков (тот, на котором aborted requests), он автоматом начал ребилд делать.

Аватара пользователя
DeadMazay
Advanced member
Сообщения: 1743
Зарегистрирован: 20 сен 2007, 15:07
Откуда: Новосибирск, Мск
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение DeadMazay » 25 июн 2009, 12:43

buggzy писал(а): когда извлекли и вставили обратно один из дисков (тот, на котором aborted requests), он автоматом начал ребилд делать.
так не надо делать... либо менять на новый... либо гонять тестами сбойный винт, и при условии его нормального функционирования затереть все на низком уровне и вставить обратно

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение gs » 25 июн 2009, 12:59

Если сервак наш - стучите в сервис, разберемся.

Но бэд страйпы могли появиться и по причине случайного сбоя питалова - собственно в указанной статье все расписано конкретно.

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 25 июн 2009, 15:05

DeadMazay писал(а):так не надо делать... либо менять на новый... либо гонять тестами сбойный винт, и при условии его нормального функционирования затереть все на низком уровне и вставить обратно
Это все замечательно, когда сервер стоит у тебя, а не когда ты умоляешь сотрудника ДЦ в субботу вечером придти что-то сделать там :) Максимум, на что его удалось уговорить - помочь найти сбойный винт путем их вытыкания и разглядывания биоса через KVMoIP. К сожалению, с первого раза не угадали, и выткнули не тот винт. Но после его втыкания прошел нормальный ребилд, более того, система запустилась на еще degraded массиве и не упала, когда его ребилд был закончен.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение gs » 25 июн 2009, 15:10

Еще раз - надо просто с самого начала ставить ASM и периодически гонять верификацию - тогда таких проблем или не будет.

Аватара пользователя
DeadMazay
Advanced member
Сообщения: 1743
Зарегистрирован: 20 сен 2007, 15:07
Откуда: Новосибирск, Мск
Контактная информация:

Re: aacraid, debian и rejecting I/O to offline device

Сообщение DeadMazay » 25 июн 2009, 15:26

gs писал(а):Еще раз - надо просто с самого начала ставить ASM и периодически гонять верификацию - тогда таких проблем или не будет.
и уведомления себе в мыло слать тоже не плохо

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 25 июн 2009, 16:42

DeadMazay писал(а):и уведомления себе в мыло слать тоже не плохо
только когда уведомления не пришли, понимаешь, что они не пришли :) на сервере почтовый сервис не был настроен, скорее всего, потому, что никто не ожидал, что с него кто-то когда-то будет слать почту.

buggzy
Junior member
Сообщения: 14
Зарегистрирован: 24 июн 2009, 05:32
Откуда: Екатеринбург

Re: aacraid, debian и rejecting I/O to offline device

Сообщение buggzy » 25 июн 2009, 16:44

gs писал(а):Еще раз - надо просто с самого начала ставить ASM и периодически гонять верификацию - тогда таких проблем или не будет.
асм, кстати, жгучая вещь. пытаешься законнектиться к серверу асмом, сидя на сером ип, сервер пытается осуществить обратный коннект. конечно же, на серый ип :) и из-за этого не работает. сейчас вот не могу посмотреть с работы, что там происходит - нет белого ипа.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 57 гостей