RAID1 3Тб на LSI 9260-4i
Модераторы: Trinity admin`s, Free-lance moderator`s
RAID1 3Тб на LSI 9260-4i
Здравствуйте, хочу спросить совета по работе с RAID контроллерами LSI и общие рекомендации, чтобы не вляпаться в следующий раз.
Нечаянно вытащил диск из корзины сервера SuperMicro, который входил в RAID1 на котором лежали SQL и файловые базы 1С и множество другой информации, соответственно диск вставил обратно. Но перед его включением в массив бегло просмотрел интернет на описание подобных ситуаций, и вроде бы везде всё просто диск из состояния OFFLINE переводят в ONLINE и всё хорошо работает дальше. Я так и сделал и после ввода на всякий случай запустил процедуру проверки консистентности массива (она шла около 8 часов и закончилась успешно, но не для меня).
На следующий день одна из файловых баз выпала с критической ошибкой - починил с помощью chkdbf, вечером переносил рабочую SQL базу 1С на новое хранилище и получил неисправимую ошибку в базе. Пришлось после попыток её реанимации откатываться на крайний доступный бэкап который оказался 2-ух дневной давности. Всё это время SQL база работала и ошибок не выдавала, только бэкап из неё не лился т.к. не проходила проверку целостности.
В результате сам себе создал проблему и потерял фрагмент информации из 1С SQL базы за 1.5 дня.
Насколько я понял, поднимать диск в ONLINE делать было нельзя, последующая проверка на консистентность разбила массив. Но вот как нужно было поступить я не пойму, я пробовал делать поиск потерянных дисков "Scan foreign configurations" но безрезультатно, диск определялся как unconfigured good.
По идее его нужно было заново инициализировать и назначить как Hot Spare для развалившегося зеркала.
Нечаянно вытащил диск из корзины сервера SuperMicro, который входил в RAID1 на котором лежали SQL и файловые базы 1С и множество другой информации, соответственно диск вставил обратно. Но перед его включением в массив бегло просмотрел интернет на описание подобных ситуаций, и вроде бы везде всё просто диск из состояния OFFLINE переводят в ONLINE и всё хорошо работает дальше. Я так и сделал и после ввода на всякий случай запустил процедуру проверки консистентности массива (она шла около 8 часов и закончилась успешно, но не для меня).
На следующий день одна из файловых баз выпала с критической ошибкой - починил с помощью chkdbf, вечером переносил рабочую SQL базу 1С на новое хранилище и получил неисправимую ошибку в базе. Пришлось после попыток её реанимации откатываться на крайний доступный бэкап который оказался 2-ух дневной давности. Всё это время SQL база работала и ошибок не выдавала, только бэкап из неё не лился т.к. не проходила проверку целостности.
В результате сам себе создал проблему и потерял фрагмент информации из 1С SQL базы за 1.5 дня.
Насколько я понял, поднимать диск в ONLINE делать было нельзя, последующая проверка на консистентность разбила массив. Но вот как нужно было поступить я не пойму, я пробовал делать поиск потерянных дисков "Scan foreign configurations" но безрезультатно, диск определялся как unconfigured good.
По идее его нужно было заново инициализировать и назначить как Hot Spare для развалившегося зеркала.
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: RAID1 3Тб на LSI 9260-4i
IgorianT
Переводить диск в режим ONLINE можно только, когда контроллер остановил работу с массивом.
Например, в RAID 5 последовательно выпадают два диска. При отказе второго диска работа прекращается и массив переводится в режим Offline. Т.е. никакие записи больше на массиве не делаются.
В этом случае второй диск (и только его) можно попробовать перевести в режим OnLine. Если массив заработает, то можно заменить первый диск и запустить на нем Rebuild.
В вашем случае тоже надо было запустить Rebuild на диске и проблем бы не было.
P.S. Но в общем случае если удалось поднять массив (даже в состоянии Degraded), то первым делом надо копировать с него информацию на другие носители и только потом восстанавливать полную работоспособность массива.
Переводить диск в режим ONLINE можно только, когда контроллер остановил работу с массивом.
Например, в RAID 5 последовательно выпадают два диска. При отказе второго диска работа прекращается и массив переводится в режим Offline. Т.е. никакие записи больше на массиве не делаются.
В этом случае второй диск (и только его) можно попробовать перевести в режим OnLine. Если массив заработает, то можно заменить первый диск и запустить на нем Rebuild.
В вашем случае тоже надо было запустить Rebuild на диске и проблем бы не было.
P.S. Но в общем случае если удалось поднять массив (даже в состоянии Degraded), то первым делом надо копировать с него информацию на другие носители и только потом восстанавливать полную работоспособность массива.
Re: RAID1 3Тб на LSI 9260-4i
Понял, постараюсь в следующий раз не наступить на такие грабли. Для контроллеров разных производителей Adaptec,LSI такие операции как Check Consistency, Online, Rebuild выполняются по одним алгоритмам?
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: RAID1 3Тб на LSI 9260-4i
IgorianT
Да.
Проверку целостности массива рекомендуется запускать регулярно.
Чтобы возможные логические ошибки контроллер нашел до поломки дисков.
Да.
Проверку целостности массива рекомендуется запускать регулярно.
Чтобы возможные логические ошибки контроллер нашел до поломки дисков.
Кто сейчас на конференции
Сейчас этот форум просматривают: Google [Bot] и 33 гостя