Восcтановление raid5
Модераторы: Trinity admin`s, Free-lance moderator`s
Восcтановление raid5
Здравствуйте,
На линукс-сервере полетел один из трех дисков. (никогда еще не слышал чтобы диск пищал... western 80G)
При установке сервера на raid5 (software raid) не нашлось времени сделать тест сбоя и восстановления, а теперь нужно все сделать правильно...
За неимением опыта восстановления при чтении документации возникли некоторые вопросы которые требуют экспериментов, а эксперементировать, думаю, не время... хотя и есть резервная копия но там не все и систему переставлять....
Диски имеют несколько разделов объединенные как в raid, так и raid5.
Вылетел Primary Master, который я и заменил, сохранив предыдущий порядок.
Запустить систему не получается - пишет о том, что не может создать md0,1,2,3,4,5 так как отсутствует один из трех дисков и attempt to kill init. При запуске с компакта в rescue режиме Linux не находит разделов. Насколько я понимаю теперь мне нужно разбить новый диск на разделы по аналогии с двумя оставшимися и восстановить массивы, но где какой номер (md0,1 или 2) соответствовали каким разделам я уже не помню, только догадывась по результатам fdisk -l, так как доступа к /etc/ не имею.
Правильно ли поступать так
mdadd /dev/md0 /dev/disk1 ... /dev/disk(n)
mdrun -p5 /dev/md0
и безопасно ли запустить raid5 разделы в режиме raid0 (случайно) и raid1 в режиме raid0 или raid5 в режиме raid1. Мне нужно хотя бы конфиги прочесть для начала...
Нужны инструкции...
Документация у меня есть, если че...
Спасибо.
ЗЫ Лучше даже на ICQ, если есть возможность, так как вечером эксперимент уже будет проведен...
На линукс-сервере полетел один из трех дисков. (никогда еще не слышал чтобы диск пищал... western 80G)
При установке сервера на raid5 (software raid) не нашлось времени сделать тест сбоя и восстановления, а теперь нужно все сделать правильно...
За неимением опыта восстановления при чтении документации возникли некоторые вопросы которые требуют экспериментов, а эксперементировать, думаю, не время... хотя и есть резервная копия но там не все и систему переставлять....
Диски имеют несколько разделов объединенные как в raid, так и raid5.
Вылетел Primary Master, который я и заменил, сохранив предыдущий порядок.
Запустить систему не получается - пишет о том, что не может создать md0,1,2,3,4,5 так как отсутствует один из трех дисков и attempt to kill init. При запуске с компакта в rescue режиме Linux не находит разделов. Насколько я понимаю теперь мне нужно разбить новый диск на разделы по аналогии с двумя оставшимися и восстановить массивы, но где какой номер (md0,1 или 2) соответствовали каким разделам я уже не помню, только догадывась по результатам fdisk -l, так как доступа к /etc/ не имею.
Правильно ли поступать так
mdadd /dev/md0 /dev/disk1 ... /dev/disk(n)
mdrun -p5 /dev/md0
и безопасно ли запустить raid5 разделы в режиме raid0 (случайно) и raid1 в режиме raid0 или raid5 в режиме raid1. Мне нужно хотя бы конфиги прочесть для начала...
Нужны инструкции...
Документация у меня есть, если че...
Спасибо.
ЗЫ Лучше даже на ICQ, если есть возможность, так как вечером эксперимент уже будет проведен...
re
Отвечаю на свой пост:
Оказалось что вышли из строя два диска
raid5: not enough operational devices for md4 (2/3 failed)
raid5:failed to run raid set md4
md:pers->run() failed ...
exLH указал на (2/3 failed).
Оказалось что вышли из строя два диска
raid5: not enough operational devices for md4 (2/3 failed)
raid5:failed to run raid set md4
md:pers->run() failed ...
exLH указал на (2/3 failed).
re
Еще вопрос:
Есть такое
http://www.chiark.greenend.org.uk/~pete ... act/#tools
и такое
http://www.linux.com/howtos/Software-RA ... TO-4.shtml
Есть еще другие варианты???
Возможно ли восстановить (проверить на ошибки) данные двух оставшихся дисков и вобще мечтать о восстановлении raid5 в данном случае? Потому что наблюдаю только документацию и программы для экстренного копипрования данных и надписи типа "ни в коем случае не предпринимайте попытки восстановить degrated array"... если я правильно понимаю...
Надеюсь вы как специалисты мне подскажете что-то более современное...
Спасибо!
Есть такое
http://www.chiark.greenend.org.uk/~pete ... act/#tools
и такое
http://www.linux.com/howtos/Software-RA ... TO-4.shtml
Есть еще другие варианты???
Возможно ли восстановить (проверить на ошибки) данные двух оставшихся дисков и вобще мечтать о восстановлении raid5 в данном случае? Потому что наблюдаю только документацию и программы для экстренного копипрования данных и надписи типа "ни в коем случае не предпринимайте попытки восстановить degrated array"... если я правильно понимаю...
Надеюсь вы как специалисты мне подскажете что-то более современное...
Спасибо!
Re: re
Здравствуйте!
mdadm, с опцией --assemble или -А.
перед тем как что либо предпринимать, сделайте две вещи:
а) прочитайте современною версию документации Software-RAID.HowTo
б) загрузитесь с CD вроде кноппикса и посмотрите информацию из заголовков массивов, команда (вместо hda1 разумеется ваши диски)
далее надо будет разбить новый диск на партиции и восстановить массив с помощью mdadm -A <опции>. Как выглядит список опций для данной команды конкретно в вашем случае я сказать затрудняюсь из-за недостатка данных (и "железных" знаний по райд). Возможно потребуются еще какие-нибудь действия.
когда 'ничего не работает' восстановление софт raid (то есть воссоздание массива из имеющихся кусков ) на линуксе осуществляется утилитойh0b0s писал(а):Еще вопрос:
Есть такое
http://www.chiark.greenend.org.uk/~pete ... act/#tools
и такое
http://www.linux.com/howtos/Software-RA ... TO-4.shtml
Есть еще другие варианты???
Возможно ли восстановить (проверить на ошибки) данные двух оставшихся дисков и вообще мечтать о восстановлении raid5 в данном случае?
mdadm, с опцией --assemble или -А.
из вашего первого сообщения я понял что у вас 3 диска были разбиты на партиции и из этих партиций были скомплектованы несколько raid девайсов, на одном из которых (md4?) смонтирован рут (/ ) дисковой системы.h0b0s писал(а): Надеюсь вы как специалисты мне подскажете что-то более современное...
Спасибо!
перед тем как что либо предпринимать, сделайте две вещи:
а) прочитайте современною версию документации Software-RAID.HowTo
б) загрузитесь с CD вроде кноппикса и посмотрите информацию из заголовков массивов, команда
Код: Выделить всё
mdadm --verbose --examine /dev/ hda1
далее надо будет разбить новый диск на партиции и восстановить массив с помощью mdadm -A <опции>. Как выглядит список опций для данной команды конкретно в вашем случае я сказать затрудняюсь из-за недостатка данных (и "железных" знаний по райд). Возможно потребуются еще какие-нибудь действия.
Спасибо за ответ.
Спасибо за ответ! Уже думал сам с собой разговариваю...
Помощь немного запоздала, но эксперимент прошел удачно
Все (почти все) howto и faq-и которые возможно найти (и старые и новые) были заранее изучены. Не было опыта работы с raid, а в таких случаях не до экспериментов. Также, не понял почему не загрузилась система на двух дисках, но сейчас думаю что возможно не правильно разбил систему на разделы и не правильно создал массивы. У меня только /boot raid1 - остальное, включая корневой раздел - raid5, кроме swap (raid0), а нужно было для гарантии перевести системные разделы на raid1, чтобы было проще потом... Уверен что на raid1 система бы загрузилась.
Вот разделы
Disk /dev/hdc: 80.0 GB, 80026361856 bytes
255 heads, 63 sectors/track, 9729 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Device Boot Start End Blocks Id System
/dev/hdc1 * 1 38 305203+ fd Linux raid autodetect
/dev/hdc2 39 8962 71682030 fd Linux raid autodetect
/dev/hdc3 8963 9408 3582495 fd Linux raid autodetect
/dev/hdc4 9409 9729 2578432+ 5 Extended
/dev/hdc5 9409 9599 1534176 fd Linux raid autodetect
/dev/hdc6 9600 9682 666666 fd Linux raid autodetect
/dev/hdc7 9683 9729 377496 fd Linux raid autodetect
Я подключил два оставшихся диска к "старой" системе, которая сохранилась после замены и проверив диски собрал массивы. Диск hdc иногда сбоил странно при выводе контента супер-блока. Он его просто показывал после простмотра супер-блока hdd.
[[host]~]# mdadm -E /dev/hdc2
/dev/hdc2:
Magic : a92b4efc
Version : 00.90.00
UUID : 1e30d31f:5311ebd8:36935ef8:58557fed
Creation Time : Fri Mar 25 22:03:45 2005
Raid Level : raid5
Device Size : 71681792 (68.36 GiB 73.40 GB)
Raid Devices : 3
Total Devices : 2
Preferred Minor : 12
Update Time : Mon May 23 00:26:06 2005
State : clean, no-errors
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Checksum : 3292024e - correct
Events : 0.914146
Layout : left-symmetric
Chunk Size : 256K
Number Major Minor RaidDevice State
this 1 22 2 1 active sync /dev/hdc2
0 0 0 0 0 removed
1 1 22 2 1 active sync /dev/hdc2
2 2 22 66 2 active sync /dev/hdd2
[[host]~]#
[[host]~]# mdadm --assemble --force /dev/md1N /dev/hdcN /dev/hddN (где N-номер раздела)
[[host]~]# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid5]
md17 : inactive hdc7[1] hdd7[2]
754688 blocks
md16 : active raid5 hdc6[1] hdd6[2]
1332736 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md15 : active raid5 hdc5[1] hdd5[2]
3067904 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md13 : active raid5 hdc3[1] hdd3[2]
7164416 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md12 : active raid5 hdc2[1] hdd2[2]
143363584 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md11 : active raid1 hdc1[1] hdd1[2]
305088 blocks [3/2] [_UU]
md4 : active raid0 hda7[1] hdb7[0]
1138944 blocks 256k chunks
md2 : active raid0 hda3[1] hdb3[0]
7778816 blocks 256k chunks
md3 : active raid0 hda2[1] hdb2[0]
67584512 blocks 256k chunks
md1 : active raid1 hda1[1] hdb1[0]
112128 blocks [2/2] [UU]
md5 : active raid0 hda5[1] hdb5[0]
818944 blocks 256k chunks
md0 : active raid1 hda6[1]
304896 blocks [2/1] [_U]
unused devices: <none>
mount /dev/md1N
Кстати, видно что раздел /boot (md0) предыдущей ситемы работает на разрушенном массиве. Восстановлю если не удастся перестроить raid-5
[[host]~]# mount /dev/md1N /mnt/md1N
И все данные слил на сервак, оставив только хлам (иногда от него нужно избавляться ).
Сервер восстановлен за "выходные". Завтра, загрузив linux c CD в rescue режиме, сделаю реконструкцию деградированных массивов и будет видно все ли нормально с hdc.
Помощь немного запоздала, но эксперимент прошел удачно
Все (почти все) howto и faq-и которые возможно найти (и старые и новые) были заранее изучены. Не было опыта работы с raid, а в таких случаях не до экспериментов. Также, не понял почему не загрузилась система на двух дисках, но сейчас думаю что возможно не правильно разбил систему на разделы и не правильно создал массивы. У меня только /boot raid1 - остальное, включая корневой раздел - raid5, кроме swap (raid0), а нужно было для гарантии перевести системные разделы на raid1, чтобы было проще потом... Уверен что на raid1 система бы загрузилась.
Вот разделы
Disk /dev/hdc: 80.0 GB, 80026361856 bytes
255 heads, 63 sectors/track, 9729 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Device Boot Start End Blocks Id System
/dev/hdc1 * 1 38 305203+ fd Linux raid autodetect
/dev/hdc2 39 8962 71682030 fd Linux raid autodetect
/dev/hdc3 8963 9408 3582495 fd Linux raid autodetect
/dev/hdc4 9409 9729 2578432+ 5 Extended
/dev/hdc5 9409 9599 1534176 fd Linux raid autodetect
/dev/hdc6 9600 9682 666666 fd Linux raid autodetect
/dev/hdc7 9683 9729 377496 fd Linux raid autodetect
Я подключил два оставшихся диска к "старой" системе, которая сохранилась после замены и проверив диски собрал массивы. Диск hdc иногда сбоил странно при выводе контента супер-блока. Он его просто показывал после простмотра супер-блока hdd.
[[host]~]# mdadm -E /dev/hdc2
/dev/hdc2:
Magic : a92b4efc
Version : 00.90.00
UUID : 1e30d31f:5311ebd8:36935ef8:58557fed
Creation Time : Fri Mar 25 22:03:45 2005
Raid Level : raid5
Device Size : 71681792 (68.36 GiB 73.40 GB)
Raid Devices : 3
Total Devices : 2
Preferred Minor : 12
Update Time : Mon May 23 00:26:06 2005
State : clean, no-errors
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Checksum : 3292024e - correct
Events : 0.914146
Layout : left-symmetric
Chunk Size : 256K
Number Major Minor RaidDevice State
this 1 22 2 1 active sync /dev/hdc2
0 0 0 0 0 removed
1 1 22 2 1 active sync /dev/hdc2
2 2 22 66 2 active sync /dev/hdd2
[[host]~]#
[[host]~]# mdadm --assemble --force /dev/md1N /dev/hdcN /dev/hddN (где N-номер раздела)
[[host]~]# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid5]
md17 : inactive hdc7[1] hdd7[2]
754688 blocks
md16 : active raid5 hdc6[1] hdd6[2]
1332736 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md15 : active raid5 hdc5[1] hdd5[2]
3067904 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md13 : active raid5 hdc3[1] hdd3[2]
7164416 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md12 : active raid5 hdc2[1] hdd2[2]
143363584 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
md11 : active raid1 hdc1[1] hdd1[2]
305088 blocks [3/2] [_UU]
md4 : active raid0 hda7[1] hdb7[0]
1138944 blocks 256k chunks
md2 : active raid0 hda3[1] hdb3[0]
7778816 blocks 256k chunks
md3 : active raid0 hda2[1] hdb2[0]
67584512 blocks 256k chunks
md1 : active raid1 hda1[1] hdb1[0]
112128 blocks [2/2] [UU]
md5 : active raid0 hda5[1] hdb5[0]
818944 blocks 256k chunks
md0 : active raid1 hda6[1]
304896 blocks [2/1] [_U]
unused devices: <none>
mount /dev/md1N
Кстати, видно что раздел /boot (md0) предыдущей ситемы работает на разрушенном массиве. Восстановлю если не удастся перестроить raid-5
[[host]~]# mount /dev/md1N /mnt/md1N
И все данные слил на сервак, оставив только хлам (иногда от него нужно избавляться ).
Сервер восстановлен за "выходные". Завтра, загрузив linux c CD в rescue режиме, сделаю реконструкцию деградированных массивов и будет видно все ли нормально с hdc.
Тому, кто пришел сюда с такими же вопросами - http://www.rot13.org/~dpavlin/md-raid5.html
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 65 гостей