Восcтановление raid5

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
h0b0s
Junior member
Сообщения: 5
Зарегистрирован: 21 май 2005, 17:42
Контактная информация:

Восcтановление raid5

Сообщение h0b0s » 21 май 2005, 18:31

Здравствуйте,

На линукс-сервере полетел один из трех дисков. (никогда еще не слышал чтобы диск пищал... western 80G)
При установке сервера на raid5 (software raid) не нашлось времени сделать тест сбоя и восстановления, а теперь нужно все сделать правильно...
За неимением опыта восстановления при чтении документации возникли некоторые вопросы которые требуют экспериментов, а эксперементировать, думаю, не время... хотя и есть резервная копия но там не все и систему переставлять....
Диски имеют несколько разделов объединенные как в raid, так и raid5.
Вылетел Primary Master, который я и заменил, сохранив предыдущий порядок.
Запустить систему не получается - пишет о том, что не может создать md0,1,2,3,4,5 так как отсутствует один из трех дисков и attempt to kill init. При запуске с компакта в rescue режиме Linux не находит разделов. Насколько я понимаю теперь мне нужно разбить новый диск на разделы по аналогии с двумя оставшимися и восстановить  массивы, но где какой номер (md0,1 или 2) соответствовали каким разделам я уже не помню, только догадывась по результатам fdisk -l, так как доступа к /etc/ не имею.
Правильно ли поступать так
mdadd /dev/md0 /dev/disk1 ... /dev/disk(n)
mdrun -p5 /dev/md0
и безопасно ли  запустить raid5 разделы в режиме raid0 (случайно) и raid1 в режиме raid0 или raid5 в режиме raid1. Мне нужно хотя бы конфиги прочесть для начала...
Нужны инструкции... :?
Документация у меня есть, если че...

Спасибо.

ЗЫ Лучше даже на ICQ, если есть возможность, так как вечером эксперимент уже будет проведен...

h0b0s
Junior member
Сообщения: 5
Зарегистрирован: 21 май 2005, 17:42
Контактная информация:

re

Сообщение h0b0s » 21 май 2005, 22:28

Отвечаю на свой пост:
Оказалось что вышли из строя два диска

raid5: not enough operational devices for md4 (2/3 failed)
raid5:failed to run raid set md4
md:pers->run() failed ...

exLH указал на (2/3 failed).

h0b0s
Junior member
Сообщения: 5
Зарегистрирован: 21 май 2005, 17:42
Контактная информация:

re

Сообщение h0b0s » 21 май 2005, 23:33

Еще вопрос:

Есть такое
http://www.chiark.greenend.org.uk/~pete ... act/#tools
и такое
http://www.linux.com/howtos/Software-RA ... TO-4.shtml

Есть еще другие варианты???
Возможно ли восстановить (проверить на ошибки) данные двух оставшихся дисков и вобще мечтать о восстановлении raid5 в данном случае? Потому что  наблюдаю только документацию и программы для экстренного копипрования данных и надписи типа "ни в коем случае не предпринимайте попытки восстановить degrated array"... если я правильно понимаю...

Надеюсь вы как специалисты мне подскажете что-то более современное...

Спасибо!

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Re: re

Сообщение apelsin » 22 май 2005, 13:39

Здравствуйте!
h0b0s писал(а):Еще вопрос:

Есть такое
http://www.chiark.greenend.org.uk/~pete ... act/#tools
и такое
http://www.linux.com/howtos/Software-RA ... TO-4.shtml

Есть еще другие варианты???
Возможно ли восстановить (проверить на ошибки) данные двух оставшихся дисков и вообще мечтать о восстановлении raid5 в данном случае?
когда 'ничего не работает' восстановление софт raid  (то есть воссоздание массива из имеющихся кусков ) на линуксе осуществляется утилитой
mdadm
, с опцией --assemble или -А.
h0b0s писал(а): Надеюсь вы как специалисты мне подскажете что-то более современное...

Спасибо!
из вашего первого сообщения я понял что у вас 3 диска были разбиты на партиции и из этих партиций были скомплектованы несколько raid девайсов, на одном из которых (md4?) смонтирован рут (/ ) дисковой системы.

перед тем как что либо предпринимать, сделайте две вещи:
а) прочитайте современною версию документации Software-RAID.HowTo

б)  загрузитесь с CD вроде кноппикса и посмотрите информацию из заголовков массивов, команда

Код: Выделить всё

 mdadm --verbose --examine /dev/ hda1
 (вместо hda1 разумеется ваши диски)

далее надо будет разбить новый диск на партиции и восстановить массив  с помощью mdadm -A <опции>. Как выглядит список опций для данной команды конкретно в вашем случае я сказать затрудняюсь из-за недостатка данных (и "железных" знаний по райд). Возможно потребуются еще какие-нибудь действия.

h0b0s
Junior member
Сообщения: 5
Зарегистрирован: 21 май 2005, 17:42
Контактная информация:

Спасибо за ответ.

Сообщение h0b0s » 23 май 2005, 02:20

Спасибо за ответ! Уже думал сам с собой разговариваю...
Помощь немного запоздала, но эксперимент прошел удачно 8)
Все (почти все) howto и faq-и которые возможно найти (и старые и новые) были заранее изучены. Не было опыта работы с raid, а в таких случаях не до экспериментов. Также, не понял почему не загрузилась система на двух дисках, но сейчас думаю что возможно не правильно разбил систему на разделы и не правильно создал массивы. У меня только /boot raid1 - остальное, включая корневой раздел - raid5, кроме swap (raid0), а нужно было для гарантии перевести системные разделы на raid1, чтобы было проще потом... Уверен что на raid1 система бы загрузилась.
Вот разделы
Disk /dev/hdc: 80.0 GB, 80026361856 bytes
255 heads, 63 sectors/track, 9729 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

  Device Boot      Start         End      Blocks   Id  System
/dev/hdc1   *           1          38      305203+  fd  Linux raid autodetect
/dev/hdc2              39        8962    71682030   fd  Linux raid autodetect
/dev/hdc3            8963        9408     3582495   fd  Linux raid autodetect
/dev/hdc4            9409        9729     2578432+   5  Extended
/dev/hdc5            9409        9599     1534176   fd  Linux raid autodetect
/dev/hdc6            9600        9682      666666   fd  Linux raid autodetect
/dev/hdc7            9683        9729      377496   fd  Linux raid autodetect

Я подключил два оставшихся диска к "старой" системе, которая сохранилась после замены и проверив диски собрал массивы. Диск hdc иногда сбоил странно при выводе контента супер-блока. Он его просто показывал после простмотра супер-блока hdd.

[[host]~]# mdadm -E /dev/hdc2
/dev/hdc2:
         Magic : a92b4efc
       Version : 00.90.00
          UUID : 1e30d31f:5311ebd8:36935ef8:58557fed
 Creation Time : Fri Mar 25 22:03:45 2005
    Raid Level : raid5
   Device Size : 71681792 (68.36 GiB 73.40 GB)
  Raid Devices : 3
 Total Devices : 2
Preferred Minor : 12

   Update Time : Mon May 23 00:26:06 2005
         State : clean, no-errors
Active Devices : 2
Working Devices : 2
Failed Devices : 0
 Spare Devices : 0
      Checksum : 3292024e - correct
        Events : 0.914146

        Layout : left-symmetric
    Chunk Size : 256K

     Number   Major   Minor   RaidDevice State
this     1      22        2        1      active sync   /dev/hdc2
  0     0       0        0        0      removed
  1     1      22        2        1      active sync   /dev/hdc2
  2     2      22       66        2      active sync   /dev/hdd2
[[host]~]#

[[host]~]# mdadm --assemble --force /dev/md1N /dev/hdcN /dev/hddN (где N-номер раздела)

[[host]~]# cat /proc/mdstat
Personalities : [raid0] [raid1] [raid5]
md17 : inactive hdc7[1] hdd7[2]
     754688 blocks
md16 : active raid5 hdc6[1] hdd6[2]
     1332736 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
     
md15 : active raid5 hdc5[1] hdd5[2]
     3067904 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
     
md13 : active raid5 hdc3[1] hdd3[2]
     7164416 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
     
md12 : active raid5 hdc2[1] hdd2[2]
     143363584 blocks level 5, 256k chunk, algorithm 2 [3/2] [_UU]
     
md11 : active raid1 hdc1[1] hdd1[2]
     305088 blocks [3/2] [_UU]
     
md4 : active raid0 hda7[1] hdb7[0]
     1138944 blocks 256k chunks
     
md2 : active raid0 hda3[1] hdb3[0]
     7778816 blocks 256k chunks
     
md3 : active raid0 hda2[1] hdb2[0]
     67584512 blocks 256k chunks
     
md1 : active raid1 hda1[1] hdb1[0]
     112128 blocks [2/2] [UU]
     
md5 : active raid0 hda5[1] hdb5[0]
     818944 blocks 256k chunks
     
md0 : active raid1 hda6[1]
     304896 blocks [2/1] [_U]
     
unused devices: <none>

mount /dev/md1N

Кстати, видно что раздел /boot (md0) предыдущей ситемы работает на разрушенном массиве. Восстановлю если не удастся перестроить raid-5 ;)

[[host]~]# mount /dev/md1N /mnt/md1N

И все данные слил на сервак, оставив только хлам (иногда от него нужно избавляться :P).
Сервер восстановлен за "выходные". Завтра, загрузив linux c CD в rescue режиме, сделаю реконструкцию деградированных массивов и будет видно все ли нормально с hdc.

h0b0s
Junior member
Сообщения: 5
Зарегистрирован: 21 май 2005, 17:42
Контактная информация:

Сообщение h0b0s » 23 май 2005, 17:12

Тому, кто пришел сюда с такими же вопросами - http://www.rot13.org/~dpavlin/md-raid5.html :wink:

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 36 гостей