Умер сервер1 (продолжение Умер сервер)

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Victor_smol
Junior member
Сообщения: 3
Зарегистрирован: 26 авг 2003, 12:37

Умер сервер1 (продолжение Умер сервер)

Сообщение Victor_smol » 26 авг 2003, 12:59

Land ушел в отпуск, поэтому подхватываю упавшее знамя и попробуем
поднять RAID.
Вы просили конфигурацию, так что повторюсь:

Контроллер- POWER EDGE Expandable RAID Controller SERIES 466 VER-b (Bios 1.36 AMI) PERC 2/SC. В контроллере настройки следующие: Flex RAID PowerFail=ENABLE, Rbld Rate=30%.
Диски были два IBM DNES-309170 (один из них вышел из строя в позиции A0-0, в 4 позиции справа налево, в этом слоте вышло из строя уже два винта (кстати соответствие ID-0 A0-3, ID-1 A0-1, ID-3 A0-2, ID-3 A0-0 это нормально ? ) и сейчас заменен на Seagate CHEETAH ST318409LC), два других- Seagate ST318409LC и ST39409LC соответственно. Диски стоят на тех же местах, что и во время аварии.
После замены винта и его форматирования- ситуация та же- все четыре диска - в FAIL, контроллер выдает несоответствие конфигурации состоянию, хранящуюся в NVRAM, при удалении нового винта ошибки конфигурации не возникает. При опросе информации о физических дисках ошибок нет ни на одном физическом диске.
Если переставить диски в оставшиеся 4 слота корзины- то диски в состоянии READY, а 4 слота в которых был RAID во время аварии - в FAIL. Говорят, что есть команда, которая заставит контроллер опросить текущее состояние и сохранить ее в NVRAM.

Вопросы: 1) как и в какой последовательности поднимать диски в ONLINE, чтобы восстановить по возможности больше информации. Сколько дисков 3 или 4 (один из них новый и отформатированный) поднимать в ONLINE и запускать REBUILD ? При 3 дисках несоответствия конфигурации с NVRAM нет.

2) Помимо RAID BIOS Setup ( по клавишам CTL-M), есть еще PERC Configuration Manager Ver 2.28 с
DELL Server Assistant CD, какой лучше воспользоваться ?

3) Нельзя ли как-нибудь сохранить образы физических дисков и конфигурацию RAID? У нас есть интегрированный контроллер Adaptec AIC-7890AB, который мы можем подключить к корзине с RAID, а на 50 pin SCSI можно подключить диск с FAT-16, есть еще PCI multicard для IDE винта. Систему можно запустить с загрузочного CD. Копировать винты можно с помощью Ghost только образами на большой винт, т.к. чтобы сделать физические копии у нас нет трех винтов. Кроме того остается вопрос, как сохранить информацию из CMOS контроллера, можно ли ее просто переписать на бумажку и потом ввести руками?
На нашем RAID ? Novell 5.1 и нетваревые тома.

4) еще раз- главный вопрос: Как нужно запускать REBUILD, чтобы сохранить как можно больше данных - после того как все три рабочих диска будут подняты в ONLINE или нужно их поднимать последовательно и каждый раз запускать REBUILD? Может быть лучше поставить 4 диска и все поднять в ONLINE?

5) действительно ли есть команда, которая заставит контроллер опросить текущее состояние и сохранить ее в NVRAM и как это сделать? Нужно ли это делать вообще, если контроллер не ругается на конфигурацию с тремя винтами?

Если можно, ответ отошлите по адресу 076500-0802@076.pfr.ru и дайте Ваш почтовый адрес для переписки , а то у нас Инет кончился, будет только в следующем месяце.


P.S. Вчера оставили в корзине три диска с данными и подняли их в ONLINE, контроллер выдал
сообщение что Logical drive degraded и handled by BIOS, после этого вставили новый диск, при этом контроллер обновил конфигурацию, мы хотели опустить новый винт в OFFLINE но контроллер не дает и оставили его в FAIL..Сейчас новый винт снова вытащили. Запускали с дискеты Diskedit,он видит RAID массив как физический диск и там имеется осмысленная информация типа autoexec.bat при просмотре в текстовом виде. Правда 0 сектор ? совершенно кривой. Есть ли смысл скопировать все это содержимое куда-нибудь и пробовать поднять информацию с помощью программ Tiramitsu и.т.п ?

Заранее благодарен. Романенков Виктор.

Аватара пользователя
Dmitry
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 861
Зарегистрирован: 22 авг 2002, 16:12
Откуда: St.Petersburg
Контактная информация:

Сообщение Dmitry » 26 авг 2003, 13:08

Просто кошмар. Лично я полностью запутался.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 26 авг 2003, 13:42

Я что-то тоже потонул в деталях.
Лучшим вариантом будет, если Вы к нам привезете машину и мы на месте попытаемся оживить.
Дистанционно запросто можно что-то не понять и дать опасный совет.

Victor_smol
Junior member
Сообщения: 3
Зарегистрирован: 26 авг 2003, 12:37

Сообщение Victor_smol » 26 авг 2003, 13:43

Главный вопрос: сколько дисков ребилдить- 3 или 4 или м.б. поднять новый винт в ONLINE и сделать REBUILD только для него?

Какова вообще последовательность действий?

Чем и как забэкапить три диска с данными и информацию из CMOS контроллера, чтобы можно было откатиться назад при неудачном REBUILD?

Есть ли какие-нибудь RECOVERY для RAID-5 c Novell томами?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 26 авг 2003, 13:57

ВО ПЕРВЫХ - НЕ ДЕЛАЙТЕ РЕБИЛД. Он только восстанавливает информацию на отвалившемся винте на основании parity и вполне может добить ее до смерти если что не так.
Поднимите в онлайн просто вручную без инициализаций и ребилдов.
Если видите осмысленную информацию - сливайте ее куда-нибудь. Можно воткнуть контроллер в любую другую машину и перелить данные.
А вот когда данные будет слиты, сносите все к едрене фене (clear config, low level format дисков) и создавайте все заново.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 26 авг 2003, 14:07

Похоже на то, что у Вас старый контроллер AMI (LSI) MegaRAID с переделанным биосом. Если исходить из аналогии, то в биосе амишек есть параметр Force Boot. Если его включить, то при старте системы он подцепит конфиг с дисков. Хотя Делл мог все переделать - не видя машины большего сказать не могу.
Вполне вероятно, что дохлый слот в корзине. Тогда поможет перестановка. Но все равно после таких передряг желательно все переинитить с нуля.

Victor_smol
Junior member
Сообщения: 3
Зарегистрирован: 26 авг 2003, 12:37

Сообщение Victor_smol » 26 авг 2003, 15:17

Нужно ли поднимать в ONLINE новый отформатированный винт (18Гб вместо убитого 9Гб)?

Не произойдет ли при этом чего-нибудь необратимого? М.б. отключить в контроллере AutoRebuild?

Нельзя ли заставить RAID работать на трех винтах, сейчас логического диска нет, т.к. RAID degraded?

С перестановкой на другую машину тоже проблемы, т.к. надо будет переставлять корзину и устанавливать Novell, чтобы увидеть тома NWare.

Что сделать, чтобы контроллер мог увидеть логический диск?

Имеет ли смысл переставить новый винт в другой слот, кстати он на последнем месте и наверное должен терминировать SCSI шлейф.

Спасибо за поддержку.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16622
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 26 авг 2003, 17:18

Чистый винт в онлайн поднимать нельзя. Только ребилдить. Но это не влияет на доступность данных - если рэйд degraded, это значит что он находится в критическом состоянии, но данные доступны. Так что их надо сливать пока не поздно, а потом ребилдиться. Я уже писал.

На современных дисках нет терминации и где он расположен на кабеле значения не имеет - терминация должна быть на корзине.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»