баллада о балде и backplane

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
vuser
Junior member
Сообщения: 7
Зарегистрирован: 01 мар 2005, 10:56

баллада о балде и backplane

Сообщение vuser » 16 сен 2006, 13:27

Часть 1.
                                                 Типа халява.

Жил был сервер с интегрированным LSI Logic MegaRaid 320-2E  RAM 128MB vs BBU
(Firmware и версия BIOS ctrl не имеет значения)
А сервер был не простой: имел две корзины для HDD и backplaine на первой корзине
с возможностью, как двухканального, так и одноканального подключения двух корзин.
(корзина на три диска)
Наш сказ начнётся с одноканальной возможности.
Заказали значить чуваки этот сервер с тремя HDD (два диска Seagate и один Hitachi, на складе не было трёх дисков
одного вендора и мальчик с пальчик не долго думая решил исправить ситуацию)
и решили соорудить из них RAID 5 (без комментариев).
Мучились они долго (как говорят) и победили Кащеюшку.
(с вопросами о возникших сложностях почему-то не обратились, бывает ....наверно не хотели оказаться лохами)
И  воздвигли они памятник из Windows Server и DB  (версия не имеет значения).
Проработал этот памятник около месяца и после перезагрузки сервера рассыпался.
(говорят как увидили, что Windows не загружается, зашли в BIOS RAID ctrl  и обнаружили, что два диска в faild)
(кто же делает Backup ? он же памятник).
Помогите! нас спасите! базу данных оживите!
Притащили к нам в СЦ этот памятник.
Посмотрел я на него и увидел два faild'a, ну чтож поднимим их в online... без затычки без задоринки.
Вот везуха, подумал я, щас поднимим чувакам и DB, и ОS!
Перезагрузка сервера......моргает курсор и OS не грузится.
Пришло время посмотреть, что осталось....
Грузимся с Acronis Disk Director и видим, что партиция диск С: даже с FS NTFS и показывает свободное, и занятое пространство, но не отображает содержимое диска, остальные же три партиции имеют правильную разметку и имеют наименование дисков (D,E,F), но не имеют FS NTFS.
Вот момент истины для Easy Recovery, GetDataBack.... R-Studio Data Recovery Software
Но ...ломали -ломали, строили -строили и ничего не построили.
(нет доступа к разделам)
Такая  песня без ковша.
И вынес я им приговор: "сломалось!
Если есть желание восстанавливайте данные сами, а диск Hitachi  мы Вам поменяем на Seagate."
На том и порешили.
Вынесли памятник вперёд ногами.

                                                             Часть 2.
                                                           Что за х....?
                                                         
                                                     
И вот опять я их вижу через два дня...несут Его, "вот злыдни, подумал".
Включаем сервер: "Unresolved configuration mismatch between disk(s) and NVRAM on the adapter"
Будем смотреть говорю.
Смотрел я на него него и с этой, и с той стороны.
В сервисном мануале написано, что при такой ошибке обращайтесь в СЦ.
Заменил RAM vs BBU, не помогло.
Отключил  RAID и перешёл на Scsi режим.
На втором канале установил Windows OS, серверное п\о для мониторинга сервера и SeaTools Enterprise.
Отчёт говорил, что первый HDD  в первой корзине в утиль .
Перепрошил  на старую FW и на новую...
Во всех руководствах от LSI при такой ошибке  написано...нажми на CTRL+H и
в BIOS RAID ctrl увидишь откуда загружать конфигурацию, нет такого.
Отключил питание BBU от RAM появился такой выбор.
Ну думаю вот они скрытые возможности.
Но не тут -то было, загружай хоть с дисков, хоть с NVRAM конфигурацию ошибка та же.
Установил все три диска (с завода) Hitachi (какие есть).
Загрузился в BIOS RAID ctrl, создал новую кофигурацию...инициализация foreground
Перезагрузка сервера... "Unresolved configuration mismatch between disk(s) and NVRAM on the adapter"
Загрузка сервера с отключенной BBU и соответственно загрука конфигурации в BIOS RAID ctrl с диска
Перезагрузка сервера... бла...бла...бла...обновление конфигурации метаданных...перезагруз
И вот оно счастье....всё работает.
Проверял восстановление конфигурации и с дисков и с NVRAM, всё работает, но если отключать BBU.
Неужели диски?
Массив то создаётся, но вот OS не устанавливается.
Ну ёлы-палы.......
По совету Игоря ака gоsha (тринити): "проверь кабельную систему"
Идём дальше....



                                                                           Часть 3.
                                                                       Бойся роботов!

Отключил SCSI шнурки (фирменные, добротные -round) -посмотрел -ок.
И решил переподключить корзины на двухканальность.
И вот оно чудо! Ошибка ушла -конфигурация заливается без вопросов.
Ну думаю терминатор не той системы.
Уставливаю долгожданный Windows Server OS  и что же в итоге получается....
Два диска работают, первый в faild ушёл, система на RAID 5 на двух дисках работает (на форуме где-то я такое встречал, ему не верили)
система перегружается, программы устанавливаются и т.д.
Короче я в шоке....
Думаю сделаю я этому диску ребилд, ребилд пошёл ....
Утром, на свежачка посмотрел, гад ребилд закончил успешно!!!
Перезагрузка....и вот оно, система не грузится!
Переподключил SCSI шлейф со второй корзины на первый канал, создал массив, установил систему и т.д.
Вот тебе и backplane, несколько десятков контактов на пассивной плате......
Про riser card c замыкающими контактами, от которой прекращалась графическая загрузка OS в полноцветном режиме я расскажу в следующий раз.

Где же законы робототехники?
Не бывает исправных роботов!!!
Люди -бойтесь роботов!

Благодарность всем работникам Тринити!
Спасибо!

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 18 сен 2006, 11:27

Жестко вышло  :D  Но, к сожалению, бывает - сам недавно людям бэкплейн менял, на микровском корпусе. Правда, у меня все с собой было (контроллер, шлейфы, бэкплейн) и виновный всплыл довольно-таки быстро :gigi:

Leo_T
Junior member
Сообщения: 9
Зарегистрирован: 02 мар 2006, 20:06
Откуда: Санкт-Петербург
Контактная информация:

Re: баллада о балде и backplane

Сообщение Leo_T » 20 сен 2006, 20:47

Довольно популярный, кстати, сценарий убиения инфы при попытке оживить массив - поднять все отвалившиеся диски в онлайн и запустить консистенси чек. Ну или контроллер сам его запустит, ни слова не говоря...

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 29 гостей