Adaptec 3805 + RAID5 - 1 диск

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
AndrewW
Junior member
Сообщения: 15
Зарегистрирован: 18 июн 2007, 19:10
Откуда: Москва
Контактная информация:

Adaptec 3805 + RAID5 - 1 диск

Сообщение AndrewW » 14 июн 2013, 00:01

Добрый день.

На этой неделе посыпался у нас массив 5-й на Adaptec 3805.
Один из 5-ти SATA дисков пропал из поля зрения контроллера, а когда появился, массив пошёл ребилдиться на него.
К сожалению HotSpare дисков в машине не оказалось.
Ребилд проходил до 50% и загибался снова.

К моменту, когда технический персонал обнаружил проблему, сервер работал. Однако, через пару часов (по какой-то непонятной мне причине) партиция этого массива отвалилась (OS - Ubuntu 12.04 LTS). Перезагрузка сервера привела к неожиданному результату. Ошибка mce модуля Some CPUs didn't answer in synchronization. Machine check: Processor context corrupt. Kernel panic - not syncing: Fatal machine check on current CPU.
Я уж стал грешить на кривую память, на проблему кэша cpu и ещё бог знает на что. Однако после добавления живого HDD и ребилда массива на него всё как бы заработало.

Отсюда вопросы к знатокам:
1. Я так понимаю это Adaptec отрубил рэйд дабы "ещё кто не загнулся". Нафига он это делает?! Как это отключить?
2. Чего это mce взбеленился, и как (если такое повторится) его грамотно успокоить?

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 27 гостей