На одном из серверов данная операция проходит как и ожидается, без каких либо проблем. На втором сервере контроллер после принудительного перевода одного из дисков в состояние failed просто уходит сам в себя. На консоли появляются записи вида:
Код: Выделить всё
aac0: COMMAND 0xffffff80002374e0 TIMEOUT AFTER 75 SECONDS.
После перезагрузки картина примерно однинаковая, тот диск которому говорилось стать failed остаётся в массиве и на него начинается rebuilding. Диск стоявший в hot spare становится failed. Обычно так.
Грешил на всё, поменял прошивки контроллеров, обновил операционку. Всё осталось как и было. При последней такой "плановой" перезагрузке зашёл в биос контроллера. Там состояние дисков как и в предыдущие разы (hot spare стал failed, кому говорили fail стал rebuilding). Сказал контроллеру пересканировать подключённые диски, после этого всё стало как и должно было стать. Диск кому сказали fail стал failed, а hot spare стал rebuilding.
Вопрос: контроллер менять надо или что-то можно/нужно в нём покрутить? Я не переживу, если машина встанет колом при реальном отказе одного из дисков.