Windows 2008 Server - BSOD. LSI 3041X-R.

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
AnteC
Junior member
Сообщения: 3
Зарегистрирован: 21 мар 2016, 10:53

Windows 2008 Server - BSOD. LSI 3041X-R.

Сообщение AnteC » 21 мар 2016, 11:48

Здравствуйте!
Имеется DEPO сервер с контроллером LSI 3041X-R (на нем 2 Raid-1 массива, на одном из которых стоит ОС, на другом данные)
Недавно сервер начал самопроизвольно перезагружаться - причем дампы не сохраняются, в логах ничего нет только Предыдущее завершение работы системы в - было неожиданным.
Проверял температуру - заметил повышенную (70 С) одной планки памяти - которая находится прямо над северным мостом - заменил на всех радиаторах термопасту + поставил доп вентилятор на мост, проверил БП - все напряжения в норме, конденсаторы не вздутые, но перезагрузки продолжились.
Заметил что массив с ОС перешел в состояние Rebuild, поэтому проверил диски этого массива викторией 1й 1Tb WD RED (насколько я понимаю с TLER) на который идет rebuild - проверял 2 раза - ошибок нет, смарт чистый, 2й диск WD4001ABYS (который RE с TLER) с которого идет ребилд при просмотре смарт - показал 1 кандидата в bad (current pending sector - 1) и при проверке викторией 1 блок был успешно заремаплен, других видимых ошибок не было - только 5 блоков со временем 200ms). Удивительно, но после этого в смарте этот ребилд никак не отразился - reallocated sector count = 0, Reallocated Event Count = 0, current pending sector стал тоже 0), но 2й раз проверить диск не успел - сервер очень боевой, и постоянно нужен в работе. Попытался клонировать посекторно со 2го диска на 1й, и загрузиться только с 1го, но контроллер определил состояние массива как fail. Еще просматривая advanced options в bios контроллера увидел, что Report Device Missing Delay = 0 и IO Device Missing Delay = 0. Установил их в значение 10 сек. Вернул 1й и 2й диски на место, сейчас идет ребилд. Но с 19.03 по сегодня ребилд в прошел только на 36%.
Вопросы 1. Нормально ли то, что смарт WD RE после ремапа не показывает этих событий?
2. Столь долгий ребилд для Raid-1 это нормально?
3. Может быть есть какие-нибудь мысли в чем может быть проблема - может дохнет контроллер, может проблемы по питанию и т.п.?

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Windows 2008 Server - BSOD. LSI 3041X-R.

Сообщение Stranger03 » 22 мар 2016, 10:02

AnteC писал(а):Вернул 1й и 2й диски на место, сейчас идет ребилд. Но с 19.03 по сегодня ребилд в прошел только на 36%.
Вопросы 1. Нормально ли то, что смарт WD RE после ремапа не показывает этих событий?
Под нагрузкой ребилд может идти и неделю, две, три. Без нагрузки SATA диски в зеркале часов 5-20.
2. Столь долгий ребилд для Raid-1 это нормально?
под нагрузкой да
3. Может быть есть какие-нибудь мысли в чем может быть проблема - может дохнет контроллер, может проблемы по питанию и т.п.?
подождите окончания ребилда. Но раз у вас диски были с ремапами, то скорей всего их надо менять. Сколько они еще проживут - леший знает. От нескольких дней до нескольких месяцев. Но сдохнут в ближайшее время 100%.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

AnteC
Junior member
Сообщения: 3
Зарегистрирован: 21 мар 2016, 10:53

Re: Windows 2008 Server - BSOD. LSI 3041X-R.

Сообщение AnteC » 22 мар 2016, 12:12

Спасибо за ответ. Сегодня уже 53%.
в логе ночью появилось:
Controller ID: 0 Unrecoverable medium error during rebuild: PD 0 Location 0x158112b7
Controller ID: 0 Unrecoverable medium error during rebuild: PD -:-:1 Location 0x158112b7
Но контроллер не отключил сбойный диск (как я предполагаю из-за изменения опций указанных в 1м посте)
На счет скорости - ИМО вряд ли дело в нагрузке, да и на этом зеркале нет никакаой нагрузки - там практически только ОС + я пытался запустить ребилд из BIOS контроллера, но так и не дождался завершения 1% за 1 час. Возможно такая ситуация из-за наличия 2х зеркал на одном контроллере или из-за разных по объему дисков, но вообще непонятно почему так долго это происходит там же мат операций никаких делать ненужно (это же не raid-5).
Непонятно еще то, почему из массива выпал "нормальный" диск, а ребилдить контроллер начал со сбойного, из-за чего мне приходится ждать окончание ребилда и только после этого менять hdd.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: Windows 2008 Server - BSOD. LSI 3041X-R.

Сообщение Stranger03 » 22 мар 2016, 12:26

AnteC писал(а):в логе ночью появилось:
Controller ID: 0 Unrecoverable medium error during rebuild: PD 0 Location 0x158112b7
Controller ID: 0 Unrecoverable medium error during rebuild: PD -:-:1 Location 0x158112b7
Диски дохнут, надо срочно делать бекап и менять.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

AnteC
Junior member
Сообщения: 3
Зарегистрирован: 21 мар 2016, 10:53

Re: Windows 2008 Server - BSOD. LSI 3041X-R.

Сообщение AnteC » 22 мар 2016, 12:32

Конечно бэкап есть. На счет дисков склоняюсь к тому, что дохнет только один, с которого сейчас идет ремап.

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 34 гостя