Invalid field in CDB на контроллерах LSI

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
sundoom
Junior member
Сообщения: 3
Зарегистрирован: 25 сен 2014, 09:58

Invalid field in CDB на контроллерах LSI

Сообщение sundoom » 25 сен 2014, 11:20

Здравствуйте.
Помогите разобраться с такой проблемой.
Имеется 2 идентичных физ. сервера Supermicro. Каждый из них укомплектован одинаковым набором оборудования:
Рэйд контроллер LSI 9280-4i4e
Корзина LSI SAS2x28
SAS HDD 3-х типов Seagate - ST3450857SS, ST2000NM0001, ST2000NM0023
на каждом сервере поднято 2 виртуальный диска с уровнем raid 10. На этих вирт. дисках крутится множество вирт. серверов на базе VMWare ESX.
С самых первых дней жизни на каждом сервере в логах рэйд контроллера LSI 9280-4i4e примерно каждые 5 минут сыпят такие предупреждения:
[img]<a%20target="_blank"%20href="http://www.radikal.ru"><img%20src="http://i004.radikal.ru/1409/29/ba46b9a1b52b.png"%20></a>[/img].
На эти предупреждения поначалу не обращали никакого внимания - все работало хорошо достаточно долгое время, т.к. нагрузка на сервера была не высокая.
По мере нагрузки стали появлятся "провалы" в работе хранилища на одном из серверов, т.е. ресурсы были недоступны. Периодичность выяснить не удалось - заметили, что "провалы" возникали при высоких файловых нагрузках и длились порядка 2-5 минут. По-началу грешили на винты - меняли на новые - результата 0. Насколько я помню, рэйд контроллер при этом кроме выше описанных предупреждений никаких ошибок не выдавал. И однажды, рэйд развалился!
Было решено приобрести другой контроллер - LSI 9271-4i. Все остальное оборудование осталось прежнее. Восстановили рейд (хранилище) уже на новом контроллере. Проблема не исчезла (ну может реже проявлялась) и предупреждения все-равно сыпались. И буквально в течение года работы нового котнроллера рэйд опять развалился. Восстановить рэйд на LSI 9271-4i не удалось. Вернули старый контроллер LSI 9280-4i4e - контроллер без проблем подтянул конфигурацию и все заработало! Почему так?
На данный момент перенесли все вирт.сервера на один хост (второй). И "провалы" наблюдаются уже на втором сервере.
В итоге решили пересобрать рэйд с нуля на LSI 9271-4i. А дальше будем думать.

Поэтому, хотелось бы узнать насколько критичны эти предупреждения и что они означают? Могут ли эти предпреждения как-то относится к нашей проблеме? И как решить нашу проблему с "провалами"?
Может проблема с корзиной? Винтами или еще с чем-нибудь?
Данные предупреждения существуют на обоих серверах и на обоих типах контроллеров LSi.

v1nt3g
member
Сообщения: 24
Зарегистрирован: 12 фев 2010, 10:30
Откуда: Щелково
Контактная информация:

Re: Invalid field in CDB на контроллерах LSI

Сообщение v1nt3g » 25 сен 2014, 17:45

Consistency Check на VD запускали хоть раз? :)

sundoom
Junior member
Сообщения: 3
Зарегистрирован: 25 сен 2014, 09:58

Re: Invalid field in CDB на контроллерах LSI

Сообщение sundoom » 26 сен 2014, 03:19

Стоит в планировщике еженедельно (выполняется ночью).

корявая ссылка на картину получилась в посте - вот рабочая картинка.
Изображение

dmitry.destroyer
Power member
Сообщения: 43
Зарегистрирован: 10 дек 2013, 13:58
Откуда: Пенза
Контактная информация:

Re: Invalid field in CDB на контроллерах LSI

Сообщение dmitry.destroyer » 29 сен 2014, 07:30

на домашней машине с 9260 были такие же ошибки, но массив не разваливался (максимальная нагрузка была когда качал торрентом 75мбит/с), для себя пришел к выводу что это а) из-за плохих контактов питания/data, причем скорее по питанию, т.к. передергивание и более плотная усадка разъема вроде б помогала б) убитый смарт на винтах.
винты у меня НЕ из HCL, произвольных развалов не было
http://forum.ixbt.com/topic.cgi?id=11:43801-74#2409

sundoom
Junior member
Сообщения: 3
Зарегистрирован: 25 сен 2014, 09:58

Re: Invalid field in CDB на контроллерах LSI

Сообщение sundoom » 29 сен 2014, 09:38

У меня тоже винты из списка HCL. Но ошибки все-равно сыпят. Попробую разьемы все проверить и попередергивать, но думаю проблема в другом, так как на двух физ. серваках сыпят такие ошибки. Хотя, вероятность этого мала но существует. проверю.
Насчет смарта не уверен. его вообще можно отключить.

dmitry.destroyer
Power member
Сообщения: 43
Зарегистрирован: 10 дек 2013, 13:58
Откуда: Пенза
Контактная информация:

Re: Invalid field in CDB на контроллерах LSI

Сообщение dmitry.destroyer » 29 сен 2014, 21:41

по поводу смарта - 1 винт у меня таки перестал работать с контроллером, выдавал ошибку на порту при присоединении, при этом контроллер на смарт винта не ругался....подключил его напрямую к компу - ~2500 бэдов...

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 31 гость