Invalid field in CDB на контроллерах LSI
Модераторы: Trinity admin`s, Free-lance moderator`s
Invalid field in CDB на контроллерах LSI
Здравствуйте.
Помогите разобраться с такой проблемой.
Имеется 2 идентичных физ. сервера Supermicro. Каждый из них укомплектован одинаковым набором оборудования:
Рэйд контроллер LSI 9280-4i4e
Корзина LSI SAS2x28
SAS HDD 3-х типов Seagate - ST3450857SS, ST2000NM0001, ST2000NM0023
на каждом сервере поднято 2 виртуальный диска с уровнем raid 10. На этих вирт. дисках крутится множество вирт. серверов на базе VMWare ESX.
С самых первых дней жизни на каждом сервере в логах рэйд контроллера LSI 9280-4i4e примерно каждые 5 минут сыпят такие предупреждения:
[img]<a%20target="_blank"%20href="http://www.radikal.ru"><img%20src="http://i004.radikal.ru/1409/29/ba46b9a1b52b.png"%20></a>[/img].
На эти предупреждения поначалу не обращали никакого внимания - все работало хорошо достаточно долгое время, т.к. нагрузка на сервера была не высокая.
По мере нагрузки стали появлятся "провалы" в работе хранилища на одном из серверов, т.е. ресурсы были недоступны. Периодичность выяснить не удалось - заметили, что "провалы" возникали при высоких файловых нагрузках и длились порядка 2-5 минут. По-началу грешили на винты - меняли на новые - результата 0. Насколько я помню, рэйд контроллер при этом кроме выше описанных предупреждений никаких ошибок не выдавал. И однажды, рэйд развалился!
Было решено приобрести другой контроллер - LSI 9271-4i. Все остальное оборудование осталось прежнее. Восстановили рейд (хранилище) уже на новом контроллере. Проблема не исчезла (ну может реже проявлялась) и предупреждения все-равно сыпались. И буквально в течение года работы нового котнроллера рэйд опять развалился. Восстановить рэйд на LSI 9271-4i не удалось. Вернули старый контроллер LSI 9280-4i4e - контроллер без проблем подтянул конфигурацию и все заработало! Почему так?
На данный момент перенесли все вирт.сервера на один хост (второй). И "провалы" наблюдаются уже на втором сервере.
В итоге решили пересобрать рэйд с нуля на LSI 9271-4i. А дальше будем думать.
Поэтому, хотелось бы узнать насколько критичны эти предупреждения и что они означают? Могут ли эти предпреждения как-то относится к нашей проблеме? И как решить нашу проблему с "провалами"?
Может проблема с корзиной? Винтами или еще с чем-нибудь?
Данные предупреждения существуют на обоих серверах и на обоих типах контроллеров LSi.
Помогите разобраться с такой проблемой.
Имеется 2 идентичных физ. сервера Supermicro. Каждый из них укомплектован одинаковым набором оборудования:
Рэйд контроллер LSI 9280-4i4e
Корзина LSI SAS2x28
SAS HDD 3-х типов Seagate - ST3450857SS, ST2000NM0001, ST2000NM0023
на каждом сервере поднято 2 виртуальный диска с уровнем raid 10. На этих вирт. дисках крутится множество вирт. серверов на базе VMWare ESX.
С самых первых дней жизни на каждом сервере в логах рэйд контроллера LSI 9280-4i4e примерно каждые 5 минут сыпят такие предупреждения:
[img]<a%20target="_blank"%20href="http://www.radikal.ru"><img%20src="http://i004.radikal.ru/1409/29/ba46b9a1b52b.png"%20></a>[/img].
На эти предупреждения поначалу не обращали никакого внимания - все работало хорошо достаточно долгое время, т.к. нагрузка на сервера была не высокая.
По мере нагрузки стали появлятся "провалы" в работе хранилища на одном из серверов, т.е. ресурсы были недоступны. Периодичность выяснить не удалось - заметили, что "провалы" возникали при высоких файловых нагрузках и длились порядка 2-5 минут. По-началу грешили на винты - меняли на новые - результата 0. Насколько я помню, рэйд контроллер при этом кроме выше описанных предупреждений никаких ошибок не выдавал. И однажды, рэйд развалился!
Было решено приобрести другой контроллер - LSI 9271-4i. Все остальное оборудование осталось прежнее. Восстановили рейд (хранилище) уже на новом контроллере. Проблема не исчезла (ну может реже проявлялась) и предупреждения все-равно сыпались. И буквально в течение года работы нового котнроллера рэйд опять развалился. Восстановить рэйд на LSI 9271-4i не удалось. Вернули старый контроллер LSI 9280-4i4e - контроллер без проблем подтянул конфигурацию и все заработало! Почему так?
На данный момент перенесли все вирт.сервера на один хост (второй). И "провалы" наблюдаются уже на втором сервере.
В итоге решили пересобрать рэйд с нуля на LSI 9271-4i. А дальше будем думать.
Поэтому, хотелось бы узнать насколько критичны эти предупреждения и что они означают? Могут ли эти предпреждения как-то относится к нашей проблеме? И как решить нашу проблему с "провалами"?
Может проблема с корзиной? Винтами или еще с чем-нибудь?
Данные предупреждения существуют на обоих серверах и на обоих типах контроллеров LSi.
-
- member
- Сообщения: 24
- Зарегистрирован: 12 фев 2010, 10:30
- Откуда: Щелково
- Контактная информация:
Re: Invalid field in CDB на контроллерах LSI
Consistency Check на VD запускали хоть раз?
-
- Power member
- Сообщения: 43
- Зарегистрирован: 10 дек 2013, 13:58
- Откуда: Пенза
- Контактная информация:
Re: Invalid field in CDB на контроллерах LSI
на домашней машине с 9260 были такие же ошибки, но массив не разваливался (максимальная нагрузка была когда качал торрентом 75мбит/с), для себя пришел к выводу что это а) из-за плохих контактов питания/data, причем скорее по питанию, т.к. передергивание и более плотная усадка разъема вроде б помогала б) убитый смарт на винтах.
винты у меня НЕ из HCL, произвольных развалов не было
http://forum.ixbt.com/topic.cgi?id=11:43801-74#2409
винты у меня НЕ из HCL, произвольных развалов не было
http://forum.ixbt.com/topic.cgi?id=11:43801-74#2409
Re: Invalid field in CDB на контроллерах LSI
У меня тоже винты из списка HCL. Но ошибки все-равно сыпят. Попробую разьемы все проверить и попередергивать, но думаю проблема в другом, так как на двух физ. серваках сыпят такие ошибки. Хотя, вероятность этого мала но существует. проверю.
Насчет смарта не уверен. его вообще можно отключить.
Насчет смарта не уверен. его вообще можно отключить.
-
- Power member
- Сообщения: 43
- Зарегистрирован: 10 дек 2013, 13:58
- Откуда: Пенза
- Контактная информация:
Re: Invalid field in CDB на контроллерах LSI
по поводу смарта - 1 винт у меня таки перестал работать с контроллером, выдавал ошибку на порту при присоединении, при этом контроллер на смарт винта не ругался....подключил его напрямую к компу - ~2500 бэдов...
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 31 гость