Проблемы с Xyratex 6412E

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Проблемы с Xyratex 6412E

Сообщение Zirro » 24 май 2012, 10:36

Доброго времени суток.
Имеется следующая конфигурация: сервер VMware ESX 4.1U2. На нём создана виртуальная машина с ОС Windows 2003 R2, выполняющая роль файлового сервера. К хосту VMware подключена СХД Xyratex 6412E. На СХД создано несколько томов, которые "примаплены" к виртуальному файловому серверу в качестве RAW-disk. В свою очередь на "примапленных" дисках файлового сервера созданы "шары", которые подключены у конечных пользователей в качестве сетевых дисков.
Проблема заключается в следующем: некоторое время назад СХД стала "семафорить" что неисправен один из двух контроллеров. Контроллер был извлечён и отправлен на гарантийный ремонт. СХД я перевёл в одноконтроллерный режим работы. Далее не могу поручиться на 100%, но примерно в это время пользователи стали жаловаться, что у них на некоторое время пропадают сетевые диски (обычно это 30-50 секунд иногда более 3 минут). Знающие люди посоветовали мне "задизаблить" опцию "Overload Management". Однако, это не помогло. Довольно быстро вернулся из СЦ заменённый контроллер и я думал, что после его установки и возврата всех настроек к исходному состоянию проблема исчезнет. Но проблема осталась и актуальна по сей день.
Что было выяснено за это время:
1. Во время "исчезновения" сетевых дисков сервер отвечает на сетевые запросы (ping'и);
2. На самом сервере диски, на которых расположены "шары", тоже отваливаются примерно в это же время;
3. В журнале сервера нет никаких ошибок.
Я всё больше склоняюсь к мысли, что источник проблемы в СХД вот только как это отловить и какие настройки покрутить на СХД?
P.S. Возможно это и не проблема собственно СХД, а проблемы ОС (пусть тогда модератор перенесёт тему в соответсвующий раздел), но подозрительно совпадают время "поломки" контроллера и время возникновения проблемы, хотя, повторюсь, это лишь моё субъективное ощущение.
P.P.S. Может имеет значение тот факт что, как оказалось позже, отправленный мной контроллер был исправен.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Tert » 24 май 2012, 15:56

Zirro
Как в VmWare настроен Multipath?
Доступ к устройствам работает в режиме MRU, Fixed или RoundRobin?

По характеру проблемы похоже, что у вас стоит Fixed.

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 24 май 2012, 16:01

Tert писал(а):Zirro
Как в VmWare настроен Multipath?
Multipath для всех дисков настроен как RoundRobin.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Tert » 24 май 2012, 16:47

Zirro
Включите MRU.

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 24 май 2012, 17:17

А можно поподробней. Что такое MRU и как его включить?
Возможно Вы имели в виду Most Recently Used?

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Tert » 25 май 2012, 09:45

Zirro
Да.

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 30 май 2012, 13:30

Некоторое время после выбора политики MRU проблема не проявлялась. Однако сегодня снова было пара случаев описанной проблемы.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Tert » 30 май 2012, 15:58

Zirro
Кстати, прошивки на Xyratex у вас последние?

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 31 май 2012, 08:26

Насчёт того последняя ли она я не в курсе. СХД с момента поставки эксплутируется с той firmware, которая уже была установлена.
На данный момент, если я смотрю то, что Вас интересует, версия прошивки на обоих контроллерах: 3.9 Build 0011

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 02 авг 2012, 16:04

Подниму тему. После недолгого затишья проблема снова дала о себе знать. Что ещё кроме политик multipath в настройках VMware может помочь решить проблему?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение exLH » 03 авг 2012, 00:19

Zirro писал(а):Что ещё кроме политик multipath в настройках VMware может помочь решить проблему?
Для начала довести версию микрокода до версии 3.9.21 (релиз 2.5.10)
После этого попытаться воспроизвести без VMware - будут ли проблемы?
Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 03 авг 2012, 09:55

exLH писал(а):Для начала довести версию микрокода до версии 3.9.21 (релиз 2.5.10)
Я уже давно подумываю над этим, но у меня есть вопросы по прошивке.
Если я правильно понимаю, у меня сейчас релиз 2.5.6 (RAID Firmware Version: 3. 9 Build 0011; RAID Firmware Boot PROM Version: 0073). В следующем релизе (релиз 2.5.10) есть только обновление контроллера. То есть, если руководствоваться этой статьёй http://blog.trinitygroup.ru/2010/01/xyr ... mment-form, мне достаточно только обновить контроллер по сети и не заморачиваться консольным подключением для прошивки boot PROM, жёстких дисков и т.п.?
После этого попытаться воспроизвести без VMware - будут ли проблемы?
Воспроизвести проблему без VMware довольно затруднительно, но, если других вариантов не останется, то попробую этот.

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 12 ноя 2012, 11:05

Добрый день.
Продолжу в этой же теме, так как снова у меня проблемы с Xyratex, теперь гораздо серьёзней.
На текущий момент все прошивки на СХД самые свежие.
Теперь коротко о том как используется СХД: на ней создано несколько LUN'ов и все они презентованы 2 хостам VMware ESX 4.1u3. Часть LUN'ов примаплена как raw-диски к одной из виртуальных машин (назовём её Server1), а один из LUN'ов (пусть будет LUN5) был расшарен между обоими хостами для хранения виртуальных машин.
Проблема произошла ночью 10.11.12.
Не знаю что произошло на Server1, но он наглухо повис, более того он подвесил весь хост VMware и соответственно все ВМ расположенные на этом хосте. Пришлось жёстко перезагружать хост, после чего все ВМ завелись, кроме Server1 - после старта этой ВМ бесконечно долго "светилась" заставка Microsoft и всё. Удалось выяснить, что если от Server1 отключить один из примапленных raw-дисков, то Server1 запускается нормально. Я пытался кучей разных способов "подцепить" к Server1 необходимый диск, но всякий раз заканчивался "глухим зависоном" этой виртуальной машины. Благо место на СХД ещё есть и резервные копии есть - вобщем создал новый диск, презентовал его Server1 и все выходные восстанавливал на него данные из резервных копий.
А сегодня утром обратил внимание что виртуальные машины, которые хранились на LUN5 не работают. Более того Datastore, расположенный на этом LUN'е не видят оба хоста VMware. Ну и наконец, на хостах VMware в списке Storage'ей этот LUN видно, только размер у него равен нулю.

Обе проблемы явно произошли в одно время и обе проблемы явно имеют общие корни, под названием Xyratex (что-то такое произошло, что вывело из строя 2 LUN'а).

Есть ли какой-либо способ полноценно увидеть LUN5 и запустить (или хотя бы как-то "выцарапать" оттуда виртуальные машины)?

Может быть кто-то даст какие-либо советы как сделать, чтоб примапленные raw-диски к ВМ не вызывали коллапс всей системы?

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Tert » 12 ноя 2012, 15:14

Zirro
Попробуйте в настройках Xyratex параметр
Overload Management переключить в Busy/4.

Ну и почитайте вот эту статью.

Zirro
Advanced member
Сообщения: 235
Зарегистрирован: 27 авг 2002, 14:03
Откуда: Киров
Контактная информация:

Re: Проблемы с Xyratex 6412E

Сообщение Zirro » 27 мар 2013, 09:58

И снова возвращаюсь к проблемам СХД Xyratex.
Проблемы собственно всё те же: отваливаются диски у ВМ. После консультаций с техподдержкой VMware пришли к мысли, что видимо переполняется очередь команд на портах контроллера СХД. Может ли кто-нибудь подсказать размер буфера порта на контроллере?

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 19 гостей