Проблемы с Xyratex 6412E
Модераторы: Trinity admin`s, Free-lance moderator`s
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Проблемы с Xyratex 6412E
Доброго времени суток.
Имеется следующая конфигурация: сервер VMware ESX 4.1U2. На нём создана виртуальная машина с ОС Windows 2003 R2, выполняющая роль файлового сервера. К хосту VMware подключена СХД Xyratex 6412E. На СХД создано несколько томов, которые "примаплены" к виртуальному файловому серверу в качестве RAW-disk. В свою очередь на "примапленных" дисках файлового сервера созданы "шары", которые подключены у конечных пользователей в качестве сетевых дисков.
Проблема заключается в следующем: некоторое время назад СХД стала "семафорить" что неисправен один из двух контроллеров. Контроллер был извлечён и отправлен на гарантийный ремонт. СХД я перевёл в одноконтроллерный режим работы. Далее не могу поручиться на 100%, но примерно в это время пользователи стали жаловаться, что у них на некоторое время пропадают сетевые диски (обычно это 30-50 секунд иногда более 3 минут). Знающие люди посоветовали мне "задизаблить" опцию "Overload Management". Однако, это не помогло. Довольно быстро вернулся из СЦ заменённый контроллер и я думал, что после его установки и возврата всех настроек к исходному состоянию проблема исчезнет. Но проблема осталась и актуальна по сей день.
Что было выяснено за это время:
1. Во время "исчезновения" сетевых дисков сервер отвечает на сетевые запросы (ping'и);
2. На самом сервере диски, на которых расположены "шары", тоже отваливаются примерно в это же время;
3. В журнале сервера нет никаких ошибок.
Я всё больше склоняюсь к мысли, что источник проблемы в СХД вот только как это отловить и какие настройки покрутить на СХД?
P.S. Возможно это и не проблема собственно СХД, а проблемы ОС (пусть тогда модератор перенесёт тему в соответсвующий раздел), но подозрительно совпадают время "поломки" контроллера и время возникновения проблемы, хотя, повторюсь, это лишь моё субъективное ощущение.
P.P.S. Может имеет значение тот факт что, как оказалось позже, отправленный мной контроллер был исправен.
Имеется следующая конфигурация: сервер VMware ESX 4.1U2. На нём создана виртуальная машина с ОС Windows 2003 R2, выполняющая роль файлового сервера. К хосту VMware подключена СХД Xyratex 6412E. На СХД создано несколько томов, которые "примаплены" к виртуальному файловому серверу в качестве RAW-disk. В свою очередь на "примапленных" дисках файлового сервера созданы "шары", которые подключены у конечных пользователей в качестве сетевых дисков.
Проблема заключается в следующем: некоторое время назад СХД стала "семафорить" что неисправен один из двух контроллеров. Контроллер был извлечён и отправлен на гарантийный ремонт. СХД я перевёл в одноконтроллерный режим работы. Далее не могу поручиться на 100%, но примерно в это время пользователи стали жаловаться, что у них на некоторое время пропадают сетевые диски (обычно это 30-50 секунд иногда более 3 минут). Знающие люди посоветовали мне "задизаблить" опцию "Overload Management". Однако, это не помогло. Довольно быстро вернулся из СЦ заменённый контроллер и я думал, что после его установки и возврата всех настроек к исходному состоянию проблема исчезнет. Но проблема осталась и актуальна по сей день.
Что было выяснено за это время:
1. Во время "исчезновения" сетевых дисков сервер отвечает на сетевые запросы (ping'и);
2. На самом сервере диски, на которых расположены "шары", тоже отваливаются примерно в это же время;
3. В журнале сервера нет никаких ошибок.
Я всё больше склоняюсь к мысли, что источник проблемы в СХД вот только как это отловить и какие настройки покрутить на СХД?
P.S. Возможно это и не проблема собственно СХД, а проблемы ОС (пусть тогда модератор перенесёт тему в соответсвующий раздел), но подозрительно совпадают время "поломки" контроллера и время возникновения проблемы, хотя, повторюсь, это лишь моё субъективное ощущение.
P.P.S. Может имеет значение тот факт что, как оказалось позже, отправленный мной контроллер был исправен.
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Zirro
Как в VmWare настроен Multipath?
Доступ к устройствам работает в режиме MRU, Fixed или RoundRobin?
По характеру проблемы похоже, что у вас стоит Fixed.
Как в VmWare настроен Multipath?
Доступ к устройствам работает в режиме MRU, Fixed или RoundRobin?
По характеру проблемы похоже, что у вас стоит Fixed.
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Multipath для всех дисков настроен как RoundRobin.Tert писал(а):Zirro
Как в VmWare настроен Multipath?
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Zirro
Включите MRU.
Включите MRU.
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
А можно поподробней. Что такое MRU и как его включить?
Возможно Вы имели в виду Most Recently Used?
Возможно Вы имели в виду Most Recently Used?
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Zirro
Да.
Да.
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Некоторое время после выбора политики MRU проблема не проявлялась. Однако сегодня снова было пара случаев описанной проблемы.
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Zirro
Кстати, прошивки на Xyratex у вас последние?
Кстати, прошивки на Xyratex у вас последние?
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Насчёт того последняя ли она я не в курсе. СХД с момента поставки эксплутируется с той firmware, которая уже была установлена.
На данный момент, если я смотрю то, что Вас интересует, версия прошивки на обоих контроллерах: 3.9 Build 0011
На данный момент, если я смотрю то, что Вас интересует, версия прошивки на обоих контроллерах: 3.9 Build 0011
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Подниму тему. После недолгого затишья проблема снова дала о себе знать. Что ещё кроме политик multipath в настройках VMware может помочь решить проблему?
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Для начала довести версию микрокода до версии 3.9.21 (релиз 2.5.10)Zirro писал(а):Что ещё кроме политик multipath в настройках VMware может помочь решить проблему?
После этого попытаться воспроизвести без VMware - будут ли проблемы?
Почтовый адрес для связи: a.ivanov@trinitygroup.ru | ICQ: 112586598
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Я уже давно подумываю над этим, но у меня есть вопросы по прошивке.exLH писал(а):Для начала довести версию микрокода до версии 3.9.21 (релиз 2.5.10)
Если я правильно понимаю, у меня сейчас релиз 2.5.6 (RAID Firmware Version: 3. 9 Build 0011; RAID Firmware Boot PROM Version: 0073). В следующем релизе (релиз 2.5.10) есть только обновление контроллера. То есть, если руководствоваться этой статьёй http://blog.trinitygroup.ru/2010/01/xyr ... mment-form, мне достаточно только обновить контроллер по сети и не заморачиваться консольным подключением для прошивки boot PROM, жёстких дисков и т.п.?
Воспроизвести проблему без VMware довольно затруднительно, но, если других вариантов не останется, то попробую этот.После этого попытаться воспроизвести без VMware - будут ли проблемы?
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Добрый день.
Продолжу в этой же теме, так как снова у меня проблемы с Xyratex, теперь гораздо серьёзней.
На текущий момент все прошивки на СХД самые свежие.
Теперь коротко о том как используется СХД: на ней создано несколько LUN'ов и все они презентованы 2 хостам VMware ESX 4.1u3. Часть LUN'ов примаплена как raw-диски к одной из виртуальных машин (назовём её Server1), а один из LUN'ов (пусть будет LUN5) был расшарен между обоими хостами для хранения виртуальных машин.
Проблема произошла ночью 10.11.12.
Не знаю что произошло на Server1, но он наглухо повис, более того он подвесил весь хост VMware и соответственно все ВМ расположенные на этом хосте. Пришлось жёстко перезагружать хост, после чего все ВМ завелись, кроме Server1 - после старта этой ВМ бесконечно долго "светилась" заставка Microsoft и всё. Удалось выяснить, что если от Server1 отключить один из примапленных raw-дисков, то Server1 запускается нормально. Я пытался кучей разных способов "подцепить" к Server1 необходимый диск, но всякий раз заканчивался "глухим зависоном" этой виртуальной машины. Благо место на СХД ещё есть и резервные копии есть - вобщем создал новый диск, презентовал его Server1 и все выходные восстанавливал на него данные из резервных копий.
А сегодня утром обратил внимание что виртуальные машины, которые хранились на LUN5 не работают. Более того Datastore, расположенный на этом LUN'е не видят оба хоста VMware. Ну и наконец, на хостах VMware в списке Storage'ей этот LUN видно, только размер у него равен нулю.
Обе проблемы явно произошли в одно время и обе проблемы явно имеют общие корни, под названием Xyratex (что-то такое произошло, что вывело из строя 2 LUN'а).
Есть ли какой-либо способ полноценно увидеть LUN5 и запустить (или хотя бы как-то "выцарапать" оттуда виртуальные машины)?
Может быть кто-то даст какие-либо советы как сделать, чтоб примапленные raw-диски к ВМ не вызывали коллапс всей системы?
Продолжу в этой же теме, так как снова у меня проблемы с Xyratex, теперь гораздо серьёзней.
На текущий момент все прошивки на СХД самые свежие.
Теперь коротко о том как используется СХД: на ней создано несколько LUN'ов и все они презентованы 2 хостам VMware ESX 4.1u3. Часть LUN'ов примаплена как raw-диски к одной из виртуальных машин (назовём её Server1), а один из LUN'ов (пусть будет LUN5) был расшарен между обоими хостами для хранения виртуальных машин.
Проблема произошла ночью 10.11.12.
Не знаю что произошло на Server1, но он наглухо повис, более того он подвесил весь хост VMware и соответственно все ВМ расположенные на этом хосте. Пришлось жёстко перезагружать хост, после чего все ВМ завелись, кроме Server1 - после старта этой ВМ бесконечно долго "светилась" заставка Microsoft и всё. Удалось выяснить, что если от Server1 отключить один из примапленных raw-дисков, то Server1 запускается нормально. Я пытался кучей разных способов "подцепить" к Server1 необходимый диск, но всякий раз заканчивался "глухим зависоном" этой виртуальной машины. Благо место на СХД ещё есть и резервные копии есть - вобщем создал новый диск, презентовал его Server1 и все выходные восстанавливал на него данные из резервных копий.
А сегодня утром обратил внимание что виртуальные машины, которые хранились на LUN5 не работают. Более того Datastore, расположенный на этом LUN'е не видят оба хоста VMware. Ну и наконец, на хостах VMware в списке Storage'ей этот LUN видно, только размер у него равен нулю.
Обе проблемы явно произошли в одно время и обе проблемы явно имеют общие корни, под названием Xyratex (что-то такое произошло, что вывело из строя 2 LUN'а).
Есть ли какой-либо способ полноценно увидеть LUN5 и запустить (или хотя бы как-то "выцарапать" оттуда виртуальные машины)?
Может быть кто-то даст какие-либо советы как сделать, чтоб примапленные raw-диски к ВМ не вызывали коллапс всей системы?
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Проблемы с Xyratex 6412E
Zirro
Попробуйте в настройках Xyratex параметр
Overload Management переключить в Busy/4.
Ну и почитайте вот эту статью.
Попробуйте в настройках Xyratex параметр
Overload Management переключить в Busy/4.
Ну и почитайте вот эту статью.
-
- Advanced member
- Сообщения: 235
- Зарегистрирован: 27 авг 2002, 14:03
- Откуда: Киров
- Контактная информация:
Re: Проблемы с Xyratex 6412E
И снова возвращаюсь к проблемам СХД Xyratex.
Проблемы собственно всё те же: отваливаются диски у ВМ. После консультаций с техподдержкой VMware пришли к мысли, что видимо переполняется очередь команд на портах контроллера СХД. Может ли кто-нибудь подсказать размер буфера порта на контроллере?
Проблемы собственно всё те же: отваливаются диски у ВМ. После консультаций с техподдержкой VMware пришли к мысли, что видимо переполняется очередь команд на портах контроллера СХД. Может ли кто-нибудь подсказать размер буфера порта на контроллере?
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 19 гостей