Проблемы с двухузловым кластером на Windows 2003

Технологии постороения кластеров (вычислительных и отказоустойчивых), настройка терминал серверов,
SAN , NAS, FibreChannel, Infiniband

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Alex_Saf
Advanced member
Сообщения: 68
Зарегистрирован: 19 апр 2005, 11:46
Откуда: Семилуки

Проблемы с двухузловым кластером на Windows 2003

Сообщение Alex_Saf » 31 дек 2005, 19:56

Доброго времени суток, коллеги!

Есть проблема с кластером на Windows Server 2003 SP1 EE. В качестве внешнего хранилища использован дисковый массив Infordternd F16F-R2021. В каждом из узлов установлено по два HBA Qlogic, для отказоустойчивости.
Создал кластер на первой ноде, потом включил и ввел в кластер втрорую ноду. Разрешил немедленное отказовозвращение для групп (кроме Cluster Group). В группы входят только ресурсы типа "Physical Disk". В качестве пульсовой (приватной) сети сначала использовал кросс-кабель, затем поставил старенький концентратор.  Приватная сеть используется только для внутрикластерных дел. Публичная - смешанная.
И столнулся с такой проблемой: если я выключаю насильно 2-ю ноду, то первая (немного подумав) перетаскивает на себя ресурсы второй (в моем случае просто один диск). При загрузке вторая нода перетягивает на себя свой ресурс. Мне думается, что это нормальное поведение. Затем я выключаю первую ноду (не резетом, просто отключая питание). Вторая нода ведет себя достойно - перетягивает диски первой на себя и они доступны. Затем я включаю первую ноду. Во премя ее загрузки службы кластера на второй вообще перестают работать. IP  кластера не пингуется в это время (не по IP ни по имени). "Администратор кластеров" в момент загрузки-инициализации первой пишет "Кластер srv-app1 более недоступен", затем "Не удалось запустить службу кластеров на узле "srv-app1". Узел кластера не найден. Код ошибки: -2147019854". В это момент стартовавший первый кластер перетягивает на себя все ресурсы и свои и второй ноды, даже группа Cluster Group, автовозврат которой запрещен. Причем службы кластера на второй ноде видимо принудительно гасятся. Такая ситуация может оставаться до тех пор пока вручную с помощью  "Администратора кластеров" не сделать команду "Запустить службу кластеров" или подождать порядка 5-10 минут. После перезапуска службы кластеров  - все становится на свои места. Первая нода владеет своими ресурсами. вторая - своими.
Более того, если на одной из машин вынуть кабель из публичной сети, то кластер определяет, что такой-то сетевой интерфейс на таком-то узле не работает, но ресурсы, принадлежащие этому узлу не переходят на второй. И даже не деактивируются, т.е. остаются активными, хотя к ним нет доступа.

У меня развернут SUS и я накатил последние апдейты, вышедшие со времен SP1. Получил массу гемороя, но проблему именно в кластерной службе так и не исправил.
На системах стоят последние драйвера для Qlogic, а также биосы Qlogic'ов обновлены до последних прошивок. На узлах стоит MPIO от Infordrend для multipathing.

Прошу помочь советом.

P.S. С Новым Годом всех, коллеги!

ITER
Advanced member
Сообщения: 306
Зарегистрирован: 13 июл 2003, 10:01
Откуда: Хабаровский край

Re: Проблемы с двухузловым кластером на Windows 2003

Сообщение ITER » 04 янв 2006, 03:44

Alex_Saf писал(а): На узлах стоит MPIO от Infordrend для multipathing.
А это ещё что такое? MPIO дрова для кулоджиков или нахлобучка от них от Инфотренда или что? Дайте ссылку плиз.

Попробуйте в порядке эксперимента отключить второй фс-линк на каждый из узлов кластера и ещё раз проделать все ваши опыты.

Alex_Saf
Advanced member
Сообщения: 68
Зарегистрирован: 19 апр 2005, 11:46
Откуда: Семилуки

Сообщение Alex_Saf » 04 янв 2006, 21:58

> А это ещё что такое? MPIO дрова для кулоджиков или нахлобучка от них от Инфотренда или что? Дайте ссылку плиз.
Нет проблем:
http://www.infortrend.com/4_news/news_eu.asp
http://www10.edacafe.com/nbc/articles/v ... eid=200508
на русском:
http://www.625-net.ru/news/2005/20050921.htm
В порядке эксперимента установил на Qlogic'и не SCSI Miniport Driver, a STOR Miniport Driver.  В такой конфигурации кластер вообще не выполняет своих функций, т.е. ресурсы не перемещаются. В логах ошибки о не возможности захватить диски. Хотя судя по описаниям от M$ класс Storport Driver современней и перспективней. На основании своих опытов делаю неутешительный для себя вывод о том, что в кластере Windows 2003 SP1 Storport Driver от Qlogic как то не нормально работает. Возможно это связано с наличием софта infortrend'а. Тем менее в описаниях по софту от обоих компаний (Qlogic и Infortrend) явным образом указывается о тестировании и сертификации на платформе Windows 2003.

ITER
Advanced member
Сообщения: 306
Зарегистрирован: 13 июл 2003, 10:01
Откуда: Хабаровский край

Сообщение ITER » 05 янв 2006, 09:53

Alex_Saf писал(а):> А это ещё что такое? MPIO дрова для кулоджиков или нахлобучка от них от Инфотренда или что? Дайте ссылку плиз.
Нет проблем:
http://www.infortrend.com/4_news/news_eu.asp
http://www10.edacafe.com/nbc/articles/v ... eid=200508
на русском:
http://www.625-net.ru/news/2005/20050921.htm
В порядке эксперимента установил на Qlogic'и не SCSI Miniport Driver, a STOR Miniport Driver.  В такой конфигурации кластер вообще не выполняет своих функций, т.е. ресурсы не перемещаются. В логах ошибки о не возможности захватить диски. Хотя судя по описаниям от M$ класс Storport Driver современней и перспективней. На основании своих опытов делаю неутешительный для себя вывод о том, что в кластере Windows 2003 SP1 Storport Driver от Qlogic как то не нормально работает. Возможно это связано с наличием софта infortrend'а. Тем менее в описаниях по софту от обоих компаний (Qlogic и Infortrend) явным образом указывается о тестировании и сертификации на платформе Windows 2003.
Ну лозунги лозунгами, а где скачать напосредственно это чудо? Что-то на сайте и на их фтп не нашел ничего, плохо искал?  :?

Вообще-то, насколько я понял, MPIO технология в винде работает ТОЛЬКО с Storport драйверами FC-HBA, с miniport и FCport драйверами она в принципе не должна работать. Так вы попробовали провести эксперименты без мултипассинга (только по одному пути на хост)?

Alex_Saf
Advanced member
Сообщения: 68
Зарегистрирован: 19 апр 2005, 11:46
Откуда: Семилуки

Сообщение Alex_Saf » 05 янв 2006, 10:56

>а где скачать напосредственно это чудо?
http://esupport.infortrend-europe.com/
Зарегистрируйтесь и качайте на здоровье.

>Вообще-то, насколько я понял, MPIO технология в винде работает ТОЛЬКО с Storport драйверами FC-HBA, с miniport и FCport драйверами она в принципе не должна работать
Вы ошибаетесь. MPIO работает и драйверами SCSI-port. По крайней мере в моей конфигурации.

>Так вы попробовали провести эксперименты без мултипассинга (только по одному пути на хост)?
Нет не пробывал. Потому как мне надо именно в описанной мной конфигурации. Иначе возникает вопрос, зачем было подрачено более 2-х штук зелени на дополнительные HBA ;-)

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 10 янв 2006, 12:34

Кулоджиковский драйвер мультипаса в кластере НЕ РАБОТАЕТ, что собственно описано на их сайте. МПИО должен. Ковыряться надо, удаленно трудно что-то сказать.

Ответить

Вернуться в «Кластеры, Аппаратная часть»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 8 гостей