Кластер на Windows2003. Отключение сетевого кабеля

Модераторы: Trinity admin`s, Free-lance moderator`s

matv
Power member
Сообщения: 42
Зарегистрирован: 28 окт 2004, 12:15
Откуда: Новосибирск

Кластер на Windows2003. Отключение сетевого кабеля

Сообщение matv » 29 окт 2004, 15:00

Добрый день!
Есть проблема с восстановлением работы узла кластера при исчезновении внешнего сетевого соединения.
Имеем два тестовых сервера в кластере с Windows 2003.
При выключении питания на одном из узлов кластер успешно перемещается на другой узел, а при восстановлении
упавшего узла возвращается назад, если были указаны параметры возврата.
Т.е. все вцелом работает как описано, но хотелось проверить как поведет себя кластер, если будет следующая ситуация:
1. Один из двух узлов вышел из строя.
2. После того, как кластер переехал на другой узел, пропала внешняя   сеть (скажем в выходной и на несколько часов).
Ожидалось, что кластер не должен аварийно завершаться, а должен постоянно отслеживать появление внешней сети (перегружать ресурсы Cluster Group и Cluster Name).

Оба сервера входят в один домен Windows2003 (Контроллер домена на отдельной машине).
Слово "тестовых" означает, что это простые компьютеры. Внешнее дисковое хранилище имитируется одним SCSI-диском, подключенным шлейфом к обоим компьютерам (сразу скажу, что вся нижеописанная ситуация возникала и при наличии массива ADAPTEC DURASTORE 6200
и думаю, что не является причиной проблем).
В каждом узле по две сетевые карты. Создана общая и частная сети.
Общая сеть подключена к свитчу, частная соединяет узлы через хаб.
На общем SCSI-диске создан кворум.
В кластере всего одна группа ресурсов Cluster Group.
В эту группу входят следующие ресурсы:
- Cluster IP Address
- Cluster Name
- Диск Q  (это диск кворума)

На этой конфигурации попытались проверить реакцию
кластера при отключении сетевого кабеля.
Отсоединяем внешний сетевой кабель от оставшегося в живых узла и видим, что примерно минуты через 3
ресурс Cluster IP Address переходит в состояние "Ошибка" , а Cluster Name в состояние "Автономно"  (Windows с MUI).
Подключаем внешний сетевой кабель - ничего не происходит.
Вернуть в работу кластер можно только зайдя локально с консоли на этот узел, запустить Администратор кластера и перевести Cluser Group в Оперативый режим, либо перегрузить узел.
Пробовал менять настройки ресурсов Cluster IP Address и Cluster Name, но не добился результатов (Закладка Дополнительно в свойствах ресурса).
Возможно я не совсем подробно описал ситуацию и что-то осталось между строк.
Вопрос:
Можно ли вообще ожидать от кластера восстановления своей работоспособности в такой ситуации, или
потеря сетевого соединения для него смерть ?
Если можно ожидать, то подскажите пож. что еще можно предпринять ?
Готов ответить на уточняющие вопросы.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 29 окт 2004, 15:26

Сетевой линк - вообще больное место кластера. Боюсь, что это непробиваемо. Я в свое время вышибил виндовый кластер к едрене фене, просто пару раз выдернув и быстро вставив сетевой конец. А Селезнев то же самое получил на Нетвари :)

matv
Power member
Сообщения: 42
Зарегистрирован: 28 окт 2004, 12:15
Откуда: Новосибирск

Сообщение matv » 01 ноя 2004, 08:05

Спасибо gs за быстрый ответ.
Вы меня сильно обнадежили  :D .
Неужели это никак не лечится ?
С такой "фукциональностью" трудно решиться на боевое использование кластера. Отключение сетевого оборудования не является редким явлением (к сожалению).
Может есть какой-то способ обойти эту ситуацию ?
Если кластер перешел уже в такое нерабочее состояние и вывести из него можно перезагрузкой кластерного сервиса, то может можно как-то автоматизировать этот процесс ?
Например ловить событие "Ошибка" для кластерного ресурса (не знаю как ловить  :) ) и каким-то скриптом, или программой перезапустить сервис.
Есть ли опыт борьбы с таким свойством кластера ?
Некоторое время назад, я задавал это вопрос на другом форуме (http://primary.education.ru:8000/?url=h ... 5F0%2525E0)
Положительного ответа тоже не получил.
Правда одному специалисту из форума удалось что-то настроить в параметрах кластера, но сменилась тема проекта и он не смог точно вспомнить что настраивал.
Это последнее обстоятельство и не позволяет терять надежду.
Буду рад любым соображениям.

Аватара пользователя
Dmitry
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 867
Зарегистрирован: 22 авг 2002, 16:12
Откуда: St.Petersburg
Контактная информация:

Сообщение Dmitry » 02 ноя 2004, 12:13

можно 2 сетевых карточки, 2 линка.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Сообщение Stranger03 » 02 ноя 2004, 13:22

Dmitry писал(а):можно 2 сетевых карточки, 2 линка.
Быстрого ответа вам не сможем дать, надо попробовать. Что-то очень и очень смутно вспоминается одна статейка в рассылках МС, где упоминалась реакция МС кластера на пропадание сетевого линка. Попробую вспомнить...

matv
Power member
Сообщения: 42
Зарегистрирован: 28 окт 2004, 12:15
Откуда: Новосибирск

Сообщение matv » 02 ноя 2004, 14:29

To Dmitry
Вы имеете в виду сделать дублирование внешней сети еще одной парой сетевых карт  и включить эту пару совсем в другой switch ? В нашем случае это быстро не реализовать. Или я вас не понял ?

To Stranger03
Будет просто здорово, если такая ссылка найдется !

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 ноя 2004, 14:34

Я так подозреваю, что ему надо хотя бы какую-нибудь сеть видеть. Можно попробовать просто еще одну сетевушку воткнуть куда-нибудь, чтобы это "что-нибудь" не могло упасть одновременно со всей сетью. Например просто кроссовер во вторую ноду или в другую соседскую машину.
Это просто шаманство конечно - так что просто мысль вслух.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 02 ноя 2004, 14:41

Кстати попробуйте не кабель из сервера выдернуть, а свич отключить от всех остальных девайсов. Есть подозрение, что в этом случае выживет - я просто наблюдал уже картину, что винде (даже не кластеру) надо видеть просто наличие линка - неважно какого.

matv
Power member
Сообщения: 42
Зарегистрирован: 28 окт 2004, 12:15
Откуда: Новосибирск

Сообщение matv » 02 ноя 2004, 14:43

To gs
Да шаманство, но попробую проверить

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Сообщение Stranger03 » 02 ноя 2004, 15:01

matv писал(а):To gs
Да шаманство, но попробую проверить
Да это не шаманство. Вообще с сетью в МС не все хорошо, очень уж многие сервисы завязаны на сеть.

matv
Power member
Сообщения: 42
Зарегистрирован: 28 окт 2004, 12:15
Откуда: Новосибирск

Сообщение matv » 04 ноя 2004, 12:46

Кластеру действительно нужен какой-то линк.
Достаточно подключить внешнюю сеть через хаб и кластер стоит, пока работает хаб.
Для исключения случая, когда совсем нет сети, нужно выстраивать схему
подключения внутренней и внешней сетей через разные хабы, свитчи (а они, в свою очередь,
должны быть поключеы к разным источникам питания (хорошо бы к разным Чубайсам)).
Но, можно попробовать и другой путь.
В Windows 2003 есть такое средство как триггер события (eventtriggers.exe).
Этот триггер позволяет отловить нужное событие (нам нужно ID 1205) и запустить нужную программу.
Создать триггер:
eventtriggers /create /s 10.10.1.16 /u alfa
2\matv  /tr Restart_Cluster /l SYSTEM /eid 1205 /d Перезапускает_кластер_при_обрыве_ЛВС /tk c:\Cluster\ReCluster.bat
Содержимое ReCluster.bat :
net stop "Cluster Service"

net start "Cluster Service"
Триггер периодически срабатывает и перегружает сервис кластера.
Если в сети все еще нет, то в журале (в SYSTEM) опять появляется ошибка 1205 и т. д.
Как только линк появился, то при очередном перезапуске сервиса
кластер восстанавливает свою работу !
Пока сильно не тестировал, но оптимизма прибавилось.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 04 ноя 2004, 13:00

Ну мы не ищем легких путей :)
Ваша основательность конечно радует (все бы так!), но я бы предпочел хвостик куда-нибудь воткнуть. По моему большому и иногда печальному опыту, лучше всего работает наиболее тупой метод :)

matv
Power member
Сообщения: 42
Зарегистрирован: 28 окт 2004, 12:15
Откуда: Новосибирск

Сообщение matv » 04 ноя 2004, 13:09

To GS
У меня программистское прошлое ...  :D
Если мой опыт будет полезен - буду счастлив.
Теперь буду пытаться ставить кластер с контроллерами доменов на самих хостах кластера (экономия на дополительных серверах).
Есть ли какие-то противопоказания такому совместительству ?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 04 ноя 2004, 13:19

Да я вроде противопоказаний не видел. Хотя и не пробовал - может кто конкретнее подскажет.
А стоит ли того экономия? Пара машин типа Супермикро 5013С-Т в типовой набивке стоит тонны по полторы - так ли это напряжно на фоне бюджета кластера? Зато никакого геморроя.

matv
Power member
Сообщения: 42
Зарегистрирован: 28 окт 2004, 12:15
Откуда: Новосибирск

Сообщение matv » 04 ноя 2004, 13:36

To GS
Я тоже думаю, что пара небольших компьютеров, для организации отдельного домена - это не очень дорого.
Но, во-первых, если это работает и настраивается за приемлемое время,
то почему бы и нет ?
А во-вторых, с дополнительными компьютерами, начинаются другие "мелочи" (место в серверной, которого мало, дополнительные розетки питания и сети и т.д.)
Опять программистское прошлое ...  :D

Ответить

Вернуться в «Кластеры, Программное обеспечение»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 4 гостя