проблемы с созданием кластера

Технологии постороения кластеров (вычислительных и отказоустойчивых), настройка терминал серверов,
SAN , NAS, FibreChannel, Infiniband

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
pi
Junior member
Сообщения: 7
Зарегистрирован: 26 апр 2005, 21:01

проблемы с созданием кластера

Сообщение pi » 26 апр 2005, 22:29

Есть железо:
1. два сервера Dell PowerEdge 2800, на каждом: 36GB SCSI U320 10K 80pin - 2 шт., PV110T LTO2 200/400GB, PERC 4/DC, ADAPTEC 39160 U 160 SCSI - 2 шт. (один не используется). При этом стриммер подключен к внутреннему scsi разъему, raid к scsi адаптеру, к которому подключено и внешнее хранилище.
2. внешнее хранилище PowerVault PV220S, 36GB SCSI U320 10K 80pin Internal - 6 шт., Dual Enclosure Mgmt Module (переключатель в положении Clustering), имеет два scsi разъема и подключено к обоим нодам к scsi адаптерам.
3. ноды между собой соединены хертбитом по витой паре.
нужно: сделать кластер на RedHat AS 3.0 + ClusterSuite.
Я такой задачей занялся впервые, поэтому буду благодарен любой помощи и заранее извиняюсь за неподкованность в этом вопросе.
При загрузке любой ноды с отключенным хранилищем она сразу начинает издавать продожительные сигналы одинаковой длины и периодичности, что продолжается пока ее не перезагрузишь. При полключенном к обоим нодам хранилище, включенном хертбите  и одновременном включении обоих нод они некоторое время работают нормально, идет загрузка биосов, доходит до установки редхата, тут дело не доходит до графического режима установки - программа установки загружает драйвера и повисает на драйвере megaraid... Вторая нода при этом начинает "пищать". Иногда это происходит раньше - две ноды нормально грузятся, при этом одна из них или обе начинают "пищать", хотя загрузка продолжается как ни в чем ни бывало. Индикаторы никаких ошибок не показывают.

по загрузке биосов
первым идет MPTBIOS5-06 и выдает таблицу:
HBA ID LUN VENDOR...
0     7    0     LSI Logic
1     8    0     здесь стриммер (не помню точно что выдавалось)
1     7    0     LSI Logic

дальше Adaptec SCSI Bios v 3.10.0
сканирует scsi устройства и выдает пустую таблицу
Slot   Ch  ID  LUN  Vendor ....

затем Power Edge Expandable RAID Controller BIOS 1.09
предлагает по "ctrl-M" войти в настройки, но войти в них не получается, комбинация игнорируется.

вопросы такие:
1. правильно ли я понимаю, обе ноды и хранилище сидят на общей scsi шине?
2. почему ноды пищат? вероятно ли то что они являются аппаратным кластером и есть где то в биосе программа следящая за этой связкой?
если да, то как ее отключить? как вообще избавиться от этой проблемы, потому что нет никакого смысла продолжать установку пока идет такой сигнал об ошибке в аппаратной конфигурации кластера?
3. что нужно исправить в bios-ах? нужно ли переназначать id в первом?(таблицы на обоих нодах одинаковые). Во втором биосе все изменения эффекта не имеют, ни одно устройство не находится; в третий вообще войти нельзя.
Заранее благодарен за советы!

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 27 апр 2005, 11:57

Скорее всего проблема в пересечении SCSI ID контроллеров, которые сидят на общей шине с дисковым ящиком. По крайней мере я так понял приведенную табличку (оба LSI (рэйд видимо) контроллера имеют ID7).
Я не спец в Делле - так что почитайте мануал на контроллеры на предмет - как им ID разные задать. Пока этого не сделаете, может быть все, что угодно.

pi
Junior member
Сообщения: 7
Зарегистрирован: 26 апр 2005, 21:01

Сообщение pi » 27 апр 2005, 12:03

В первом БИОСе поменял на первой ноде:

HBA ID LUN VENDOR...
0     1    0     LSI Logic
1     2    0     LSI Logic
1     6    0     стриммер

на второй ноде:

HBA ID LUN VENDOR...
0     3    0     LSI Logic
1     4    0     LSI Logic
1     5    0     стриммер

ситуация та же самая, симптомы не прошли.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 27 апр 2005, 12:10

Имхо зря Вы задали адреса 1,2,3,4 - скорее всего теперь они с адресами винтов в корзине пересекаются. Посмотрите какие адреса на шине свободны. Как правило рэйд контроллерам выставляются 6 и 7 (они имеют наивысший приоритет на шине и как правило свободны). Причем разные выставлять надо на одном канале - т.е. 6,7 на одном и 6,7 на другом.

pi
Junior member
Сообщения: 7
Зарегистрирован: 26 апр 2005, 21:01

Сообщение pi » 27 апр 2005, 13:07

На шине (во втором биосе) он находит только одно устройство, на 7 id - это scsi адаптер.
У Вас есть какие-нибудь предположения почему он сразу начинает "пищать" если от адаптера отключить хранилище?
т.е. в адаптер включен только внутренний массив дисков одним кабелем, и в системную плату втыкается кабель от стриммера. на конце кабеля, что идет к стриммеру, висит терминатор (со стороны стримера), кабель который втыкается во внутренний массив дисков терминатора не имеет, он подключается к плате к которой подсоединены два внутренних винта (можно больше воткнуть); на ней два scsi разьема и один отличный от них; может туда тоже терминатор нужен какой-то?

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 27 апр 2005, 13:41

Если внутренние винты в хот-свап корзине. то терминатор не нужен.

Вы лучше опишите МАКСИМАЛЬНО подробно что куда подключено и какие адреса у ВСЕХ устройств (и на какой шине).

А если отключить ящик с винтами от контроллера - разумеется он матюгаться начнет!

pi
Junior member
Сообщения: 7
Зарегистрирован: 26 апр 2005, 21:01

Сообщение pi » 27 апр 2005, 15:15

Набросал вот небольшую схемку, надеюсь она хоть немного прояснит ситуацию
ID я расставил так, как понимаю, т.е. возможно неправильно.
Вложения
cluster.xls
(41 КБ) 882 скачивания

pi
Junior member
Сообщения: 7
Зарегистрирован: 26 апр 2005, 21:01

Сообщение pi » 28 апр 2005, 11:20

Может быть для сервера "пищание" - нормальный режим работы?
я так понял, схема тоже не очень вразумительная получилась?
Как правильно на ней расставить ID?
Правильно ли подключены кабели?

А ящик с винтами я отключаю не от контроллера а от адаптера.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 28 апр 2005, 12:21

Я просто схему открыть не могу :(

pi
Junior member
Сообщения: 7
Зарегистрирован: 26 апр 2005, 21:01

Сообщение pi » 28 апр 2005, 13:16

Извините, это видимо из-за того что офис 2003.
Сейчас переформатировал в 2000, если не получится открыть - напишите сразу, сделаю в bmp или jpg.
Вложения
scheme_.xls
(42 КБ) 880 скачиваний

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 28 апр 2005, 13:30

Та же фигня.

Setar, может быть что-то не в порядке с движком форума?

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 28 апр 2005, 13:33

gs писал(а):Та же фигня.

Setar, может быть что-то не в порядке с движком форума?
Да не в порядке, с Апачем.
На майские переставлять будем на RHEL AS 4
пока можно по правой клавише "Save AS ..." и имя подставить другое с расширением .XLS

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 28 апр 2005, 14:42

Насколько я понял схему, у Вас ящик с винтами сконфигурирован как один канал из 14 винтов (сколько реально винтов стоит неважно, SCSI ID все равно нельзя эти использовать). Получается, что на одной шине висит 14 винтов и два рэйд контроллера. Т.е. все 16 SCSI ID этой шины заняты (почитайте кстати мануал ящика на предмет, какие адреса он занимает на шине в одноканальном кластерном режиме). Почти наверняка каналы рэйд контроллеров Вы ОБЯЗАНЫ назначить как 6 и 7.
Кроме того, на схеме есть по два винта в каждом сервере, подключенные к тому же перку (кстати непонятны их адреса - у вас указан только один адрес, хотя винтов по два). Эти винты ОБЯЗАНЫ висеть НЕ на одном канале с внешним ящиком. Посмотрите мануал рэйд контроллера - какие его разъемы к какому каналу относятся (на каждом канале по идее должен быть один внешний и один внутренний разъем).

В общем, надо сделать так:
1. Каналам рэйд контроллера, подключенным к внешнему ящику, назначить разные адреса, не пересекающиеся с адресами, которые могут занимать винты в этом ящике - скорее всего 6 и 7 (в том виде, как на картинке, вообще ничего работать и не должно).
2. Внутренние винты повесить на другой канал, если это еще не сделано.
3. Подключение стримера в данном случае неважно - он на другом адаптере висит (интегрированном) - с ним вроде все в порядке, хотя адреса выставлены как-то не по человечески.

И вот тут немного информации есть http://www.dell.com/downloads/global/pr ... utions.pdf

И еще - в даташите на дисковый ящик написано, что в кластерном варианте он только 13 дисков поддерживает (один из адресов занимается SAF-TE процессором). Значит один слот в нем нельзя занимать винтом - проверьте, не попали ли Вы именно туда.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 28 апр 2005, 15:02

И общие рекомендации кластеростроения.
1. Не торопиться!!!
2. Включаем массив и ОДИН сервер, конфигурим его контроллер для кластерного режима (читаем мануал!!! - возможно требуется выключение write back кэша), создаем-инитим массивы.
3. Включаем второй сервер ОТДЕЛЬНО. Конфигурим его контроллер (опять же RTFM - кластер мода, непересечение адресов и т.п.).
4. Включаем все вместе и уюеждаемся, что железо все видится как надо.
5. Гасим один сервер, на второй накатываем и конфигурим софт - операционка и одну ноду кластера.
6. Подключаем второй сервер и конфигурим его софт и вводим как вторую ноду в уже существующий кластер.
7. Вуаля! :)

pi
Junior member
Сообщения: 7
Зарегистрирован: 26 апр 2005, 21:01

Сообщение pi » 28 апр 2005, 16:25

Огромное спасибо за подробное разъяснение!
Настройку смогу продолжить только через 4 дня,
обещаю по результатам работ написать сюда.
Еще раз спасибо!

Ответить

Вернуться в «Кластеры, Аппаратная часть»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 9 гостей