Рвется доступ к IPMI при перезагрузке сервера

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
uand
Junior member
Сообщения: 7
Зарегистрирован: 24 июл 2008, 17:21
Откуда: СПб

Рвется доступ к IPMI при перезагрузке сервера

Сообщение uand » 19 май 2017, 13:16

Сервер на платформе SuperServer 5018R-MR
Сервер установлен В ДЦ. IPMI настроен на Shared интерфейс. Прописан статический адрес и IP Access Control на несколько IP.
Проблема: при перезагрузке сервера рвется IPMI и восстанавливается в большинстве случаев уже когда сервер загрузился. Таким образом в биос попасть не могу. Когда сервер работал в локалке - такого не замечал. Вопрос: на сколько рвется IPMI соединение при перезагрузке. У меня в локалке сейчас нет похожего сервера, проверить не могу.

Аватара пользователя
Umlyaut
Advanced member
Сообщения: 370
Зарегистрирован: 09 июл 2010, 11:23
Откуда: Москва

Хм-ммм...

Сообщение Umlyaut » 19 май 2017, 23:26

uand писал(а): Сервер установлен В ДЦ.
...
Проблема: при перезагрузке сервера рвется IPMI и восстанавливается в большинстве случаев уже когда сервер загрузился. Таким образом в биос попасть не могу. Когда сервер работал в локалке - такого не замечал. Вопрос: на сколько рвется IPMI соединение при перезагрузке.

Вопрос у Вас странный - я б подумал на тему не "насколько рвётся", а "почему" и "что с этим делать"?

Что ж, давайте разбираться...

Временная задержка между Вами и сервером в ДЦ грубо на порядок или два больше той, что в локалке (постулируем by default, что нынешние локалки уже давно все гигабитные :) ) в лучшем случае (при доступе через мобильный интернет и три порядка не предел).
Соответственно, за время повторного установления соединения Вашего удалённого компа с IPMI-интерфейсом сервера последний успевает "проскочить" POST и загрузку ОС.

Поскольку реальных способов уменьшить задержку на ремоте лично я не вижу, то можно копать лишь в сторону искусственного замедления процесса загрузки сервера - например, если сейчас стоит "Fast/Quick boot", то выключить этот режим.

Ну или если это нежелательно по каким-то причинам, то ставьте к серверу IP-KVM - он-то будет "на связи" на любой стадии перезагрузки сервера.

uand
Junior member
Сообщения: 7
Зарегистрирован: 24 июл 2008, 17:21
Откуда: СПб

Re: Хм-ммм...

Сообщение uand » 20 май 2017, 09:01

Umlyaut писал(а):
Вопрос у Вас странный - я б подумал на тему не "насколько рвётся", а "почему" и "что с этим делать"?
Вопрос может и странный, но конкретный, хотелось бы получить конкретный ответ. Мне нужно узнать поведение интерфейса в локалке.
Umlyaut писал(а): Что ж, давайте разбираться...

Временная задержка между Вами и сервером в ДЦ грубо на порядок или два больше той, что в локалке (постулируем by default, что нынешние локалки уже давно все гигабитные :) ) в лучшем случае (при доступе через мобильный интернет и три порядка не предел).
Соответственно, за время повторного установления соединения Вашего удалённого компа с IPMI-интерфейсом сервера последний успевает "проскочить" POST и загрузку ОС.
Тут я с вами не согласен, порядки разные бывают. Предположим в локальной сети задержка очень мала по пингу <1мс. В данный момент у меня мобильный интернет, и задержка по пингу между удаленным ПК и интерфейсом IPMI в ДЦ в среднем около 60 мс. Нужно еще какое-то время на соединение пусть еще 1000 мс. Вы серьезно полагаете, что за 1000 мс, после включения сервера проходят все проверки параметров, POST, проверка параметров Raid контроллера и загрузка сервера? У меня восстановление интерфейса происходит примерно через 1 мин. Это не нормально.

Я вижу две причины или неисправность IPMI или долгое восстановление интерфейса на сетевом оборудовании в ДЦ после передергивания питания.

Аватара пользователя
Umlyaut
Advanced member
Сообщения: 370
Зарегистрирован: 09 июл 2010, 11:23
Откуда: Москва

Хм-ммм...

Сообщение Umlyaut » 20 май 2017, 18:35

uand писал(а):
Umlyaut писал(а):
Вопрос у Вас странный - я б подумал на тему не "насколько рвётся", а "почему" и "что с этим делать"?
Вопрос может и странный, но конкретный, хотелось бы получить конкретный ответ. Мне нужно узнать поведение интерфейса в локалке.
Возможно я излишне чувствителен к семантике, но именно на поведение сервера (а стало быть и его интерфейса) именно в локалке Вы и не жаловались - проблема у Вас, если я ничего не путаю, на "длинном" линке, когда Вы заходите с компа из-за пределов локалки (в данном случае - локалки ДЦ).
uand писал(а):Тут я с вами не согласен, порядки разные бывают.
Угу, бывают. Разные.
Десятичные знают все, про двоичные помнят в основном программисты. :D
Я своим упоминанием гигабита и ниже (100Mbit, 10Mbit) кагбе намекал на десятичные. В сетях ethernet latency пропорциональна установившейся скорости соединения обычно.
uand писал(а):Предположим в локальной сети задержка очень мала по пингу <1мс. В данный момент у меня мобильный интернет, и задержка по пингу между удаленным ПК и интерфейсом IPMI в ДЦ в среднем около 60 мс. Нужно еще какое-то время на соединение пусть еще 1000 мс.
Коллега, без обид, просто я вспомнил старую шутку про военную кафедру: "возьмём М танков... нет, М мало, возьмём N!" :)
Пинги, на мой вкус, не вполне могут адекватно характеризовать ситуацию с задержкой соединения с IPMI-сервисом MB (и даже не потому, что ICMP-протокол достаточно легковесный и незамысловатый).
uand писал(а):Вы серьезно полагаете, что за 1000 мс, после включения сервера проходят все проверки параметров, POST, проверка параметров Raid контроллера и загрузка сервера?
Вспоминаю свои серверы: там после POSTa идёт инициализация BMC (который, на минуточку, и отвечает за IPMI-доступ).
После этого секунд 10-15 на отработку рейд-контроллером процедуры его старта (отображение носителей и состояния LUNов) и ресет всех сетевых интерфейсов, а далее идёт загрузка ОС.
Если инит BMC рвёт соединение IPMI, то его, соединения, восстановление может занять определённое время (ожидание ресета сетевухи, старт сетевого стека BMC, аутентификация удалённой машины на BMC по IPMI) - примерно как у обычного компа соединение с сетью с нуля.

Если при этом удалённая машина не в локалке, то возможно - возможно! (я не настаиваю - спеки по IPMI не слишком подробно освещают этот вопрос) - происходит нечто вроде ретрейнов: соединение устанавливается не с первого раза.
uand писал(а):У меня восстановление интерфейса происходит примерно через 1 мин. Это не нормально.
Ну в целом сложно с этим не согласиться.
Просто я - "отсюда плохо видно(с)" - вынужден заниматься "сравнительной патологоанатомией" проблемы: если один и тот же сервер с одними и теми же настройками IPMI в локалке доступен мухой, а извне пускает вяло и не сразу, то ситуации по большому счёту отличаются лишь наличием/отсутствием "плеча" с меньшей скоростью и априори большей задержкой по сетевому стеку (для IPMI это помимо сетевого (как у ICMP) ещё и минимум транспортный-сеансовый уровень, а то и выше, вплоть до седьмого).
uand писал(а):Я вижу две причины или неисправность IPMI или долгое восстановление интерфейса на сетевом оборудовании в ДЦ после передергивания питания.
Ну в локалке же IPMI вполне исправно у Вас работал, не?
И что это за "передёргивание питания" - что, вместе с сервером в ДЦ у Вас рестартует и свитч, в который воткнут сервер?

P.S. Я по-прежнему вижу в качестве воркараунда "внешний" IP-KVM. :)

uand
Junior member
Сообщения: 7
Зарегистрирован: 24 июл 2008, 17:21
Откуда: СПб

Re: Хм-ммм...

Сообщение uand » 21 май 2017, 12:48

Umlyaut писал(а): Коллега, без обид, просто я вспомнил старую шутку про военную кафедру: "возьмём М танков... нет, М мало, возьмём N!" :)
Пинги, на мой вкус, не вполне могут адекватно характеризовать ситуацию с задержкой соединения с IPMI-сервисом MB (и даже не потому, что ICMP-протокол достаточно легковесный и незамысловатый).
Никаких обид, наоборот, спасибо за ваше участие в решении моей проблемы.
Дело в том, что восстановление интерфейса я как раз тестирую пингом интерфейса, понятно что IPMI восстановиться несколько позже после этого. Провел простой эксперимент: выключение сервера, запуск пинга, включение сервера. вот такая картина получилась:

Код: Выделить всё

Обмен пакетами с xxx.xxx.xxx.xxx по с 32 байтами данных:
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Превышен интервал ожидания для запроса.
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
Ответ от xxx.xxx.xxx.xxx: число байт=32 время=9мс TTL=58
первый интервал это сервер выключен, интерфейс пингуется, потом после включения не пингуется и т.д. Перед выдачей сообщения о недоступности система ждет 4 сек. У меня 22 таких сообщения, значит около 88 сек. интерфейс недоступен. За это время сервер успевает загрузится.
Umlyaut писал(а):
uand писал(а):Я вижу две причины или неисправность IPMI или долгое восстановление интерфейса на сетевом оборудовании в ДЦ после передергивания питания.
Ну в локалке же IPMI вполне исправно у Вас работал, не?
И что это за "передёргивание питания" - что, вместе с сервером в ДЦ у Вас рестартует и свитч, в который воткнут сервер?
Я ошибся, неправильно написал, конечно же не "передергивание питания" а "ресет сетевой карты".
Umlyaut писал(а): P.S. Я по-прежнему вижу в качестве воркараунда "внешний" IP-KVM. :)
Да, конечно, но меня на этапе настройки интересует почему набортовый интерфейс ведет себя таким странным образом.

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Re: Рвется доступ к IPMI при перезагрузке сервера

Сообщение Tert » 22 май 2017, 14:48

uand
Почитайте здесь

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и 34 гостя