Форум Тринити

Открытый технический форум по серверам и системам хранения данных, кластерным решениям, SAN, NAS.
Microsemi infortrend storage
Текущее время: 13 дек 2018, 16:07

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 20 ]  На страницу 1, 2  След.
Автор Сообщение
 Заголовок сообщения: Виснет сетевая карта.
СообщениеДобавлено: 23 дек 2008, 17:00 
Не в сети
Junior member

Зарегистрирован: 23 дек 2008, 16:41
Сообщения: 11
Откуда: Воскресенск
ОС FreeBSD 6.3, поддержка acpi отключена.
Сервер Trinity ( Supermicro Platforms SuperServer 6015B-3RB, Intel Xeon E5430x2, 4GB, Network Intel® PRO/1000 PT Dual Port Server Adapter (EXPI9402PT).

Трафик проходящий через машину 50-90Мбит, активных хостов до 1500шт. Сервер выполняет роль шейпера (ipfw pipe+queue), фаервола (ipfw), NAT (ipnat).

Машинка работает нормально, но в какие то моменты времени, зависимость от каких факторов не определено, зависает. Причем в логах до этого сначала идут записи:
Код:
Dec 20 04:35:06 kernelgate kernel: Expensive timeout(9) function: 0x8047fda8(0x8a8af800) 0.025682593 s
Dec 20 04:35:10 kernelgate kernel: em3: link state changed to UP
Dec 20 04:35:38 kernelgate kernel: em3: watchdog timeout -- resetting
Dec 20 04:35:38 kernelgate kernel: em3: link state changed to DOWN
Dec 20 04:35:42 kernelgate kernel: em3: link state changed to UP
Dec 20 04:36:05 kernelgate kernel: em3: watchdog timeout -- resetting
Dec 20 04:36:05 kernelgate kernel: em3: link state changed to DOWN
Dec 20 04:36:09 kernelgate kernel: em3: link state changed to UP
Dec 20 04:36:20 kernelgate kernel: em3: watchdog timeout -- resetting
Dec 20 04:36:20 kernelgate kernel: em3: link state changed to DOWN

и так по кругу.

помогает перегрузка сервера.
В чем может быть проблема? Куда копать? Все, что уже накопали в интернете уже попробывали.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 23 дек 2008, 17:30 
Не в сети
Заслуженный сетевик

Зарегистрирован: 04 янв 2004, 00:30
Сообщения: 1108
Откуда: Н.Новгород
Предлагается пропатчить EPROM у сетевой карты.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 23 дек 2008, 17:43 
Не в сети
Site Admin
Site Admin
Аватара пользователя

Зарегистрирован: 22 авг 2002, 12:03
Сообщения: 2005
Откуда: St. Petersburg
1. как и сказано прошить биос карты последней прошивкой.
2. поддержку сетевухи модулем, затем fail2ban c контролем лога, и при обнаружении таких сообщений - ложим сеть, перегружаем модуль, поднимаем сеть.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 23 дек 2008, 18:21 
Не в сети
Junior member

Зарегистрирован: 23 дек 2008, 16:41
Сообщения: 11
Откуда: Воскресенск
and3008 писал(а):
Предлагается пропатчить EPROM у сетевой карты.

Спасибо за быстрый ответ.
Можно ли поподробнее про перешивку? Или ссылку на инструкцию и софт.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 23 дек 2008, 18:28 
Не в сети
Junior member

Зарегистрирован: 23 дек 2008, 16:41
Сообщения: 11
Откуда: Воскресенск
setar писал(а):
2. поддержку сетевухи модулем, затем fail2ban c контролем лога,

Вы предлагаете не "вкомпилировать" в ядро драйвер карты а подгружать его во время загрузки? Какой драйвер подгружать модулем? Быть может есть какой то сторонний драйвер?
Цитата:
и при обнаружении таких сообщений - ложим сеть, перегружаем модуль, поднимаем сеть.

Это не выход. Сеть должна работать 7/24/365. Люди следят за сервером 8 часов в день. По этому, если ночью карта отваливается, получается плохо.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 24 дек 2008, 08:51 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 14 ноя 2003, 17:25
Сообщения: 13040
Откуда: СПб, Екатеринбург
"technotechno"
Достаточно опустить и поднять интерфейс, всего делов на 10-15 секунд скриптом.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 24 дек 2008, 09:53 
Не в сети
Junior member

Зарегистрирован: 23 дек 2008, 16:41
Сообщения: 11
Откуда: Воскресенск
Stranger03 писал(а):
Достаточно опустить и поднять интерфейс, всего делов на 10-15 секунд скриптом.

И это называется надежный сервер???
Как я уже писал это не выход.

Неужели все так решают такую проблему? У нас и нагрузка не такая большая, есть ведь сервера, у которых нагрузки значительно больше.

Единственное, что мне посоветовали это уменьшить кол-во правил на ipfw. У нас их там более сотни.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 25 дек 2008, 11:14 
Не в сети
Site Admin
Site Admin
Аватара пользователя

Зарегистрирован: 22 авг 2002, 12:03
Сообщения: 2005
Откуда: St. Petersburg
да, именно модулем я и предложил собрать карту.
для e1000 сейчас можно использовать по крайней мере 3 драйвера
старый (не помню как называется нужно смотреть menuconfig), новый который сейчас собственно носит название e1000 - эти два из исходников ядра.
Ну и третий самый правильный вариант дрова от разработчика eth чипа - от intel скачивается соответственно с сайта производителя.

Цитата:
Сеть должна работать 7/24/365
Это кластер, без вариантов!


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 25 дек 2008, 12:55 
Не в сети
Junior member

Зарегистрирован: 23 дек 2008, 16:41
Сообщения: 11
Откуда: Воскресенск
setar писал(а):
да, именно модулем я и предложил собрать карту.
для e1000 сейчас можно использовать по крайней мере 3 драйвера
старый (не помню как называется нужно смотреть menuconfig)

Если не ошибаюсь это в Linux-е. У нас FreeBSD.

Цитата:
, новый который сейчас собственно носит название e1000 - эти два из исходников ядра.
Ну и третий самый правильный вариант дрова от разработчика eth чипа - от intel скачивается соответственно с сайта производителя.


Собрали именно с этим драйвером. Последняя версия с сайта 6.6.6. Сутки, пока полет нормальный.

Цитата:
Цитата:
Сеть должна работать 7/24/365
Это кластер, без вариантов!

Мечты....


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 25 дек 2008, 12:56 
Не в сети
Power member
Аватара пользователя

Зарегистрирован: 03 авг 2007, 15:10
Сообщения: 37
Откуда: Minsk
setar писал(а):
да, именно модулем я и предложил собрать карту.
для e1000 сейчас можно использовать по крайней мере 3 драйвера
старый (не помню как называется нужно смотреть menuconfig), новый который сейчас собственно носит название e1000 - эти два из исходников ядра.
Ну и третий самый правильный вариант дрова от разработчика eth чипа - от intel скачивается соответственно с сайта производителя.

Цитата:
Сеть должна работать 7/24/365
Это кластер, без вариантов!

Это ж FreeBSD(menuconfig там просто нет).

По листу рассылки поглядел - это по моему проблемы из за локов в ядре.
Не пробовали обновиться до 7-ки ?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 25 дек 2008, 13:01 
Не в сети
Junior member

Зарегистрирован: 23 дек 2008, 16:41
Сообщения: 11
Откуда: Воскресенск
Fast писал(а):
По листу рассылки поглядел - это по моему проблемы из за локов в ядре.
Не пробовали обновиться до 7-ки ?


Хотел с самого начала на ней сделать, но потом подумал, что она не достаточно стабильная. А узел очень ответственный.

За идею по поводу локов спасибо, может поможет.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 25 дек 2008, 23:15 
Не в сети
Junior member

Зарегистрирован: 23 дек 2008, 16:41
Сообщения: 11
Откуда: Воскресенск
Не прошло и 2-х суток. Карта опять умерла. Если быть более точным, то я пытался обрариться к серверу по 2-м разным интерфейсам, ответов не было. И самое интересное что с этим драйвером нет ни одной записи в логах. Сервер не завис! После перезагрузки сервера все опять заработало.
Куда теперь копать? Не может ли быть проблема аппаратная?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 26 дек 2008, 08:18 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 14 ноя 2003, 17:25
Сообщения: 13040
Откуда: СПб, Екатеринбург
technotechno писал(а):
Не может ли быть проблема аппаратная?

Обновлять прошивку пробовали? К слову сказать еще в питере мне как-то попалась такая же платформа, в которой оба интерфейса начинали путаться в режимах 100 - 1000 Мбит. Может это карма, но когда я переставил систему по своим умозрениям, все стало хорошо. Работает по сей день у провайдера.
Потом я думаю стоит на 6.3 накатить последние апдейты через svup.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 26 дек 2008, 11:03 
Не в сети
Site Admin
Site Admin
Аватара пользователя

Зарегистрирован: 22 авг 2002, 12:03
Сообщения: 2005
Откуда: St. Petersburg
маловероятно конечно, но проверьте на всякий случай мас адреса аппаратные

и ещё раз предлагаю :
Цитата:
2. поддержку сетевухи модулем, затем fail2ban c контролем лога, и при обнаружении таких сообщений - ложим сеть, перегружаем модуль, поднимаем сеть.


все же это лучше чем узнавать о падении сервера постфактум.
к тому же если все правильно настроить то передергивание может занять менее секунды... впрочем сессиии порвуться всё равно


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 26 дек 2008, 11:10 
Не в сети
Сотрудник Тринити
Сотрудник Тринити
Аватара пользователя

Зарегистрирован: 14 ноя 2003, 17:25
Сообщения: 13040
Откуда: СПб, Екатеринбург
В конце-то концов поставить еще одну сетевуху и посмотреть в чем проблема. Будет ли отваливаться.


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 20 ]  На страницу 1, 2  След.

Часовой пояс: UTC + 3 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB