Форум Тринити

Открытый технический форум по серверам и системам хранения данных, кластерным решениям, SAN, NAS.
Microsemi infortrend storage
Текущее время: 19 окт 2018, 00:50

Часовой пояс: UTC + 3 часа [ Летнее время ]




Начать новую тему Ответить на тему  [ Сообщений: 25 ]  На страницу 1, 2  След.
Автор Сообщение
СообщениеДобавлено: 13 сен 2007, 22:48 
Не в сети
Power member
Аватара пользователя

Зарегистрирован: 13 сен 2007, 12:20
Сообщения: 48
Откуда: оттуда ;)
Расскажу страшную историю про 3Com свичи и что бывает если всю сеть вязать на 3Com.

Итак имеем оборудование 3Com:
3824 - core gigabit switch
5x4250T или Dell 3048(схожие симптомы) - user area
3Com OfficeConnect 8-16port(hubs and switches) - additional user area.
Ко всему этому великолепию подключены машины на матерях ASUS
P4P800 с сетевухой Intel Pro 100VE как единый корп.стандарт компа, ну и пара тройка Intel GERG2(кажется) с Intel Pro 100VE на борту.

В один прекрасный день Вы приходите в офис и видите что Ваша сетка просто напросто лежит. Или лежит определенный сегмент сети в котором не ходит не один пакет, хотя активность на карте есть и линк вполне даже существует. Перезагрузка свича по питанию частично решает проблему, но ненадолго. После некоторого времени проблема пропадает.

Всеми любимая фирма ASUS выпуская новые версии биоса для своих матерей, а именно до версии 1016 допустила досадную ошибку в поддержке ACPI. При кратковременном пропадании питания на машине, сетевая карта встаёт в непонятный режим и начинает гнать паразитный трафик в сеть. Из за этого трафика у свичей фирмы 3com срывает крышку. Причем свичи начинают отключаться каскадом, от низшего до центрального в течении 3 минут.

Выглядит это так.
Стоит машинка на Pro 100 VE воткнутая в 3Com OfficeConnect или 4250(или неуправляемый аналог)"Switch1". Далее в аплинк зацеплен "Switch2", потом корневой "Core".

Пропадает на короткий промежуток времени питание. Машина начинает гнать мусор в ближайший свитч(Switch1). Первым умирает свитчик(Switch2) который подключен к зараженному(Switch1), до него перестают ходить пинги, хотя внутри свича по прежнему они ходят. Внутри зараженного свича(Switch1) пакеты перестают ходить через 15 секунд после подключения. Через 60 секунд вышестоящий свитч(Switch2) перетаёт передавать пакеты вообще, активность на портах сменяется на елочную гирлянду, т.е. попеременное мигание четных и нечетных портов(в нормальном режиме порты мигают синхронно). Через 180 секунд корневой свитч(Core) получает заразу и также благополучно помирает оставляя всю сеть без связи.
Временным решением проблемы является выключение и включение питания на всех свичах.

Есть большое подозрение, что проблема с 3com свичами связана с кривой реализацией STP.
Решение проблемы:

Выключить питание на свичах верхнего уровня т.е. Core и Switch2.
Не трогая питание на компах и прочей периферии подключеннной к Switch2. Вдвоём с помощником включить питание Switch2 и внимательно смотреть на активность портов. В нормальном режиме на портах не должно быть трафика до начальной инициализации свича(5-10 секунд).
Найденный моргающий порт следует немедленно выключить из свича.
Он может быть не один смотрите внимательно.
После выдергивания патчкорда из моргающего порта необходимо найти к какому компьютеру или периферийному устройству он подключен и проверить состояние устройства. Желательно включить и выключить питание на устройстве независимо от типа.
Поочередно с задежкой в минуту воткнуть отключенные патчкорды обратно в свитч.

Для того чтобы максимально обезопасить свою сеть от таких "зависонов" рекомендую использовать корневые свичи отличные от 3Com, например Dell или Cisco. Кстати Dell 3048 также подвержен этой проблеме, будьте внимательны если имеете на вооружении такие железки. Ну и user area свичи тоже лучше использовать другой компании.

Данная проблема не лечится сменой firmware и заменой свича с одного на другой похожей модели если в сети остаётся "инфицированная машина или свитч".
Если во время диагностики Вы обнаружили что сетку вешает компьютер обязательно обновите ему BIOS. в старших версиях BIOS эта проблема решена. По поводу интеловых плат скажу, что проблема с мусором выходящим из сетевухи возникает от банального перегрева компа.

Можете считать данное описание бредом, можете в это не верить, но это действительно так. Вам принимать решение о выборе оборудования для построения сети. Это реальная история и реальный вариант решения проблемы.

Сори что сумбурно написано.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 сен 2007, 03:17 
Не в сети
Заслуженный сетевик

Зарегистрирован: 04 янв 2004, 00:30
Сообщения: 1108
Откуда: Н.Новгород
Может таки проще отключить STP или верно его настроить? Дело-то простое. Отключить функцию Fast Start на межкоммутаторных портах, вот и все.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 сен 2007, 09:00 
Не в сети
Power member
Аватара пользователя

Зарегистрирован: 13 сен 2007, 12:20
Сообщения: 48
Откуда: оттуда ;)
А что делать с неуправляемыми коммутаторами которые имеют такую же проблему. Может и не в STP проблема, это просто предположение.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 сен 2007, 13:32 
Не в сети
Заслуженный сетевик

Зарегистрирован: 04 янв 2004, 00:30
Сообщения: 1108
Откуда: Н.Новгород
Ну уж нет. Давайте подходить к решению вопросов профессионально.
Я бы подключил снифер к порту и понюхал трафик, дабы поглядеть что там такого странного идет. Паразитный трафик и его источник вычислится на раз. И не надо по всей сети бегать и все отключать и последовательно включать.

Ну и коль скоро пользуете сетевое оборудование одного вендора, то ходите раз в неделю на сайт и глядите на FirmWare железа. Или на список рассылки подпишитесь.

Банальные вещи в общем-то говорю...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 сен 2007, 13:41 
Не в сети
Power member
Аватара пользователя

Зарегистрирован: 13 сен 2007, 12:20
Сообщения: 48
Откуда: оттуда ;)
давайте я не против :)

на всех управляемых свичах последняя возможная фирмварь.
предлагаете обновить фирмварь на неуправляемом свиче ?
интересно как ?

подключать снифер к какому свича порту из 50 ? ;)
я нюхал, tcpdump молчал. эта проблема не на уровне протоколов.
это ниже. был бы хаб, может быть и увидел бы чтонибудь.

Именно через BSD и были выяснены временные рамки каскадного отключения свичей.

Руками данный трюк с картой повторить невозможно, это случайная вещь.

Вещи-то банальные и все это знают, в том числе и я. просто иногда банальные вещи не укладываются в здравый смысл и приходится танцевать с бубном.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 сен 2007, 15:47 
Не в сети
Заслуженный сетевик

Зарегистрирован: 04 янв 2004, 00:30
Сообщения: 1108
Откуда: Н.Новгород
Отзеркалируйте на снифер порты, которые смотрят на другие коммутаторы. Вот и все.

Естественно зеркалирование возможно только на управляемых свичах.

Сетевая карта генерирует фреймы. Именно от их содержимого свичи падают, а не от чего-то мифического. Фреймы и увидите в снифере. tcpdump довольно примитивная софтинка. WireShark более правильная тулза.

Смею предположить, что проблемы ваши действительно из-за STP. Вернее из-за неверно настроенной конфигурации портов. На межкоммутаторных линках надо обязательно отключать функции Fast Start. Иначе петелька может образоваться. Есть петелька - есть и шторм. Есть шторм - автоматически включаются функции его подавления. Функция подавления работает примитивно, просто на некотрое время прекращается передача трафика. Когда это происходит в CORE, то встает вся сеть.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 сен 2007, 16:02 
Не в сети
Power member
Аватара пользователя

Зарегистрирован: 13 сен 2007, 12:20
Сообщения: 48
Откуда: оттуда ;)
tcpdump назвал чтоб не пугать народ незнакомый с tshark.
Storm Control включен. Петель нету.

В общем проблему я решил заменой свичей на другие модели, с одной стороны не правильно, но времени на эксперименты в сети на 500 абонентов обычно нет.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 сен 2007, 23:39 
Не в сети
Заслуженный сетевик

Зарегистрирован: 04 янв 2004, 00:30
Сообщения: 1108
Откуда: Н.Новгород
Замена - это правильно. Сам на Циску меняю 3COM-ы.

Я говорил про методы анализа. Может кому полезно будет.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 16 сен 2007, 19:36 
Не в сети
Advanced member

Зарегистрирован: 26 янв 2006, 10:15
Сообщения: 435
Откуда: Moscow
and3008 писал(а):
Замена - это правильно. Сам на Циску меняю 3COM-ы.


Киска самая адекватная сетевая железка ...
намного лучше всяких алкатель, трисом, каблетрон ( ныне интерасис)
и пр.

-=Жека=- писал(а):
но времени на эксперименты в сети на 500 абонентов обычно нет.


гы, это наш один этаж ... одного корпуса ...

тут нечего экспериментировать ... 500 человек вполне умещаются
в один бродкастовый сегмент, можно не мухоморить с виланами
и подсетями ...


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 21 сен 2007, 12:20 
Не в сети
Power member
Аватара пользователя

Зарегистрирован: 13 сен 2007, 12:20
Сообщения: 48
Откуда: оттуда ;)
MasterDVDselect писал(а):
and3008 писал(а):
Замена - это правильно. Сам на Циску меняю 3COM-ы.


Киска самая адекватная сетевая железка ...
намного лучше всяких алкатель, трисом, каблетрон ( ныне интерасис)
и пр.

-=Жека=- писал(а):
но времени на эксперименты в сети на 500 абонентов обычно нет.


гы, это наш один этаж ... одного корпуса ...

тут нечего экспериментировать ... 500 человек вполне умещаются
в один бродкастовый сегмент, можно не мухоморить с виланами
и подсетями ...


проблемы начинаются при /22 и /16 :)


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 14 ноя 2007, 00:56 
Не в сети
Junior member

Зарегистрирован: 14 ноя 2007, 00:10
Сообщения: 17
Откуда: Москва
Тоже разочаровался в трикоме, но на циску бюджета не хватает :-(
Поэтому перехожу на NETGEAR - нравятся мне они качественным подходом к изготовляемому оборудованию.
http://www.netgear.net.ru/?WFi=37


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 25 ноя 2008, 10:41 
Не в сети
Junior member

Зарегистрирован: 25 ноя 2008, 10:12
Сообщения: 13
Откуда: Томск
Столкнулся с описанной проблемой. В нашем случае она четко возникает с одним "плохим" рабочим компом, который работает круглосуточно. Вначале на нем стояла встроенная карта Intel Pro/100 VE, потом когда впервые возникла данная проблема, стали в части набора статистики менять конфигурацию, пробовали ставить внешнюю карту 3Com905TX. Не помогает.

Проблема возникает как правило во время перезагрузки плохого компа и сеть как описано выше встает колом. В дальнейшем перенесли винду на другую материнку - проблема осталась.

Инфрастуктура построена на оборудовании 3Com. Комп в ходе опытов подключался к следующим свичам 3Com Office Connect+, 3Сom 3300XM, 3Com 4200 (в данное время). Еще есть в мыслях переставить винду на нем, но сомневаюсь что поможет.

По поводу такой опции как FastStart у него нет. STP сейчас включено.

Кто-нибудь раскопал еще какую информацию по этой проблеме или единственное решение, как кто-то предлагал выше - только Cisсo?


Вернуться к началу
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: 25 ноя 2008, 22:15 
Не в сети
Заслуженный сетевик

Зарегистрирован: 04 янв 2004, 00:30
Сообщения: 1108
Откуда: Н.Новгород
www.wireshark.org

Скачайте, запустите, сниферните трафик, подумайте.


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 26 ноя 2008, 10:44 
Не в сети
Junior member

Зарегистрирован: 25 ноя 2008, 10:12
Сообщения: 13
Откуда: Томск
Спасибо за наводку на софт, поглядел, сейчас за мануал принялся, только не совсем понял - та версия которую они раздают 1.04 бесплатная или полнофункциональная?

И еще - что в данном случае сниферить, как предлагали выше зеркалить порт плохого компа на свободный порт свича и анализировать или ...?


Вернуться к началу
 Профиль  
 
СообщениеДобавлено: 26 ноя 2008, 11:09 
Не в сети
Junior member

Зарегистрирован: 25 ноя 2008, 10:12
Сообщения: 13
Откуда: Томск
Почитал мануал, в инете глянул - первый вопрос вроде отпал.

А второй вопрос до сих пор актуален - как все-таки в данном случае зацепиться и слушать трафик?

Искал как зеркалить порт на свиче 3Com 4200 (3c17302) и не нашел.

Как оно (зеркалирование) именуется в английских терминах или у 3Com есть своя технология для этого которая вообще по другому называется?


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 25 ]  На страницу 1, 2  След.

Часовой пояс: UTC + 3 часа [ Летнее время ]


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB