Проблема с зависанием сервера

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

dmp
Advanced member
Сообщения: 80
Зарегистрирован: 07 апр 2006, 13:42
Откуда: Troitsk

Проблема с зависанием сервера

Сообщение dmp » 30 июн 2008, 11:23

Решительно Всех приветствую !!

Проблема: примерно раз в несколько дней полностью зависает сервер, лечится только перезагрузкой кнопкой ресет на сервере
OS FreeBSD 7.0 , MPD5, IPNAT (скомпилен как large nat), IPFW
Сервер Supermicro на базе CPU: Intel(R) Core(TM)2 Quad CPU    Q6600  @ 2.40GHz   ,  4 G  оперативки
Установлено 3 таких сервера с одинаковым софтом и одинаковыми конфигами, но зависает только один.
На консоле такое сообщение

Fatal trap 12: page fault while in kernel mode
cpuid = 0; apic id = 00
fault virtual address   = 0x4
fault code              = supervisor read, page not present
instruction pointer     = 0x20:0x80492f07
stack pointer           = 0x28:0xf07ad904
frame pointer           = 0x28:0xf07ad97c
code segment            = base 0x0, limit 0xfffff, type 0x1b
                       = DPL 0, pres 1, def32 1, gran 1
processor eflags        = interrupt enabled, resume, IOPL = 0
current process         = 34 (dummynet)
trap number             = 12
panic: page fault
cpuid = 0
Uptime: 1d16h13m28s
Physical memory: 3317 MB

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 30 июн 2008, 11:46

Конфигурацию напишите пожалуйста полностью.
У нас вакансия телепата постоянно открыта...

dmp
Advanced member
Сообщения: 80
Зарегистрирован: 07 апр 2006, 13:42
Откуда: Troitsk

Сообщение dmp » 30 июн 2008, 13:04

SuperServer 5015B-MTB, 1U, X7SBi, SC813MT-300C
Intel Core 2 Quad Q6600 2.4GHc-1006, cache 8MB, LGA775
ECC, DDRII-667 4GB (4 планки по 1 GB)
Seagate ST3250310AS, 250G  - 2шт (в режиме Mirror)

squirL
Advanced member
Сообщения: 114
Зарегистрирован: 11 апр 2006, 20:16
Откуда: Киев

Сообщение squirL » 30 июн 2008, 20:36

dmp писал(а):SuperServer 5015B-MTB, 1U, X7SBi, SC813MT-300C
Intel Core 2 Quad Q6600 2.4GHc-1006, cache 8MB, LGA775
ECC, DDRII-667 4GB (4 планки по 1 GB)
Seagate ST3250310AS, 250G  - 2шт (в режиме Mirror)
рекомендую вам прочитать вот это:

http://www.freebsd.org/doc/en_US.ISO885 ... LESHOOTING

и действовать на основании прочитанного. самостоятельно анализировать причины падения - штука нетривиальная, поэтому пишите PR :-)

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 01 июл 2008, 12:12

Я совсем не спец по фре, но это:
ECC, DDRII-667 4GB (4 планки по 1 GB)
и это
Physical memory: 3317 MB
Наводит на мысли, что что-то где-то сделано/настроено неверно (относительно ОЗУ). ОС должна видеть все 4 ГБ по идее.
Второй момент: память memtest'ом гонять не пробовали ?

dmp
Advanced member
Сообщения: 80
Зарегистрирован: 07 апр 2006, 13:42
Откуда: Troitsk

Сообщение dmp » 01 июл 2008, 17:59

to squirL
Отладку ядра посмотрел, понажимал клавиши, но не все понятно-((

Все 3  сервера видят 3317 МВ, память тестировал - все ОК!
Скорее всего сервер виснет из за вирусов, которые перегружают IPFW + IPNAT  .

Может надо ядро скомпилить с PAE, чтобы видел 4 Gb?
Стабильность системы при этом не уменьшится ?
Последний раз редактировалось dmp 03 июл 2008, 14:47, всего редактировалось 1 раз.

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 02 июл 2008, 12:16

Вирусы во фре ?
может я от жизни отстал "а мужики то и не знают ... "


Вообще очень похоже на ошибки в свопе (физические бэд блоки на винте )

попробуйте отключть или перенести своп в другое место (раздел/файл)

http://www.freebsd.org/doc/en_US.ISO885 ... space.html

Andrey N. Oktyabrski
Advanced member
Сообщения: 229
Зарегистрирован: 25 окт 2005, 09:30
Откуда: Краснодар

Сообщение Andrey N. Oktyabrski » 02 июл 2008, 13:16

Система давно обновлялась? Если да, обновите.
Там всегда current process = NN (dummynet)? Попробуйте выключить dummynet. Вместо него вполне можно в подавляющем большинстве случаев пользоваться altq (pf).

dmp
Advanced member
Сообщения: 80
Зарегистрирован: 07 апр 2006, 13:42
Откуда: Troitsk

Сообщение dmp » 02 июл 2008, 16:45

На сервере порядка 450 пользователей PPtP, от некоторых вирусы и заваливают IPFW + IPNAT , создавая оч. большой трафик.
Настроил логирование IPFW , начал отключать людей за вирусы, в основном идет оч. большая рассылка по 25 порту.
На PF быстро не смогу перейти, надо разбираться с настройками и конфигами.
Диски новые, серверу около 1 месяца, бэд блоков не должно быть, покупалось все в тринити.
Систему ставил месяц назад, весь софт свежий.
Оптимизировал IPFW  -  что можно было, перевел в режим таблиц.

squirL
Advanced member
Сообщения: 114
Зарегистрирован: 11 апр 2006, 20:16
Откуда: Киев

Сообщение squirL » 03 июл 2008, 01:19

a_shats писал(а):
Physical memory: 3317 MB
Наводит на мысли, что что-то где-то сделано/настроено неверно (относительно ОЗУ). ОС должна видеть все 4 ГБ по идее
это нормально.

dmp
вы вот что - попробуйте убрать ipnat, заменить его на pfnat. есть вариант, что это он виноват.

трейс дампа можете сюда выложить?

Andrey N. Oktyabrski
Advanced member
Сообщения: 229
Зарегистрирован: 25 окт 2005, 09:30
Откуда: Краснодар

Сообщение Andrey N. Oktyabrski » 03 июл 2008, 10:00

На PF быстро не смогу перейти, надо разбираться с настройками и конфигами.
На него не надо переходить быстро. Для начала достаточно заменить им ipnat, как уже посоветовали. После этого можно на него переходить постепенно, с ipfw он вполне может совместно работать.

squirL
Advanced member
Сообщения: 114
Зарегистрирован: 11 апр 2006, 20:16
Откуда: Киев

Сообщение squirL » 03 июл 2008, 12:12

На PF быстро не смогу перейти, надо разбираться с настройками и конфигами.
я думаю прописать в конфиге
nat on $ext_if from $internal_net to any -> ($ext_if)
pass all
это не сильно сложно :) а шейпинг, if any, оставить на ipfw.
кроме того в ipfw уже есть ядерный NAT, можно переейти и на него.
если все же решитесь на совмещение - почитайте
http://www.opennet.ru/tips/info/1431.shtml

dmp
Advanced member
Сообщения: 80
Зарегистрирован: 07 апр 2006, 13:42
Откуда: Troitsk

Сообщение dmp » 03 июл 2008, 14:42

кусок трэйс дампа с сервера, или надо было что то другое ?

Код: Выделить всё

vpn3# traceroute bmw.de
traceroute to bmw.de (160.46.244.132), 64 hops max, 40 byte packets
 1  * * *
 2  62.117.92.42 (62.117.92.42)  2.433 ms  7.191 ms  5.882 ms
 3  212.162.9.5 (212.162.9.5)  50.315 ms  50.328 ms  50.228 ms
 4  ae-31-51.ebr1.Frankfurt1.Level3.net (4.68.118.30)  52.919 ms  56.565 ms
    ae-31-55.ebr1.Frankfurt1.Level3.net (4.68.118.158)  54.336 ms
 5  ae-4-4.car1.Munich1.Level3.net (4.69.134.1)  56.692 ms
    ae-1-100.ebr1.Frankfurt1.Level3.net (4.69.132.125)  53.833 ms  53.459 ms
 6  ae-4-4.car1.Munich1.Level3.net (4.69.134.1)  56.576 ms  56.692 ms
    62.140.24.10 (62.140.24.10)  52.279 ms
 7  te1-1.r2.muc2.m-online.net (212.18.6.58)  58.920 ms  52.208 ms  52.210 ms
 8  ge0-0.bmw-rt-02.m-online.net (88.217.152.134)  52.205 ms  51.832 ms  52.084 ms
А ограничение по скорости для безлимитных может пока оставить на радиусе ?
Уже в душе решился на преобразование системы , но надо изучить доки :shock: для начала.

Andrey N. Oktyabrski
Advanced member
Сообщения: 229
Зарегистрирован: 25 окт 2005, 09:30
Откуда: Краснодар

Сообщение Andrey N. Oktyabrski » 03 июл 2008, 14:55

:-)
Подозреваю, имелось в виду backtrace корки ядра в отладчике...

Ограничение по скорости - или в mpd, или средствами altq+cbq+ecn из того же pf.

squirL
Advanced member
Сообщения: 114
Зарегистрирован: 11 апр 2006, 20:16
Откуда: Киев

Сообщение squirL » 03 июл 2008, 18:48

Andrey N. Oktyabrski писал(а)::-)
Подозреваю, имелось в виду backtrace корки ядра в отладчике...
да, именно это.

PS: хорошо, что автор ifconfig не выложил :-)

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 18 гостей