Балансировка обучения spamassassin

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Аватара пользователя
baksy
Junior member
Сообщения: 6
Зарегистрирован: 29 авг 2005, 15:02
Откуда: Москва
Контактная информация:

Балансировка обучения spamassassin

Сообщение baksy » 12 сен 2005, 19:29

Все очень просто и понятно при ручном обучении spamassassin'а путем залития сотни хама и сотни спама, но может быть кто нибудь смог добиться сбалансированного обучения при включенной опции bayes_auto_learn?
Дело собственно вот в чем:
Включены три опции bayes_auto_learn, bayes_auto_learn_threshold_nonspam, bayes_auto_learn_threshold_spam. При дефолтовой настройке обучению nonspam 0.1. Есть шанс что в базу попадет не то что надо, следовательно включать ее не желательно. При отрицательном значении похоже эта опция не работает.
В итоге получается перекос в базе Baeyes. Спамом обучаемся очень много а вот белых писем...

Может кто выходил из положения кроме как бегать по пользователям и таскать их почтовые базы.

Второй вопрос. Кто как борется с письмами вида: Без темы без тела письма, а только вложение в виде doc или xls. Оценочки такие письма цепляют очень и очень высокие. А ведь это любимый вид пересылки отчетов между филиалами.

Rid
Power member
Сообщения: 38
Зарегистрирован: 22 сен 2005, 15:48
Откуда: Ашгабат

письма твоих филиалов

Сообщение Rid » 23 сен 2005, 08:14

может добавишь свои филиалы в whitelist?
ПО крайней мере у меня вроде такие письма потом не проходят оценку.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: письма твоих филиалов

Сообщение Stranger03 » 26 сен 2005, 11:22

Rid писал(а):может добавишь свои филиалы в whitelist?
ПО крайней мере у меня вроде такие письма потом не проходят оценку.
Они проходят, просто им добавляются в + от 10 до 100 единиц в зависимости от оценок.

Аватара пользователя
corvax
free-lance moderator
Сообщения: 877
Зарегистрирован: 06 авг 2004, 17:21
Откуда: Kiev, Ukraine
Контактная информация:

Re: письма твоих филиалов

Сообщение corvax » 26 сен 2005, 11:31

Stranger03 писал(а):
Rid писал(а):может добавишь свои филиалы в whitelist?
ПО крайней мере у меня вроде такие письма потом не проходят оценку.
Они проходят, просто им добавляются в + от 10 до 100 единиц в зависимости от оценок.
наверное таки в минус, а не в плюс :)
--
/corvax

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: письма твоих филиалов

Сообщение Stranger03 » 26 сен 2005, 11:41

corvax писал(а):наверное таки в минус, а не в плюс :)
Ах, ну да, может быть. Что-то я уже очень давно не админил, забыл, :twisted:.

Аватара пользователя
baksy
Junior member
Сообщения: 6
Зарегистрирован: 29 авг 2005, 15:02
Откуда: Москва
Контактная информация:

Re: письма твоих филиалов

Сообщение baksy » 11 окт 2005, 15:37

Rid писал(а):может добавишь свои филиалы в whitelist?
ПО крайней мере у меня вроде такие письма потом не проходят оценку.
Это конечно. Хотя слово филиалы было приведено как пример. Многие просто любят так общаться.

Аватара пользователя
corvax
free-lance moderator
Сообщения: 877
Зарегистрирован: 06 авг 2004, 17:21
Откуда: Kiev, Ukraine
Контактная информация:

Re: письма твоих филиалов

Сообщение corvax » 11 окт 2005, 16:18

baksy писал(а):
Rid писал(а):может добавишь свои филиалы в whitelist?
ПО крайней мере у меня вроде такие письма потом не проходят оценку.
Это конечно. Хотя слово филиалы было приведено как пример. Многие просто любят так общаться.
создайте свое правило для пустых Subject и пустых body и давайте им -X баллов. если -X мало, то -Y баллов
--
/corvax

Makc
Junior member
Сообщения: 2
Зарегистрирован: 21 окт 2005, 07:46

Сообщение Makc » 21 окт 2005, 08:24

А у меня вот какая проблемка...В процесе обучения SA жрет все что ему даешь...съел уже наверное около 7000-10000 спама и 500-600 "ХАМ'а"...bayes_seen и bayes_toks пополняются, а вот auto_whitelist ни как не хочет и я так думаю, что из-за этого оценка BAYES в заголовке отсутствует и гдето 40-45%% спама пролазит...это уже второй почтовик на котором я настраивал SA, на том все работало...помогите кто чем может!!!

#AUTO_BAYES
use_auto_whitelist                      1
auto_whitelist_path     /etc/mail/spamassassin/auto_whitelist
auto_whitelist_file_mode                0666
use_bayes                               1
bayes_path              /etc/mail/spamassassin/bayes

Аватара пользователя
corvax
free-lance moderator
Сообщения: 877
Зарегистрирован: 06 авг 2004, 17:21
Откуда: Kiev, Ukraine
Контактная информация:

Сообщение corvax » 21 окт 2005, 13:59

Makc писал(а):А у меня вот какая проблемка...В процесе обучения SA жрет все что ему даешь...съел уже наверное около 7000-10000 спама и 500-600 "ХАМ'а"...bayes_seen и bayes_toks пополняются, а вот auto_whitelist ни как не хочет и я так думаю, что из-за этого оценка BAYES в заголовке отсутствует
оценки BAYES не могут присутствовать или отсутствовать из-за AWL
Makc писал(а):и гдето 40-45%% спама пролазит...это уже второй почтовик на котором я настраивал SA, на том все работало...помогите кто чем может!!!

#AUTO_BAYES
use_auto_whitelist                      1
auto_whitelist_path     /etc/mail/spamassassin/auto_whitelist
auto_whitelist_file_mode                0666
use_bayes                               1
bayes_path              /etc/mail/spamassassin/bayes
надо запустить spamd в дебаговом режиме и посмотреть, что он напишет на счет bayes'а
--
/corvax

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 14 гостей