sa-learn

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

Аватара пользователя
corvax
free-lance moderator
Сообщения: 877
Зарегистрирован: 06 авг 2004, 17:21
Откуда: Kiev, Ukraine
Контактная информация:

Re: базы для обучения

Сообщение corvax » 11 апр 2006, 10:36

seus писал(а):
corvax писал(а):так это не просто уменьшение токенов. это исключение из веса токенов результатов обучения конкретным письмом.
это я с самого ничала и имел в виду :)
corvax писал(а):в вашем случае этого легче достичь, просто исключив заранее из обучения письма чужие, которые вы не считаете спамом. в общем, обучайте как знаете... особенно, если у вас пользователей много...
 

понятно ... это когда она есть, а если самих писем нет, то это наверное единственное решение, при условии использования чужой базы
вы не сможете использовать опцию --forget, если у вас нет писем, с помощью которых обучалась данная база байеса
это видно было из того фрагмента мана, который процитировал я
а вы захотели в мане увидеть лишь тот фрагмент, который процитировали вы
--
/corvax

Ruslan.Ivanov
Junior member
Сообщения: 13
Зарегистрирован: 17 авг 2006, 12:29
Контактная информация:

Сообщение Ruslan.Ivanov » 17 авг 2006, 12:35

SpamAssassin version 3.1.1
Вопрос по sa-learn.
Настроил работу самообучения, все нужные файлы создались, работает.
Видно, что файлы bayes_seen, bayes_toks растут.
Но, когда пытаюсь запустить sa-learn --dump, выдается ошибка :
ERROR: Bayes dump returned an error, please re-run with -D for more information

параметр -D это дебаг-левел насколько я понял. Но как им пользоваться и как он мне может помочь?

Спасибо.

Также, есть просьба поделиться статей по настройке самообучения на русском.

Аватара пользователя
corvax
free-lance moderator
Сообщения: 877
Зарегистрирован: 06 авг 2004, 17:21
Откуда: Kiev, Ukraine
Контактная информация:

Сообщение corvax » 18 авг 2006, 19:26

Ruslan.Ivanov писал(а):SpamAssassin version 3.1.1
Вопрос по sa-learn.
Настроил работу самообучения, все нужные файлы создались, работает.
Видно, что файлы bayes_seen, bayes_toks растут.
Но, когда пытаюсь запустить sa-learn --dump, выдается ошибка :
ERROR: Bayes dump returned an error, please re-run with -D for more information

параметр -D это дебаг-левел насколько я понял. Но как им пользоваться и как он мне может помочь?
а может таки попробовать запустить sa-learn --dump -D и проанализировать вывод этой команды?
--
/corvax

Ruslan.Ivanov
Junior member
Сообщения: 13
Зарегистрирован: 17 авг 2006, 12:29
Контактная информация:

Сообщение Ruslan.Ivanov » 19 авг 2006, 12:03

Благодарю.
[3603] dbg: bayes: no dbs present, cannot tie DB R/O: /home/user1/.spamassassin/bayes_toks
[3603] dbg: config: score set 1 chosen.
[3603] dbg: bayes: no dbs present, cannot tie DB R/O: /home/user1/.spamassassin/bayes_toks

Результаты работы дебага.

С этим разобрался явно указав путь в конфиге.
Нюанс : важно в конце пути указывать формат файла /../bayes
Т.е. если файлы лежат в /usr/etc/spam, то писать надо
/usr/etc/spam/bayes

Парни, если у кого-то есть грамотный док по настройке самообучения, то подкиньте.
Т.к. мне все равно неясны такие моменты :
Если в спам зашло правильное письмо и его запомнил самообучающийся механизм?
или наоборот. Если не отловил.
Как работает схема начисления балов - я тут мельком видел пару примеров, что спамассассин начисляет или отнимает балы в зависимости от типа письма - спам\хам. Как это работает при байесе?

Спасибо заранее.

Аватара пользователя
corvax
free-lance moderator
Сообщения: 877
Зарегистрирован: 06 авг 2004, 17:21
Откуда: Kiev, Ukraine
Контактная информация:

Сообщение corvax » 19 авг 2006, 13:05

Ruslan.Ivanov писал(а):С этим разобрался явно указав путь в конфиге.
Нюанс : важно в конце пути указывать формат файла /../bayes
Т.е. если файлы лежат в /usr/etc/spam, то писать надо
/usr/etc/spam/bayes
после последнего слеша указан не формат файла, а префикс имен файлов
Ruslan.Ivanov писал(а):Парни, если у кого-то есть грамотный док по настройке самообучения, то подкиньте.
это все указано в общей документации по spamassassin'у
никакой отдельной документации по самообучению практически наверняка не существует. там всего несколько параметров в настройках связаны с самообущением
Ruslan.Ivanov писал(а):Т.к. мне все равно неясны такие моменты :
Если в спам зашло правильное письмо и его запомнил самообучающийся механизм?
этот набор слов не дотягивает до внятной формулировки вопроса
Ruslan.Ivanov писал(а):или наоборот. Если не отловил.
кроме самообучения есть еще принудительное, которое является основным. что вы уперлись в это самообучение?
Ruslan.Ivanov писал(а):Как работает схема начисления балов - я тут мельком видел пару примеров, что спамассассин начисляет или отнимает балы в зависимости от типа письма - спам\хам. Как это работает при байесе?

Спасибо заранее.
--
/corvax

Ruslan.Ivanov
Junior member
Сообщения: 13
Зарегистрирован: 17 авг 2006, 12:29
Контактная информация:

Сообщение Ruslan.Ivanov » 19 авг 2006, 15:01

Ок. набор слов пока не созрел в вопрос.
Буду разбираться.
Спсб.

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и 16 гостей