Spamassasin и русские кодировки!!!

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
andyics
Junior member
Сообщения: 9
Зарегистрирован: 08 фев 2007, 09:48
Откуда: Москва

Spamassasin и русские кодировки!!!

Сообщение andyics » 26 сен 2008, 13:57

Как приспособить spamassassin для распознавания кои8,1251.UTF8 в локальных правилах , возможно ли это ? (ver 3.2.5)

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 26 сен 2008, 17:24

вопрос не очень понятный

может быть это вас спасёт :
ok_locales                              ru en                                                                                                      
report_charset                          windows-1251

а может быть вы беспокоетесь за распазнование обучаемого содержания подсистемой баеса, не беспокойтесь - нейросети пофигу в какой кодировке ваши письма.

andyics
Junior member
Сообщения: 9
Зарегистрирован: 08 фев 2007, 09:48
Откуда: Москва

Сообщение andyics » 26 сен 2008, 18:13

Например , я написал свое body c русскими словами , но срабатывает только , что идет в кодировке , которая прописана у меня во FreeBSD (Например RU.CP1251) если текст в кои или UTF8 то со свистом пролетает! Может что надо в local.cf добавить , чтобы во всех кодировках распознавалось ?

Аватара пользователя
RedScorp
Advanced member
Сообщения: 158
Зарегистрирован: 24 июл 2003, 11:01
Откуда: Западный Казахстан, г.Уральск
Контактная информация:

Сообщение RedScorp » 07 окт 2008, 15:34

На счет собственных правил, недавно прикручивал (точнее подложил) "Русские правила для SpamAssassin" в виде одного файлика (статью взял на opennet.ru) После перезапуска spamassassin'a в логах /var/log/mailllog проскакивают записи из которых видно под какие правило попало письмо:
Oct  7 13:26:02 dream spamd[2669]: spamd: result: Y 21 - BAYES_99,DATE_IN_FUTURE_12_24, HELO_DYNAMIC_IPADDR2,HELO_DYNAMIC_SPLIT_IP, HTML_MESSAGE,RCVD_IN_PBL,RCVD_NUMERIC_HELO, RDNS_NONE,RU_CERTIFICATE_KOI8,RU_CLASSES_KOI8, RU_LAWYERS_KOI8,RU_SPAM_KOI8 scantime=7.2,size=20936,user=spam,uid=513,required_score=5.0,rhost=localhost, raddr=127.0.0.1,rport=43842,mid=<04367848.20081007205656@zapgosexpert.kz>, bayes=1.000000,autolearn=spam

Oct  7 13:26:06 dream spamd[2668]: spamd: result: Y 21 - BAYES_99,DATE_IN_FUTURE_12_24,HELO_DYNAMIC_IPADDR2, HELO_DYNAMIC_SPLIT_IP,HTML_MESSAGE,RCVD_IN_PBL, RCVD_NUMERIC_HELO,RDNS_NONE,RU_CERTIFICATE_KOI8, RU_CLASSES_KOI8,RU_LAWYERS_KOI8,RU_SPAM_KOI8 scantime=3.6,size=22724,user=drweb,uid=513,required_score=5.0,rhost=localhost, raddr=127.0.0.1,rport=43846,mid=<04367848.20081007205656@zapgosexpert.kz>, bayes=1.000000,autolearn=spam

Oct  7 14:25:57 dream spamd[2668]: spamd: result: . 4 - BAYES_99,HTML_MESSAGE,RU_CERTIFICATE_KOI8 scantime=2.3,size=19824,user=drweb,uid=513,required_score=5.0,rhost=localhost, raddr=127.0.0.1,rport=33742,mid=<000501c9285d$0159d207$101421ab@udpweytd>,bayes=1.000000,autolearn=no

Oct  7 15:25:55 dream spamd[2668]: spamd: result: Y 12 - BAYES_99,FH_HELO_EQ_D_D_D_D,HELO_DYNAMIC_IPADDR, RCVD_IN_PBL,RCVD_IN_SORBS_DUL,RDNS_DYNAMIC, RU_CLASSES_KOI8,RU_LAWYERS_KOI8, RU_PHONE_TARIFFS_KOI8,RU_SPAM_KOI8 scantime=1.1,size=3492,user=drweb,uid=513,required_score=5.0, rhost=localhost,raddr=127.0.0.1,rport=33786,mid=<000401c92860$03fd96c4$69695985@ngbnfm>, bayes=1.000000,autolearn=no
В проверки должны попадать строки с "RU_". Щас в довесок спамеры стихами пишут, без мата, без порно фоток.

PS. Откорректировал лог.
Последний раз редактировалось RedScorp 07 окт 2008, 15:53, всего редактировалось 2 раза.

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 07 окт 2008, 15:49

А ведь работает !
спасибо большое

Аватара пользователя
RedScorp
Advanced member
Сообщения: 158
Зарегистрирован: 24 июл 2003, 11:01
Откуда: Западный Казахстан, г.Уральск
Контактная информация:

Сообщение RedScorp » 07 окт 2008, 16:03

Да, действительно правила работают. Я как-то с первого раза и не заметил (пришлось править предыдущий пост). Вот только в самом файле "99_russian_re.cf" правила надо дописать "под себя".
"Я сюда еще вернусь..." (А.Макаревич)

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 07 окт 2008, 18:01

да, там много правил которые могут помешать нормальной работе, но идея хороша :)
связался с автором по поводу получить скрипт для преобразования правил в удобочитаемой форме (# UTF8: "(порн((о)|(у)))|(эроти((к)|(ч)))|...) к варианту возможных написаний (Quoted-printable в разных кодировках большими и малыми буквами, подмена русских букв латинскими)

andyics
Junior member
Сообщения: 9
Зарегистрирован: 08 фев 2007, 09:48
Откуда: Москва

Сообщение andyics » 10 окт 2008, 17:03

И все-таки , можно ли используя локаль UTF8 , распознавать все кодировки ? normalize_charset 1 ведь для чего-то нужен ?

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 10 окт 2008, 17:54

andyics писал(а):И все-таки , можно ли используя локаль UTF8 , распознавать все кодировки ? normalize_charset 1 ведь для чего-то нужен ?
тут глубже проблемма - спамеры не дураки же.
обычно пишется слово в котором одна из букв например А заменяется на латинскую аналогичного написания.
так что просто нормализация тут не поможет - нужны комплексные правила.

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 23 окт 2008, 13:26

на сайте http://sa-russian.narod.ru/ выложен обновленный скрипт для генерации собственных правил

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 17 гостей