• Bogofilter- skuteczny filtr spamu

    dodany przez Przemysław Sikora

    W obecnych czasach praktycznie każdy korzysta z poczty elektronicznej.  Ilość wiadomości przesyłanych w sieci rośnie z każdym dniem. Niestety nawet do 90 % stanowi spam, co jest niezwykle uciążliwe dla użytkowników, jak i administratorów, którzy muszą “trzymać rękę na pulsie” i uaktualniać swoje zabezpieczenia. Chciałbym dzisiaj przybliżyć konfigurację i wdrożenie narzędzia o nazwie Bogofilter, którego działanie opiera się na analizie statystycznej wiadomości (zarówno treści, jak i nagłówków). Na podstawie posiadanej bazy, która tworzy się na bieżąco w trakcie uczenie przez nas, Bogofilter określa prawdopodobieństwo, czy dana wiadomość jest niepożądana. Oczywiście im większą ilością wiadomości będziemy uczyć nasz filtr, tym lepsze będą efekty jego działa. Przystąpmy do instalacji. Pakiet o nazwie “bogofilter” znajduje się w repozytorium EPEL.

    yum install bogofilter

    Konfiguracja znajduje się w pliku “/etc/bogofilter.cf”. Najważniejsze elementy do skonfigurowania poniżej:

    bogofilter_dir=/var/spool/bogofilter

    Miejsca gdzie znajdować się będzie centralna baza danych (dla wszystkich użytkowników) naszego filtra. Alternatywa poniżej:

    bogofilter_dir=~/.bogofilter

    W katalogu każdego użytkownika utworzony zostanie katalog “.bogofilter”, w którym znajdować się będzie spersonalizowana baza danych w pliku “wordlist.db”.

    user_config_file=ścieżka_do_pliku

    Istnieje możliwość spersonalizowania ustawień filtra dla każdego użytkownika. Domyślnie opcja ta jest zakomentowana, co powoduje korzystanie przez wszystkich z ustawień w pliku “/etc/bogofilter.cf”.

    spam_header_name=dowolna_nazwa”

    Możemy określić nazwę nagłówka, który będzie zawierał informacje o prawdopodobieństwie spamu dostarczone przez Bogofilter.

    spam_subject_tag=***SPAM***

    Do tematu wiadomości zaklasyfikowanej jako spam zostanie dodany znacznik (w tym przypadku ***SPAM***). Jeśli omawiana opcja jest zakomentowana, temat wiadomości nie ulega zmianie.

    spamicity_tags = Spam, Ham, Unsure

    Możliwe oznaczenia klasyfikacyjne wiadomości, umieszczone w nagłówku. Alternatywa poniżej:

    spamicity_tags = Yes, No, Unsure

    Określenie, od jakiego progu prawdopodobieństwa, wiadomość jest klasyfikowana jako “ham”, czyli pożądana.

    ham_cutoff = 0.45

    Jeśli wpisana wartość, będzie wynosić “0”, oznacza, że wiadomości będą klasyfikowane tylko jako “spam” lub “ham).

    spam_cutoff= 0.99

    Określenie, od jakiego progu prawdopodobieństwa, wiadomość jest klasyfikowana jako “spam”.
    Teraz czas na implementację omawianego narzędzia na naszym serwerze pocztowym. Najprostszym sposobem jest wykorzystanie do tego procmaila. Możemy dopisać poniższe linie do globalnego pliku konfiguracyjnego “/etc/procmailrc” lub do konkretnym użytkownikom w ich w pliku “~/.procmailrc”:

    :0fw
    | /usr/bin/bogofilter -uep

    Aby przetestować działanie narzędzia wystarczy wysłać wiadomość na skrzynkę działającą na serwerze i sprawdzenie, czy w nagłówku wiadomości widnieje tak lub podobny wpis:

    X-Bogosity: Spam, tests=bogofilter, spamicity=1.000000, version=1.2.2

    Filtr można “karmić” zarówno wiadomościami pożądanymi, jak i nie. Dla wiadomości (skrzynek) w formacie mbox należy:

    bogofilter -s < nazwa

    w przypadku spamu

    bogofilter -n < nazwa

    w przypadku hamu (wiadomości pożądanych)

    bogofilter -B -s /home/przemek/Maildir/.Trash

    w przypadku spamu dla formatu Maildir

    bogofilter -B -n /home/przemek/Maildir/.Trash

    w przypadku hamu (wiadomości pożądanych) dla formatu Maildir

    bogofilter -M -s -I /home/przemek/mail/Trash

    w przypadku spamu w folderach (format mbox)

    bogofilter -M -n -I /home/przemek/mail/Trash

    w przypadku hamu (wiadomości pożądanych) w folderach (format mbox)
    Należy pamiętać o w miarę wyrównanym poziomie uczenie, czyli, żeby nie “korzystać” tylko z wiadomości pożądanych lub o charakterze spamu. W razie problemów zapraszam do komentowania i na nasze forum.

Komentarze do “Bogofilter- skuteczny filtr spamu”

  1. Celia pisze:

    Hmm ciekawa opcja.Chodzilo to za mna juz od dlzuszego czasu, jednak nigdy nie mialem ochoty szperac po klasach adresowych i wylawiac azjatow dodalem sobie do PF`a na routerze Od siebie dodam tez, ze warto wyciac troche klas z USA i Rosji (kierujac sie np zawartoscia roznych czarnych list spamerskich

Dodaj komentarz

Warto odwiedzić
Valid XHTML 1.0 Transitional centos.com.pl- mapa strony