Re: TALK: "Swen" kein Aufreger?

Autor: Robert Schiele (rschiele_at_uni-mannheim.de)
Datum: 22. Sep 2003


On Mon, Sep 22, 2003 at 12:49:53PM +0200, Jochen Lillich wrote:
> Am Son, 2003-09-21 um 09.59 schrieb Robert Schiele:
>
> > Ich selbst lerne meinem Spamfilter einfach, das sei Spam.
>
> Kannst du bitte mal deine Filter-Regeln posten? Wie fängst du die vielen
> Variationen ab?

Das sind keine hart kodierten Filter-Patterns, sondern das ist der Bayes'sche
Filter von SpamAssassin. Hart kodierte Patterns sind viel zu aufwendig zu
erstellen und zu ineffizient. Ich habe mir fuer meinen Mailreader einfach ein
paar Makros gemacht, mit denen ich die wenigen Spam-(Viren-)Mails, die noch
durchrutschen mit einem Tastendruck in die Feedbackschleife des Filters
schieben kann. Nachdem dies ein paar mal gemacht wurde, erkennt der Filter
auch diese neue "Art" von Spam.

Allgemein kann ich aus meiner Erfahrung sagen, dass hart kodierte Regeln
eigentlich nie den Aufwand lohnen, wenn du ein derart umfassendes Tool wie
SpamAssassin in einer sinnvollen Konfiguration einsetzt. Saemtliche eigenen
Skripte, die auf meinem System Daten aggregieren, die mir bei der
Spamklassifizierung helfen sollen, greifen nicht auf die Schnittstelle des
MTAs zu, sondern nutzen die API von SpamAssassin.

Der einzig wirkliche Nachteil von SpamAssassin ist, dass es in Perl
geschrieben ist und damit ziemlich langsam. Ich habe mir schon ueberlegt, ob
es sich lohnen wuerde, dass Ganze nach C++ zu portieren, aber bisher erschien
mir das Aufwand-/Nutzen-Verhaeltnis noch nicht gut genug.

Robert

-- 
Robert Schiele			Tel.: +49-621-181-2517
Dipl.-Wirtsch.informatiker	mailto:rschiele_at_uni-mannheim.de



Dieses Archiv wurde generiert von hypermail 2.1.7 : 22. Sep 2003 CEST