Bogofilter

Bogofilter ist ein Postfilter, der E-Mail als spam oder Schinken (non-spam) durch eine statistische Analyse des Kopfballs und Inhalts der Nachricht (Körper) klassifiziert. Das Programm ist im Stande, von den Klassifikationen und Korrekturen des Benutzers zu erfahren. Es wurde von Eric S. Raymond ursprünglich geschrieben, und wird jetzt zusammen mit einer Gruppe von Mitwirkenden von David Relson, Matthias Andree und Greg Louis aufrechterhalten.

Die statistische verwendete Technik ist als Entstörung von Bayesian bekannt, und sein Gebrauch für spam wurde zuerst von Forschern an Microsoft in der Zeitung Eine Bayesian-Annäherung an die Durchscheinende Trödel-E-Mail beschrieben. Gary Robinson, in seinen weblog Wortschwallen, schlägt einige Verbesserungen für das verbesserte Urteilsvermögen zwischen spam und Schinken vor. Der primäre Algorithmus von Bogofilter verwendet den f (w) Parameter und das Gegenteil von Fisher Chi-Quadrattechnik, die er beschreibt.

Bogofilter wird durch eine MDA Schrift geführt, um eine eingehende Nachricht als spam oder Schinken zu klassifizieren (wordlists versorgt von BerkeleyDB, SQLite3 oder QDBM verwendend). Bogofilter stellt Verarbeitung für den Klartext und das HTML zur Verfügung. Es unterstützt Mehrteil-PANTOMIME-Nachricht mit der Entzifferung von base64, angesetzt - druckfähiger und uuencoded Text und ignoriert Verhaftungen wie Images.

Standardtests in TREC 2005 zeigen, dass sich Bogofilter gut mit seinen Mitbewerbern spambayes, CRM114 und DSPAM vergleicht. Andere Mitbewerber schließen ein, aber werden auf Spamprobe und QSF nicht beschränkt.

Bogofilter wird in C geschrieben, und läuft auf Linux, FreeBSD, NetBSD, OpenBSD, Solaris, Mac OS X, HP-UX, AIX und anderen Plattformen und wird unter dem GNU GPL befreit.

Siehe auch

Links

Dieser Artikel oder eine frühere Revision davon, wurde von der Einstiegsseite von bogofilter editiert.


Sandra Kim / Austenite
Impressum & Datenschutz