kSpam

  • Hi,


    hab da mal ne Frage. Selber benutzen wir Domino 6.5.2 unter Linux und hab mir als Spam Filter kSpam ausgesucht. Da es frei ist und ich ne Domino interne Version gesucht hab.


    Nun wollte ich mal fragen ob jmd. anderes vllt. auch noch kSpam benutzt und einfach mal seine Erfahrungen mitteilen könnte. Denn mich würde einfach mal interessieren wie das Verhältniss mailspam/mailgood sein muss, damit man vernünftige Ergebnisse erzielt. Mir ist nämlich aufgefallen, das bei einigen Mailadressen, der Spam schon ziemlich gut gefiltert wird und Spam (bei anderen Adressen) doch noch extram stark ist.


    Benutz keine reg expression nur für einige bestimmte Ausdrücke und hab den Bayesian Filter an.


    Mich würde mal interessieren wie ich ein besseres Ergebnis erzielen kann/könnte und die Erfahrungen :roll: andere Nutzer.


    Gruß,
    Mirco

  • KSPAM kann Spam auf zwei arten erkennen. Durch die normalen Wortfilter (inkl. RegEx) oder Basis des Bayesianschen Filter, der alle eingehenden Mails analysiert und eine Wahrscheinlichkeit errechnet, nach der diese Mail Spam ist. Hierzu liest der BLOAD-Task in regelmässigen Abständen die MAILGOOD/MAILSPAM aus und erstellt darauf die COMBLIST.TXT, in der alle Wörter drin stehen, die eine Spam ausmachen können. Hier jedem Wort steht ein Zahlenwert, um den die Wahrscheinlichkeit erhöht wird, wenn das Wort enthalten ist.


    Wenn die Mailspam/Mailgood also ordentlich gefüllt sind, kommst Du auf relativ hohe Trefferquoten - Wichtig ist, dass Du die Trainingsphasen lange genug laufen lässt, um genung Mail zu sammeln.


    Ich würde min. 500-1000 Spam´s sammeln (ggf. COPY & Paste) und etwa die Hälfte bis 2/3 der Spam´s an "guten" Mails vorhalten.


    Das "Problem" von KSPAM ist, dass er natürlich keine "neuen" Spams erkennen kann, aus diesem grund sind strategisch wichtige RegEx notwendig: Halt für die üblichen Spammails mit "Viagra", " Pharamacy", "Rolex" usw.


    Ich bin insgesamt zufrieden, bin aber nicht sicher, ob KSPAM in einer Firmenumgebung die erste Wahl sein sollte.