Hallo an alle!
Ich hoffe daß in der Liste jemand anderen gibt der SpamAssassin benutzt...
Also, das Programm funktioniert wirklich sehr gut, aber ab un zu blockiert nicht E-Mail die SPAM sind...
Ich habe zum Beispiel heute gesehen, daß einige E-Mail werden von SpamAssassin erlaubt, mit einigen Warnungen in der Headers, und zwar einige von diesen:
NO_REAL_NAME RCVD_IN_BL_SPAMCOP_NET RCVD_IN_SORBS RCVD_IN_DSBL
Ich möchte daß wenn ein oder mehrere von diesen Header in der E-Mail sind, wird die E-Mail von SpamAssassin als SPAM markiert.
Ich möchte auch ein Filter über Subject konfigurieren, da jetzt einige SPAM E-Mail nicht gefilteret sind, warscheinlich weil diese Betreffe auf Deutsch sind.
Wer kann mir helfen mit diesen Probleme?
Danke! Luca Bertoncello (lucabert@lucabert.de)
Luca Bertoncello lucabert@lucabert.de writes:
Ich habe zum Beispiel heute gesehen, daß einige E-Mail werden von SpamAssassin erlaubt, mit einigen Warnungen in der Headers, und zwar einige von diesen:
NO_REAL_NAME RCVD_IN_BL_SPAMCOP_NET RCVD_IN_SORBS RCVD_IN_DSBL
Du mußt für diese Eigenschaften einfach die Bewertung so hoch setzen, daß sie über Deinem Limit liegt. Das machst Du in der Datei ~/.spamassassin/user_prefs.
Ich habe z.B. ein Limit von 1.4 damit gesetzt:
required_hits 1.4
und setze
score RCVD_IN_SORBS 0 1.500 0 1.500
Damit führt die Erkennung als RCVD_IN_SORBS sofort zur SPAM-Bewertung.
Welche Eigenschaften es neben RCVD_IN_SORBS noch gibt, kannst Du den .cf-Dateien in /usr/share/spamassassin entnehmen. Dich interessiert vermutlich z.B.
/usr/share/spamassassin/20_dnsbl_tests.cf
Ich möchte auch ein Filter über Subject konfigurieren, da jetzt einige SPAM E-Mail nicht gefilteret sind, warscheinlich weil diese Betreffe auf Deutsch sind.
Diese Mühe würde ich mir nicht machen. Dafür ist SpamAssassin da, der hat bereits allgemeinere Regeln für sowas, z.B. wieviele Bewertungspunkte viele Ausrufezeichen im Subject bekommen, oder alles Großschreibung und so.
Dafür solltest Du nur die Namen der Regeln in obengenannten Dateien finden und diese entsprechend Deinen Wünschen hochsetzen.
GreetinX Steffen
Steffen Schwigon schwigon@webit.de schrieb:
score RCVD_IN_SORBS 0 1.500 0 1.500
Damit führt die Erkennung als RCVD_IN_SORBS sofort zur SPAM-Bewertung.
OK! Vielen Dank!
Diese Mühe würde ich mir nicht machen. Dafür ist SpamAssassin da, der hat bereits allgemeinere Regeln für sowas, z.B. wieviele Bewertungspunkte viele Ausrufezeichen im Subject bekommen, oder alles Großschreibung und so.
Verstanden...
Noch eine Frage: hast du schon sa-learn benutzt? Ich habe jetzt eine Datei mit zwei SPAM E-Mails, und habe sa-lean aufgerufen, aber lernt es nichts....
[lucabert@ns tmp]$ cat mails | /opt/spamAssassin/sausr/bin/sa-learn --spam --mbox --showdots .. Learned from 0 message(s) (2 message(s) examined).
Was mache ich falsch?
Danke! Luca Bertoncello (lucabert@lucabert.de)
Luca Bertoncello lucabert@lucabert.de writes:
Noch eine Frage: hast du schon sa-learn benutzt? Ich habe jetzt eine Datei mit zwei SPAM E-Mails, und habe sa-lean aufgerufen, aber lernt es nichts....
[lucabert@ns tmp]$ cat mails | /opt/spamAssassin/sausr/bin/sa-learn --spam --mbox --showdots .. Learned from 0 message(s) (2 message(s) examined).
So direkt habe ich es noch nicht verwendet. Ich hatte eine Zeitlang in meiner user_prefs sowas stehen:
# Enable the Bayes system use_bayes 1
# Enable Bayes auto-learning auto_learn 1
Weiß nicht, ob das der gleiche Mechanismus ist.
Da wählt er nach irgendwelchen Kriterien selber aus, womit der seinen Bayesischen Filter anlernt und wann er ihn anwendet; ich konnte aber nicht erkennen, wonach das entschieden wird, weder das Anlernen noch das Benutzen. Möglicherweise das gleiche Problem wie bei Dir, ich kann es aber nicht beantworten.
Ich habe es dann wieder ausgeschaltet, weil ich außerdem bereits einen Bayesischen Filter in meinem Mailreader nachgeschaltet habe, den ich besser verstehe und kontrollieren kann (ifile via XEmacs/GNUS).
GreetinX Steffen
Steffen Schwigon schwigon@webit.de schrieb:
So direkt habe ich es noch nicht verwendet. Ich hatte eine Zeitlang in meiner user_prefs sowas stehen:
# Enable the Bayes system use_bayes 1
# Enable Bayes auto-learning auto_learn 1
Weiß nicht, ob das der gleiche Mechanismus ist.
Die habe ich eingeschaltet in meine local.cf Datei...
Ideen?
Danke! Luca Bertoncello (lucabert@lucabert.de)
On Thu, 13 May 2004 11:16 +0200 Luca Bertoncello lucabert@lucabert.de wrote:
[lucabert@ns tmp]$ cat mails | /opt/spamAssassin/sausr/bin/sa-learn --spam --mbox --showdots.. Learned from 0 message(s) (2 message(s) examined).
Was mache ich falsch?
Ich würde sagen: Nichts. Soweit ich weiß, lernt SpamAssassin eine Mail nicht zweimal. Da nicht jede als Spam erkannte Mail gleich als Spam erkannt wird, bei mir steht z.B. "bayes_auto_learn_threshold_spam 13.0", lohnt es sich, immer mal wieder ein Skript über den Spam-Ordner laufen zu lassen. Vorher sollte man noch eventuell vorhandene false positives wegverschieben. (Ich hatte nur am Anfang mal welche, mittlerweile kommt ca. einmal im Monat ein false negative vor, womit ich gut leben kann... bis ich crm114 noch dazuschalte... ;-)
Grüße
Frank Benkstein.
On 13.05.04 Luca Bertoncello (lucabert@lucabert.de) wrote:
Steffen Schwigon schwigon@webit.de schrieb:
Moin,
Diese Mühe würde ich mir nicht machen. Dafür ist SpamAssassin da, der hat bereits allgemeinere Regeln für sowas, z.B. wieviele Bewertungspunkte viele Ausrufezeichen im Subject bekommen, oder alles Großschreibung und so.
Noch eine Frage: hast du schon sa-learn benutzt? Ich habe jetzt eine Datei mit zwei SPAM E-Mails, und habe sa-lean aufgerufen, aber lernt es nichts....
[lucabert@ns tmp]$ cat mails | /opt/spamAssassin/sausr/bin/sa-learn --spam --mbox --showdots .. Learned from 0 message(s) (2 message(s) examined).
Ende von SA-learn.
Another thing to be aware of, is that typically you should aim to train with at least 1000 messages of spam, and 1000 ham messages, if possible. More is better, but anything over about 5000 messages does not improve accuracy significantly in our tests.
So um die 200 sollen wohl auch schon reichen. Ob das jetzt Dein Problem löst, weiß ich nicht.
H.
Steffen Schwigon schwigon@webit.de schrieb:
score RCVD_IN_SORBS 0 1.500 0 1.500
Damit führt die Erkennung als RCVD_IN_SORBS sofort zur SPAM-Bewertung.
OK! Vielen Dank!
Diese Mühe würde ich mir nicht machen. Dafür ist SpamAssassin da, der hat bereits allgemeinere Regeln für sowas, z.B. wieviele Bewertungspunkte viele Ausrufezeichen im Subject bekommen, oder alles Großschreibung und so.
Verstanden...
Noch eine Frage: hast du schon sa-learn benutzt? Ich habe jetzt eine Datei mit zwei SPAM E-Mails, und habe sa-lean aufgerufen, aber lernt es nichts....
[lucabert@ns tmp]$ cat mails | /opt/spamAssassin/sausr/bin/sa-learn --spam --mbox --showdots .. Learned from 0 message(s) (2 message(s) examined).
Was mache ich falsch?
Danke! Luca Bertoncello (lucabert@lucabert.de)
Luca Bertoncello lucabert@lucabert.de writes:
NO_REAL_NAME RCVD_IN_BL_SPAMCOP_NET RCVD_IN_SORBS RCVD_IN_DSBL
Achso, nochwas, evtl. fehlt Bei dir auch die Aktivierung der Benutzung dieser Blacklisten. In meinen user_prefs steht
# Enable or disable network checks skip_rbl_checks 0 use_razor2 1 use_dcc 1 use_pyzor 1
Und ich mußte dafür auch zusätzliche Pakete installieren, unter Debian z.B. "razor"; "pyzor" gibt's leider erst unter Sarge.
GreetinX Steffen
lug-dd@mailman.schlittermann.de