Apple Mail - SpambekämpfungWie die meisten Leute die Apple Mail benutzen, hatte ich grosse Hoffnung, dass die Verbesserungen des Filters fuer unerwuenschte Werbung, ein viel geruehmter Grund um auf Panther umzusteigen, wirklich dem Medienrummel von Apple entsprechen. Nachdem ich den Filter monatelang sorgfaeltig trainiert hatte, war ich immer noch weniger als zufrieden mit seinen Resultaten. Basierend auf den Hunderten von Mitteilungen in Apples Diskussionsforen bin ich mit meinen Erfahrungen nicht allein. Aber anstatt mit dem Spam zu leben (oder Mail gegen ein anderes Programm einzutauschen) entschied ich, mich etwas tiefer mit dem Problem auseinanderzusetzen. Bewaffnet mit einer staendig wachsenden persoenlichen Sammlung von vielen Tausend Spam E-Mails, experimentierte ich mit den Einstellungen des Filters fuer unerwuenschte Werbung von Mail, verglich mit anderen Filtern und versuchte herauszufinden wie er funktioniert - und wieso er manchmal versagt. Ich entdeckte, dass zumindest einige der Probleme die ich hatte durch ein Missverstaendnis des Programmdesigns verursacht wurden, das nicht so selbsterklaerend ist wie bei anderen Apple Programmen. Ich habe gute und schlechte Nachrichten. Die gute Nachricht ist, dass der Filter fuer unerwuenschte Werbung, wenn er richtig konfiguriert ist, ein verlaessliches Werkzeug sein kann um unerwuenschte Werbung aus dem Post Eingang fernzuhalten. Die schlechte Nachricht ist, dass Sie moeglicherweise immer noch mehr unerwuenschte Werbung sehen als Sie moechten, auch wenn der Filter fuer unerwuenschte Werbung so gut wie irgendmoeglich funktioniert. Gluecklicherweise koennen andere Programme und Techniken fuer die Maengel des Filters fuer unerwuenschte Werbung einspringen. Sie werden eine bessere Entscheidungen darueber treffen koennen, wie Sie den Filter einsetzen (oder ergaenzen) sollen, wenn Sie wissen was hinter den Kulissen passiert. Ich habe ungezaehlte Stunden an Nachforschungen und Experimenten zusammengefasst zu meinem neusten Take Control eBook, "Take Control of Spam with Apple Mail", aus dem ich in diesem Artikel einen Auszug gebe. Die Funktionsweise der Junk Mail Filter von Mail Der Filter fuer unerwuenschte Werbung von Mail hat zwei Modi: Training und Automatisch. (Er kann auch ganz deaktiviert werden.) Was genau in diesen zwei Modi geschieht kann den Uneingeweihten verwirren. Insbesondere fragen sich viele Leute, ob der Filter weiter lernt wenn man in den automatischen Modus wechselt. (Tut er wirklich, leider verschleiert Apples Dokumentation diese Tatsache.) Hier nun die Details. Wenn eine Nachricht eintrifft, wendet Mail eine interne Regel an - eine Regel die nicht in der Liste der Regeln erscheint. Um falsch Positive zu minimieren, laeuft diese spezielle Regel fuer unerwuenschte Werbung nach allen anderen Regeln ab. Aber sie laeuft nicht ab, wenn eine der anderen Regeln die Aktion "Pruefung der Regeln stoppen" enthaelt, und sie gilt auch nur, wenn eine Mitteilung nicht schon durch eine andere Regel bewegt oder geloescht wurde. Die spezielle Regel fuer unerwuenschte Werbung koennen Sie sehen sie die Einstellungsseite "Werbung" in Mail oeffnen und den Knopf fuer die weiteren Optionen unten im Fenster anklicken. Je nach den Optionen die Sie waehlen, prueft diese Regel ob der Absender der Nachricht in der Liste "Vorherige Empfaenger" oder im Adressbuch zu finden ist, und ob die E-Mail an Ihren vollstaendigen Namen adressiert ist - unerwuenschte Werbung ist dies naemlich haeufig nicht. (Die Liste der vorherigen Empfaenger ist ein nuetzlicher Zusatz zum Filter fuer unerwuenschte Werbung, obwohl, wie ich im eBook im Detail erklaere, sich relativ einfach unkorrekte Daten einschleichen koennen, was diesen Zusatz kontraproduktiv macht. Wenn die Antwort auf eine dieser Fragen ja lautet, stoppt die Regel und die Nachricht wird in Ruhe gelassen. Wenn allerdings alle drei Bedingungen negativ sind, prueft die Regel einen letzten Zustand: E-Mail ist unerwuenschte Werbung. Wenn diese letzte Bedingung zutrifft, fuehrt der Filter die Aktion durch die Sie ausgewaehlt haben: im Trainingsmodus wird die Farbe des Betreffs der Nachricht in Braun geaendert; im automatischen Modus wird die Nachricht ins Postfach Werbung verschoben. (Diese Aktion ist einer der nur zwei Unterschiede zwischen dem Trainings- und dem automatischen Modus. Der andere Unterschied besteht darin, dass Mail im automatischen Modus die Werbe-Postfaecher fuer alle Konten in einem einzigen Werbe-Symbol zusammenfasst in der Postfaecherliste.) Die Bedingung "E-Mail ist unerwuenschte Werbung" klingt eher mysterioes, aber sie bedeutet, dass, wenn sie zutrifft, der latente semantische Analysefilter von Mail (gleich anschliessend besprochen) einer Nachricht einen Wert ueber seiner willkuerlichen Schwelle fuer unerwuenschte Werbung zugeordnet hat. Diese Schwelle kann nicht geaendert werden, aber wenn Sie spaeter einen Nachricht als "Keine Werbung" kennzeichnen, senken Sie die Wahrscheinlichkeit, dass Mail eine aehnliche Nachricht in Zukunft fuer von unerwuenschte Werbung haelt. Die Panther-Version von Mail hat eine weitere Bedingung hinzugefuegt fuer das Testen auf unerwuenschte Werbung: Header die vom Filter fuer unerwuenschte Werbung des Internetanbieters eingefuegt wurden. Viele Internetanbieter benutzen serverbasierte Filter wie SpamAssassin oder Brightmail. Wenn so ein Filter eine Nachricht als moegliche unerwuenschte Werbung erkennt, wird die Nachricht markiert mit einem speziellen Header wie z.B. X-Spam-Flag. (Diese speziellen Header bleiben normalerweise verborgen, man kann sie sich aber anzeigen lassen indem man im Menue Darstellung > E-Mail > Lange Header waehlt [Befehl-Umschalt-H].) Eine Nachricht die diesen Header enthaelt wurde vom Filter vom Internetanbieter - der moeglicherweise fortschrittlicher ist als der in Mail eingebaute - als unerwuenschte Werbung eingestuft. Solange das Kaestchen "Dem vom Internet-Anbieter eingegebenen Mail-Header fuer unerwuenschte Werbung vertrauen" in den Werbung Einstellungen angekreuzt ist, markiert Mail solche Nachrichten als unerwuenschte Werbung (ausser sie wurden aus einem anderen Grund ausgenommen, wie wenn sie z.B. von jemandem aus dem Adressbuch gesendet wurde). Gewisse serverbasierte Filter benutzen andere Header neben X-Spam-Flag um unerwuenschte Werbung zu kennzeichnen. Die einzige Moeglichkeit um Mail mitzuteilen auch andere Header zu beachten, ist, die Einstellungsdatei manuell zu bearbeiten; eine vollstaendige Anleitung hierfuer gebe ich im eBook. Statistische Filter Da sich die unerwuenschte Werbung immer weiter entwickelt, werden Werkzeuge die unerwuenschte Werbung aufgrund von festen Stichwortlisten ausfiltern mit der Zeit immer ineffektiver. Statistische Filter begegnen diesem Problem indem sie sich (in gewisser Weise) ihre eigenen Regeln schaffen waehrend sie Ihre E-Mail verarbeiten. Die am haeufigsten verwendete statistische Filtermethode ist das Bayesianische Filtern (welches man, unter anderem, in Eudora, SpamSieve und SpamAssassin antrifft). Apple Mail wendet eine verwandte Technik an, bekannt unter dem Namen Adaptive Latent Semantic Analysis (LSA) [anpassungsfaehige latente semantische Analyse --JR]. Beide Methoden berechnen die Moeglichkeit, dass eine Nachricht unerwuenschte Werbung ist basierend auf dem Inhalt von schon vorhandenen Nachrichten aus den Kategorien unerwuenschte Werbung und nicht unerwuenschte Werbung. Auch werden beide Methoden exakter je mehr sie mit Proben von guten und schlechten Nachrichten konfrontiert werden. Auch wenn die LSA- und die bayesianischen Filter aus Anwendersicht aehnlich sind, unterscheiden sie sich auf ein paar wichtige Arten. Bayesianische Filter Wenn man es stark vereinfacht, kann man sich einen bayesianischen Filter als zwei Listen vorstellen: "gute" und "schlechte" Woerter. Diese Listen bauen sich dynamisch auf waehrend Sie den Filter benutzen. Jedesmal wenn Sie eine Nachricht als unerwuenschte Werbung markieren, fuegt der Filter alle Woerter dieser Nachricht seiner Liste mit den schlechten Woertern hinzu; genau so werden jedesmal wenn Sie eine Nachricht als erwuenscht markieren, alle Woerter dieser Nachricht der Liste mit den guten Woertern hinzugefuegt. Natuerlich erscheinen die meisten Woerter auf beiden Listen. Der Filter bestimmt nun die Wahrscheinlichkeit eines Wortes, unerwuenschte Werbung anzuzeigen basierend auf dem Anteil indem es in guten bzw. schlechten Nachrichten vorkam. Sobald eine neue Nachricht eintrifft, berechnet der Filter den durchschnittlichen Spam-Punktestand ihrer Woerter, und die Nachricht wird als Spam eingestuft, wenn der Punktestand eine vorher festgelegte Schwelle ueberschritten wird. Bayesianische Filter sind hochdynamisch, sie passen sich nicht nur selbst den Mail-Typen an, die man so bekommt (was fuer den einen Spam ist, ist fuer den naechsten normale Post), sondern auch an die sich aendernden Taktiken der Spammer. Das System ist zwar nicht perfekt, es bedeutet aber, falls naechste Woche jemand anfaengt, fuer Immobilienkaeufe auf dem Mars zu werben, dann wird ein Bayesianische Filter lernen, solche Nachrichten abzuweisen, nachdem Sie ein paar Beispiele von Hand als Spam gekennzeichnet haben. Die meisten Bayesianischen Filter beruecksichtigen Email-Koepfe und andere Nachrichtenbestandteile, um zu verhindern, dass sie durch Spamnachrichten an der Nase herum gefuehrt werden, die lange (wenn auch oft versteckte) Passagen mit normalem Text enthalten. Latente semantische Analysen in Mail Wo die Grundlage der Bayesianischen Filter eine recht gradlinige Berechnung von Worthaeufigkeiten ist, gehen LSA Filter weiter, indem sie spam-typische Woerter, Phrasen und Nachrichten identifizieren, und zwar auf der Grundlage eines Vergleiches mit Text, den Sie selbst bereits als Spam klassifiziert haben. Anstatt jedes Wort einfach einzeln zu gewichten, beruecksichtigt ein LSA-Filter den Zusammenhang, in dem ein Wort erscheint. Taucht z.B. das Wort "VergroeBerung" in einer Diskussion ueber Fotografie auf, dann waere das normalerweise kein Hinweis auf Spam - dagegen wuerde man das gleiche Wort im Zusammenhang mit kosmetischer Chirurgie oder dem Versand von Billigmedikamenten sehr wohl als Spam-Indikator ansehen. (Nochmal: hier handelt es sich um eine grobe Vereinfachung. Weitere Informationen ueber latente semantische Analysen finden Sie in Teil 2 von Francois Joseph de Kermadecs dreiteiliger Serie "Der Kampf gegen Spam" im MacDevCenter.) Wie ein Bayesianischer Filter lernt auch ein LSA-Filter durch Anwendung. Dabei wird natuerlich unterstellt, dass Sie sorgfaeltig alle seine Fehler korrigieren. Fuer Mail bedeutet das, all Spam-Nachrichten zu markieren, die durch den Filter rutschen, bzw. die faelschlicherweise als Spam markierten Mails ("falsche Positive"), zu identifizieren. Auf dem Papier macht LSA den Eindruck, die anspruchsvollere Technik zu sein, die auch von cleveren Spammern nicht so leicht getaeuscht werden kann. In der Praxis laesst die LSA-Umsetzung in Mail allerdings einiges zu wuenschen uebrig. Bei meinen eigenen Tests lernte es langsamer als Bayesianische Filter. AuBerdem tendiert es zu Irrtuemern wegen zu groBer Vorsicht, ohne Moeglichkeit, die Empfindlichkeit fuer das zu adjustieren, was als Spam eingestuft wird. Und da es eher nach Wortmustern als nach Buchstabenmustern sucht, werden jede Menge offensichtlicher Spamnachrichten durchgelassen. Mail speichert seine Statistiken guter und schlechter Nachrichtenmerkmale in einer einzigen Datei: ~/Library/Mail/LSMMap2. ("LSM" steht uebrigens fuer "least square method", ein mathematischer Algorithmus, der in latenter semantischer Analyse angewendet wird. War mir klar, dass Sie sich das gefragt haben.) Wird diese Datei beschaedigt - was leider sehr leicht passieren kann - dann funktioniert der Mailfilter nicht mehr korrekt. Die LSMMap2 Datei laesst sich nicht reparieren, Sie koennen sie aber von Hand loeschen oder durch einen Klick auf einen Button in den Junkmail-Voreinstellungen vom Mail zuruecksetzen. Damit werden die schlimmsten Junkmail-Probleme geloest, gleichzeitig loeschen Sie aber auch die gesammelten Erfahrungen Ihres Junk-E-Mail-Filters, weshalb seine Genauigkeit danach zunaechst solange zu wuenschen uebrig lassen wird, bis ausreichend viele legitime bzw. Spamnachrichten verarbeitet wurden, um seine Datenbank wieder aufzubauen. Wodurch kann die Muell-Statistikdatei in Mail ueberhaupt beschaedigt werden? AuBer aus den ueblichen Gruenden (z.B. Crashs bei geoeffneter Datei, Verzeichnisfehler oder fehlerhaftes Abschalten), kann LSMMap2 gelegentlich im Laufe normaler Aktivitaeten Schaden erleiden, z.B. indem es eine Nachricht als Junk-Mail klassifiziert oder abspeichert, wenn die Nachricht selbst bestimmte Fehlerarten enthaelt. Man kann zwar nicht verhindern, dass Schaeden auftreten, Sie koennen aber dafuer sorgen, dass sie leichter behoben werden koennen (siehe eBook fuer weitere Informationen). Nachrichten als "Junk Mail/keine Junk Mail" markieren Da statistisch ausgerichtete Filter ihre Wirksamkeit durch Gebrauch nur allmaehlich erhoehen (und weil Spammer immer wieder neue Tricks lernen, um sie zu behindern), mogelt sich Spam manchmal am Junkmail-Filter vorbei und erweckt den Eindruck, es handele sich um gewoehnliche Post (der Expertenausdruck dafuer ist "falsch negativ"). Solche Nachrichten koennen Sie einfach loeschen, aber wenn Sie das tun, dann erhoehen Sie damit nur die Wahrscheinlichkeit, dass in Zukunft aehnliche Nachrichten durchrutschen werden. Statt dessen muessen Sie jede unmarkierte Spam auswaehlen und von Hand als Junkmail kennzeichnen (waehlen Sie Nachrichten > Markieren > Als Spam[Befehl-Feststelltaste-J]). Beachten Sie, dass es mit dem simplen Verschieben einer Nachricht in die Junk-Mailbox nicht getan ist; nur wenn die Junk-Mail Flag, wie durch das Symbol "Papiertuete" gezeigt, in der Nachrichtenliste gesetzt ist, betrachtet Mail die Nachricht als Junk-Mail. Wenn Sie eine Nachricht als Junk-Mail markieren, aendern Sie die Statistik des Filters und entfernen die Absenderadresse aus der Liste "Vorherige Empfaenger" wenn sie darin enthalten war. Auf der anderen Seite kann Mail auch mal faelschlicherweise eine legitime Nachricht als Junk markieren (ein "falsch positiv"). SchlieBlich bewerten statistische Filter nur Wahrscheinlichkeiten. Wenn jemand Ihnen z.B. einen Artikel schickt, der sich mit dem Sprachgebrauch der Spammer beschaeftigt, dann kann das bereits den Ausschlag geben. (dieses Problem mit uebereifrigen Spamfiltern hat endlosen Aerger fuer TidBITS und die TidBITS Talk Mailingliste ausgeloest). Es bleibt nichts uebrig, als jede dieser Nachrichten mit "Keine Junkmail" zu markieren (waehlen Sie Nachricht > Markieren > Als kein Spam), um Mail zu sagen, dass es sich hier um legitime Nachrichten handelt. Erstaunlicherweise fuehrt das Markieren einer Nachricht als "Kein Spam" allerdings dazu, dass ihr Absender in die Liste der vorherigen Empfaenger aufgenommen wird! Damit wird garantiert, dass keine Nachricht dieses Absenders je als Spam markiert werden wird (unterstellt, Sie verwenden die Standardeinstellung) - ob das Ihrer Absicht entspricht ist natuerlich eine andere Frage. Das ist nur eine der vielen Ueberraschungen, die mir beim Design der Liste "Fruehere Empfaenger" aufgefallen ist. Uebernehmen Sie die Spamkontrolle mit Apple Mail Ich habe versucht, hier die Grundlagen dafuer zu beschreiben, wie der Junkmail-Filter von Mail funktioniert. In meinem komplettem, 59-seitigen eBook "Take Control of Spam with Apple Mail" eBook gehe ich aber viel weiter - hier gibt es detaillierte, praktische Tipps, wie Mail-Nutzer Spam ausmerzen, falsche Positive vermeiden und Probleme mit dem Junkmail-Filter loesen koennen. Das eBook enthaelt einen groBen Anteil zusaetzlicher Hintergrundinformationen, plus ausfuehrliche Diskussionen ueber Zusatzfilter und andere Techniken, die ueber die in Mail eingebauten Antispam-Moeglichkeiten hinausgehen. Wenn Sie unter Spam in Mail zu leiden hatten, dann werden meine Hinweise Ihnen mit Sicherheit helfen, Ihre Frustrationen zu reduzieren und sie werden Ihnen helfen, soviel Zeit im Umgang mit Junkmail zu verschwenden. "Take Control of Spam with Apple Mail" kostet $5, und - wie bei allen Take Control eBooks gilt: Kaeufer bekommen alle kleineren Aktualisierungen gratis. Autor: Joe Kissell (Uebersetzung: Jens Roecken) |
|