spamtuning
Reeds enkele weken ben ik bezig met een queeste. In het kader van enkele technische veranderingen bij Openminds, ben ik op zoek naar de ideale spamoplossing. Blacklists, header checks, spamassassin, dspam, mailscanner… you name it, ik heb het gezien. De uiteindelijke oplossing is nog in opbouw/test…
Eén van de hoekstenen van veel oplossingen is een filter gebasseerd op de inhoud van de mail, en normaal gaat dit via een basian engine/database. Dit werkt goed, als je de DB goed traint, en de spam consistent blijft. Spammers probeerden creatief te zijn, door in hun text-gedeelte van hun mail gewoon een stukje tekst te zetten, of woorden uit een woordenboek en zo, maar uiteindelijk raakt alles getraind, en leven we in een quasi-spamvrije wereld (hij is niet 100% spamvrij, aangezien ik de levels vrij laag hou. Ik heb liever een spam meer, dan een echt bericht dat wat ongelukkig opgesteld is, en als spam gemarkeerd wordt).
Sinds deze week krijgen we echter andere spam te zien. De body van de mail bevat enkel een email-adres. Niet meer, niet min. Bitter weinig dus om te testen en te scannen, en te weinig om er een goede ja/nee uitspraak over te doen. Bayes durft deze niet 100% als spam te markeren, en andere checks zien er weinig graten in (behalve dat het uit een dynamische range komt, maar dat is ook niet sluitend). Misschien moet ik wel een filter schrijven die kijkt als het enkel een email-adres is.
Ik bewaar consequent één exemplaar van elke mail die als spam gemarkeerd wordt, of die ik achteraf als spam markeer. De nieuwe oplossing krijgt die dan als “examen”. Laten we hopen dat de mails-only spams er ook uitgehaald worden.
March 20th, 2008 at 01:44
Finding an Email Spam Filter that Works…
Do you spend most of your time in front of a computer? If you do, then you belong to the millions of other individuals who work with a computer in this day and age. A lot of people are now using computers to do a variety of tasks for a company or priva…