niedziela, maja 20, 2007

Tytuły spamów wyglądają po prostu "źle"

Co jakiś czas przechodzę po moich kontach na GMAILu i kasuje znajdujący się na nich spam. Zauważyłem, że jeżeli przeciętnie kasuje około 1000 spamów to średnio raz na 2 wizyty muszę w ogóle wchodzić do maila żeby się upewnić czy jest spamem, tak samo na podstawie tylko tytułu i adresata wyłapuje wśród nie spamów spamy ;-) [podobne ilości i podobną skuteczność mam przeglądając pocztę w The Bat! czyli to raczej niezależne od konta ;-)]Na pewno częściowo ułatwia mi fakt, że spam jest praktycznie w 100% po angielsku lub hiszpańsku, ale wyłapuje go też wśród maili z angielskimi tytułami.Wydaje mi się także, że większość doświadczonych internautów ma taką samą, albo i wyższą skuteczność w wyłapywaniu spamu. Tytuły spamów po prostu wyglądają jakoś źle, nie pasują do "wzorca".Dlatego ciekawi mnie czy gdyby policzyć widma częstotliwości przestrzennych tytułów, to czy takie spamowe odbiegałyby jakoś znacząco od nie spamów ;-) A może gdyby policzyć widmo takiego przebiegu "czasowego" czy raczej przestrzennego, w którym "sygnał" wejściowy byłby związany z "zaczernieniem" każdego znaku tytułu to można by było dostrzec różnicę takiego spamowego widma od widma dla nie spamów? :-)Tak sobie tylko dywaguje ;-) Ale może coś jest na rzeczy ;-)


Podobne postybeta
Jak wykryć spamowe konto w Google+
Laborki :-)
Złe Markety ;-)
Tydzień 27 (jeżeli dobrze liczę ;-))
Rewolucja w fizyce?