środa, kwietnia 19, 2006

Ułuda prawdopodobieństwa, czyli jak użyć Bayesa do "wnioskowania"

I zima ;-) Miał być wpis o ułudzie prawdopodobieństwa, z interaktywnym formularzem liczącym "w locie", ale Blogger nie chce współpracować.
Nie straszny nam jednak Blogger i jego niedogodności ;-) Skorzystam z Google Page Creatora do przehostowania pewnego pliku.


Większość, jeśli nie wszystkie znaczące systemy antyspamowe korzystają z twierdzenia Bayesa o prawdopodobieństwach cząstkowych.
Cała idea tych systemów opiera się na założeniu, że istnienie pewnego słowa w tekście powoduje, że oceniany list ma większą bądź mniejszą szansę na bycie spamem.
Np. w mailach, które dostajemy słowo Viagra występuje powiedzmy 100 razy częściej w spamie niż zwykłych mailach. Mamy więc współczynnik, którego możemy użyć we wzorze.

Właśnie ten wzór służy czasami do "wnioskowania" na podstawie wiarygodnych (lub uznanych za takie) danych.
Możemy przyjąć pewne współczynniki za obowiązujące i policzyć np. prawdopodobieństwo spowodowania wypadku przez kierowce, to czy uda się jakieś przedsięwzięcie gospodarcze i tak dalej. Cały dowcip z tym sposobem wnioskowania polega właśnie na doborze danych. Przy odpowiednim ich spreparowaniu możemy "dowieść" wszystkiego.
Ciekawy przykład takiego naciąganego wnioskowania przedstawił Michael Shermer w Scientific American (można było o tym przeczytać w polskiej edycji, czyli w Świecie Nauki z sierpnia 2004).
Shermer przedstawił tam wyliczenia pewnego osobnika, który dowodził w taki sposób istnienia Boga. Sam Shermer przeprowadził te same obliczenia dla własnych wartości współczynników, a jego wynik był skrajnie różny.

Sam też przeprowadzałem te obliczenia. Narzędzie do tego znajduje się poniżej.
W pola wpisujemy odpowiednie współczynniki. Jeżeli istnienie danej rzeczy dowodzi wg. nas istnienia Boga to wstawiamy liczbę większą od 1, np. zakładamy, że istnienie dobra jest 10 razy bardziej prawdopodobne przy istnieniu Boga niż bez więc wpisujemy 10, w drugą stronę wpisujemy ułamki, czyli jeżeli coś jest 10 razy mniej prawdopodobne to wpisujemy 1/10 czyli 0.1. Jeżeli zaś coś nie ma wg. nas związku wpisujemy 1.
Całe obliczenia zaczynają się od sytuacji 50/50.
Początkowo wpisane są "moje" współczynniki.

Jeśli niżej nic nie widać to "zima", o której pisałem u góry nadal trwa ;-) Wtedy radze skorzystać z tego linka.



Podobne postybeta
Nadpłacanie kredytu - arkusz ;-)
Konwerter, Nexus One i Bayes ;-) czyli co mi głowę zawracało w ciągu ostatnich paru dni ;-)
Pożycz mi swój procesor ;-)
Teoria ewolucji vs hipoteza kosmicznych siewców życia vs hipoteza kreatora vs hipoteza kreatora na młodej Ziemi - mecz przy pomocy Bayesa :-)
Wydało się ;-)