niedziela, marca 29, 2020

Ku pamięci - iteracyjna wersja twierdzenia Bayesa ;-)

Mam słabość do prawa Bayesa, szczególnie do jego wersji iteracyjnej, ale zawsze mam problem z jej zapamiętaniem ;-)
Stąd sobie to tutaj opiszę i może mnie się na przyszłość przyda, a i Wam też ;-)

Zaczynamy od prawdopodobieństwa warunkowego:
P(A|B)=P(A i B)/P(B)

Czyli prawdopodobieństwo A pod warunkiem, że B, jest równe prawdopodobieństwu A i B jednocześnie podzielonemu przez prawdopodobieństwo B.

Na przykładzie, jak ktoś ma 2 dzieci i młodsze to córka to jakie jest prawdopodobieństwo, że ma 2 córki?

P(ma 2 córki)=0.25 bo możliwe są układu (starsze, młodsze):
córka, córka
córka, syn
syn, córka
syn, syn
Czyli posiadanie 2 córek przy 2 dzieci zdarza się w 1/4 przypadków (zakładając, że to są zdarzenia niezależne)
P(ma 2 dzieci, młodsze jest córką) = 0.5 (bo wpadają przypadki córka, córka i syn, córka)

P(2 córki | młodsze dziecko jest córką)=P(ma 2 córki i młodsze dziecko jest córką)/P(ma młodsze z 2 dzieci jest córką)=0.25/0.5=0.5

OK, to fajnie mamy prawdopodobieństwo warunkowe, co z tego?

Jak zauważymy z przekształcenia wzoru na prawdopodobieństwo warunkowe mamy, że:
P(A i B)=P(A|B)*P(B)

Czyli prawdopodobieństwo A i B, jest równe iloczynowi prawdopodobieństwa A pod warunkiem, że B i prawdopodobieństwa B.

Stąd można pójść za Bayesem i mamy:
P(B|A)=P(A|B)*P(B)/P(A)

Czyli znając prawdopodobieństwo warunkowe A pod warunkiem, że B (i prawdopodobieństwa A i B ;-)) możemy znaleźć prawdopodobieństw B pod warunkiem, że A.

I tu jest ten punkt, który zawsze gubię ;-)

Przepiszmy to tak jak w Wikipedii to robią ;-)

P(H|E)=P(E|H)/P(E)*P(H)

Czyli prawdopodobieństwo hipotezy pod warunkiem, że spełniony jest dowód jest równe prawdopodobieństwu wystąpienia dowodu przy prawdziwości hipotezy i prawdopodobieństwa hipotezy.

No i tu są 2 sztuczki.
Pierwsza jest taka, że jak mamy kilka dowodów to przy używaniu każdego kolejnego możemy używać w kolejnym kroku jako prawdopodobieństwa hipotezy używać wartości z poprzedniego kroku ;-) (słynne a priori).
Druga jest związana z P(E|H) aka likelihood czyli prawdopodobieństwem wystąpienia dowodu jeśli hipoteza jest prawidłowa, problemem jest P(E) ale tutaj się okazuje, że przecież rozważamy zawsze więcej niż 1 hipotezę i wtedy można przyjąć, że P(E) to suma wszystkich likelhood'ów dla danego dowodu ;-)

Pytanie jest jeszcze P(H) na początku i możemy je dla uproszczenia przyjmować jako 1/liczbę hipotez :-)

Pytanie czy następnym razem jak będę nad tym myślał to czy będę pamiętał te 2 sztuczki... bo nadal nie jestem pewien czy je w pełni rozumiem.


Podobne postybeta
Reality Check
Dziwne wykorzystanie twierdzenia Bayesa :-)
Teoria ewolucji vs hipoteza kosmicznych siewców życia vs hipoteza kreatora vs hipoteza kreatora na młodej Ziemi - mecz przy pomocy Bayesa :-)
Symulacja zamiast kartki i ołówka ;-)
Randki w ujęciu Bayesowskim ;-)

Brak komentarzy:

Prześlij komentarz