Bayesin kaava

Laske posterioritodennäköisyys P(A|B) Bayesin teoreemalla priorista ja uskottavuuksista.

Prior ja uskottavuudet

Anna ennakkotodennäköisyys P(A) ja uskottavuudet desimaalilukuina (0–1). Diagnostiikassa P(B|A) on herkkyys ja P(B|¬A) väärien positiivisten osuus.

Tulokset

  • Tulosta
  • Linkitä
  • Bayesin kaava – todennäköisyyden päivittäminen havainnon valossa

    Bayesin kaava kertoo, miten ennakkokäsitystä eli prioria päivitetään, kun saadaan uutta tietoa. Tämä laskuri laskee posterioritodennäköisyyden P(A|B) priorista P(A) ja uskottavuuksista P(B|A) ja P(B|¬A). Kaava sopii erityisesti diagnostisten testien tulkintaan, jossa harvinaisen sairauden ja epätarkan testin yhdistelmä antaa usein yllättäviä tuloksia.

    Määritelmä

    Bayesin teoreema yhdistää ehdolliset todennäköisyydet kahteen suuntaan. Se laskee tapahtuman A todennäköisyyden havainnon B jälkeen käyttäen sitä, kuinka todennäköinen havainto B on, kun A on tosi tai epätosi. Näin ennakkotodennäköisyys muuttuu havaintoon perustuvaksi päivitetyksi todennäköisyydeksi.

    Kaava ja selitys

    Bayesin kaava on:

    P(A | B) = P(B | A) · P(A) ÷ P(B)

    jossa jakaja P(B) lasketaan kokonaistodennäköisyyden lauseesta:

    P(B) = P(B | A) · P(A) + P(B | ¬A) · (1 − P(A))

    Tässä P(A) on prior, P(B|A) on havainnon uskottavuus kun A on tosi, ja P(B|¬A) on havainnon uskottavuus kun A on epätosi. Diagnostiikassa P(B|A) on testin herkkyys ja P(B|¬A) on väärien positiivisten osuus.

    Vaiheittainen esimerkki

    Sairaus esiintyy 1 %:lla väestöstä, joten prior P(A) = 0,01. Testin herkkyys P(B|A) = 0,9 ja väärien positiivisten osuus P(B|¬A) = 0,05. Kuinka todennäköistä on olla sairas positiivisen testin jälkeen?

    1. Kokonaistodennäköisyys: P(B) = 0,9 · 0,01 + 0,05 · 0,99 = 0,009 + 0,0495 = 0,0585.
    2. Osoittaja: P(B|A) · P(A) = 0,9 · 0,01 = 0,009.
    3. Posteriori: P(A|B) = 0,009 ÷ 0,0585 ≈ 0,154 eli noin 15,4 %.

    Vaikka testi on melko tarkka, sairauden harvinaisuus pitää posteriorin yllättävän pienenä.

    Tuloksen tulkinta

    Posteriori riippuu sekä priorista että uskottavuuksista:

    Käyttökohteet

    Missä Bayesin kaavaa käsitellään opinnoissa?

    Bayesin kaava kuuluu todennäköisyyslaskennan keskeisiin aiheisiin. Lukion matematiikassa se opetellaan ehdollisen todennäköisyyden ja kokonaistodennäköisyyden lauseen jälkeen, usein juuri diagnostisen testin esimerkin avulla. Yliopiston tilastotieteessä Bayesin teoreema on bayesilaisen päättelyn perusta ja yhdistää priorit, uskottavuudet ja posteriorit.

    Usein kysytyt kysymykset

    Mikä on Bayesin kaava?
    Bayesin kaava kertoo, miten todennäköisyyttä päivitetään uuden havainnon valossa. Se laskee posterioritodennäköisyyden P(A|B) eli tapahtuman A todennäköisyyden ehdolla, että B on havaittu. Kaava on P(A|B) = P(B|A) · P(A) ÷ P(B). Lähtötietoina ovat prior P(A) (ennakkotodennäköisyys) ja uskottavuudet P(B|A) ja P(B|¬A). Bayesin kaava on tilastollisen päättelyn perustyökalu.
    Miten kokonaistodennäköisyys P(B) lasketaan?
    Jakaja P(B) saadaan kokonaistodennäköisyyden lauseesta: P(B) = P(B|A) · P(A) + P(B|¬A) · P(¬A), jossa P(¬A) = 1 − P(A). Tämä summaa havainnon B todennäköisyyden molemmissa tapauksissa: kun A on tosi ja kun A on epätosi. Esimerkiksi jos P(A) = 0,01, P(B|A) = 0,9 ja P(B|¬A) = 0,05, niin P(B) = 0,9 · 0,01 + 0,05 · 0,99 = 0,0585.
    Mitä prior ja posteriori tarkoittavat?
    Prior eli ennakkotodennäköisyys P(A) on uskomus tapahtuman A todennäköisyydestä ennen havaintoa B. Posteriori P(A|B) on päivitetty uskomus havainnon B jälkeen. Bayesin kaava muuntaa priorin posterioriksi uskottavuuksien avulla. Posteriori voi olla priorista huomattavasti suurempi tai pienempi sen mukaan, kuinka voimakkaasti havainto tukee tai vastustaa tapahtumaa A.
    Miksi harvinaisen sairauden positiivinen testi voi silti tarkoittaa pientä todennäköisyyttä?
    Tämä on Bayesin kaavan tunnetuin sovellus. Kun sairaus on harvinainen (pieni prior), suuri osa positiivisista tuloksista on vääriä positiivisia, vaikka testi olisi tarkka. Esimerkiksi jos vain 1 % on sairaita ja väärien positiivisten osuus on 5 %, positiivisesta tuloksesta huolimatta todennäköisyys olla oikeasti sairas on vain noin 15 %. Priori vaikuttaa siis voimakkaasti lopputulokseen.
    Mitä eroa on P(B|A):lla ja P(A|B):llä?
    P(B|A) on havainnon B todennäköisyys, kun A on tosi (esimerkiksi positiivisen testin todennäköisyys sairaalla eli herkkyys). P(A|B) on tapahtuman A todennäköisyys, kun B on havaittu (esimerkiksi sairauden todennäköisyys positiivisen testin jälkeen). Bayesin kaava nimenomaan muuntaa P(B|A):n P(A|B):ksi ottaen huomioon priorin. Näiden sekoittaminen on yleinen päättelyvirhe.
    Oliko tästä laskurista apua?

    Linkitä tämä laskuri

    Kopioi koodi ja liitä se omalle sivustollesi.

    Suositut laskurit