Laske hypergeometrisen jakauman todennäköisyydet, kun otetaan otos ilman takaisinpanoa – esimerkiksi lottotodennäköisyydet.
Populaatio
Anna alkioiden kokonaismäärä ja niistä onnistumisiksi luettavien määrä.
Otos
Anna poimittavien alkioiden määrä ja haettujen onnistumisten määrä.
Tulokset
Hypergeometrinen jakauma – otanta ilman takaisinpanoa
Hypergeometrinen jakauma on todennäköisyysjakauma, joka kuvaa onnistumisten määrää, kun otos poimitaan ilman takaisinpanoa rajallisesta populaatiosta. Se on luonteva malli tilanteisiin kuten lottoarvonta, laaduntarkastus erästä tai korttien jako pakasta. Tämä laskuri laskee hypergeometriset todennäköisyydet, kertymät ja jakauman tunnusluvut.
Määritelmä
Populaatiossa on N alkiota, joista K on onnistumisia ja loput N − K epäonnistumisia. Kun poimitaan satunnaisesti n alkiota palauttamatta niitä, satunnaismuuttuja X on otokseen osuneiden onnistumisten lukumäärä. Koska alkioita ei palauteta, jokainen poiminta muuttaa jäljellä olevia osuuksia – tämä erottaa hypergeometrisen jakauman binomijakaumasta.
Kaava ja selitys
Pistetodennäköisyys eli täsmälleen k onnistumisen todennäköisyys on:
P(X = k) = C(K, k) · C(N − K, n − k) ÷ C(N, n)
Tässä C(a, b) on binomikerroin eli niiden tapojen lukumäärä, joilla b alkiota valitaan a:sta. Odotusarvo ja varianssi ovat:
E(X) = n · K ÷ N
Var(X) = n · (K/N) · ((N−K)/N) · ((N−n)/(N−1))
Varianssin viimeinen tekijä (N − n)/(N − 1) on äärellisen populaation korjaus, joka pienentää hajontaa palautukseen verrattuna.
Vaiheittainen esimerkki
Populaatiossa on N = 20 alkiota, joista K = 7 on onnistumisia. Poimitaan n = 12 alkiota ja kysytään todennäköisyyttä saada k = 5 onnistumista.
Onnistumiset: C(7, 5) = 21 tapaa valita 5 onnistumista seitsemästä.
Epäonnistumiset: C(13, 7) = 1716 tapaa valita loput 7 alkiota kolmestatoista.
Kaikki otokset: C(20, 12) = 125 970.
Todennäköisyys: (21 · 1716) ÷ 125 970 ≈ 0,286.
Odotusarvo on E(X) = 12 · 7 ÷ 20 = 4,2, joten viisi onnistumista on hieman keskiarvoa enemmän.
Tuloksen tulkinta
Pistetodennäköisyys P(X = k) kertoo täsmälleen k onnistumisen todennäköisyyden.
Kertymä P(X ≤ k) on todennäköisyys saada enintään k onnistumista; P(X ≥ k) vähintään k.
Odotusarvo on otoksen tyypillinen onnistumisten määrä.
Rajoitukset: k ei voi ylittää K:ta eikä n:ää, ja n − k ei voi ylittää epäonnistumisten määrää N − K.
Hypergeometrinen jakauma ja sen lähestyminen binomiin
Hypergeometrinen jakauma on äärellisen populaation tarkka malli, kun otanta tehdään ilman takaisinpanoa. Kun populaatio N on hyvin suuri otoskokoon n verrattuna, yksittäisten poimintojen vaikutus jäljellä oleviin osuuksiin on pieni, ja jakauma lähestyy binomijakaumaa parametrilla p = K/N. Käytännössä binomiapproksimaatio on käyttökelpoinen, kun otos on alle noin 10 % populaatiosta. Lottotyyppisissä ongelmissa, joissa otos on iso osuus populaatiosta, hypergeometrinen jakauma on oikea valinta.
Usein kysytyt kysymykset
Mikä on hypergeometrinen jakauma?
Hypergeometrinen jakauma kuvaa onnistumisten määrää, kun otos poimitaan ilman takaisinpanoa rajallisesta populaatiosta. Populaatiossa on N alkiota, joista K on onnistumisia. Kun poimitaan n alkiota palauttamatta niitä, jakauma kertoo todennäköisyyden saada täsmälleen k onnistumista. Koska alkioita ei palauteta, onnistumisen todennäköisyys muuttuu jokaisella poiminnalla.
Miten hypergeometrinen todennäköisyys lasketaan?
Kaava on P(X = k) = C(K, k) · C(N − K, n − k) ÷ C(N, n), jossa C tarkoittaa binomikerrointa eli yhdistelmien lukumäärää. Osoittaja laskee, kuinka monella tavalla voidaan valita k onnistumista K:sta ja loput n − k epäonnistumista. Nimittäjä on kaikkien mahdollisten n alkion otosten määrä. Osamäärä on haetun tuloksen todennäköisyys.
Mitä eroa on hypergeometrisella ja binomijakaumalla?
Binomijakaumassa poimitaan takaisinpanolla tai ääretön suuresta populaatiosta, jolloin onnistumisen todennäköisyys pysyy samana joka kerralla. Hypergeometrisessa jakaumassa poimitaan ilman takaisinpanoa rajallisesta populaatiosta, jolloin todennäköisyys muuttuu poimintojen myötä. Kun populaatio on hyvin suuri otokseen verrattuna, hypergeometrinen jakauma lähestyy binomijakaumaa.
Miten hypergeometrisella jakaumalla lasketaan lottotodennäköisyys?
Suomalaisessa Lotossa arvotaan 7 numeroa 40:stä. Aseta N = 40 (kaikki numerot), K = 7 (arvotut oikeat numerot), n = 7 (omat numerosi) ja k = oikein menneiden määrä. Esimerkiksi 7 oikein: P = C(7,7) · C(33,0) ÷ C(40,7) = 1 / 18 643 560. Kuusi oikein on todennäköisempi, noin 1 / 80 708.
Mikä on hypergeometrisen jakauman odotusarvo?
Odotusarvo on E(X) = n · K ÷ N, eli otoskoko kerrottuna onnistumisten osuudella populaatiossa. Varianssi on n · (K/N) · ((N−K)/N) · ((N−n)/(N−1)). Viimeinen tekijä (N−n)/(N−1) on äärellisen populaation korjaus, joka pienentää varianssia binomijakaumaan verrattuna, koska poiminta tapahtuu ilman takaisinpanoa.