Varianssianalyysi (ANOVA)

Vertaa kolmen tai useamman ryhmän keskiarvoja yksisuuntaisella varianssianalyysillä: F-arvo, vapausasteet ja p-arvo.

Ryhmien havainnot

Syötä jokainen ryhmä omalle rivilleen. Ryhmän havainnot eroteltuina pilkulla, välilyönnillä tai sarkaimella. Tarvitset vähintään kaksi ryhmää.

Tulokset

  • Tulosta
  • Linkitä
  • Varianssianalyysi (ANOVA) – usean ryhmän keskiarvojen vertailu

    Varianssianalyysi eli ANOVA on menetelmä, jolla vertaillaan kolmen tai useamman ryhmän keskiarvoja yhdellä testillä. Se selvittää, eroaako ainakin yksi ryhmä muista enemmän kuin satunnaisvaihtelu selittäisi. Tämä laskuri tekee yksisuuntaisen varianssianalyysin: se jakaa kokonaisvaihtelun osiin ja laskee F-testisuureen, vapausasteet ja p-arvon.

    Määritelmä

    ANOVA perustuu ajatukseen, että havaintojen kokonaisvaihtelu voidaan jakaa kahteen lähteeseen. Ryhmien välinen vaihtelu kuvaa, kuinka paljon ryhmäkeskiarvot eroavat toisistaan, ja ryhmien sisäinen vaihtelu kuvaa satunnaista hajontaa ryhmien sisällä. Jos ryhmien välinen vaihtelu on suurta suhteessa sisäiseen, ryhmien keskiarvot eroavat todennäköisesti aidosti.

    Kaava ja selitys

    Kokonaisvaihtelu jaetaan ryhmien väliseen (SSB) ja sisäiseen (SSW) neliösummaan:

    SSB = Σ nⱼ · (x̄ⱼ − x̄)², dfB = k − 1

    SSW = Σ Σ (xᵢⱼ − x̄ⱼ)², dfW = N − k

    Keskineliöt ovat neliösummat jaettuna vapausasteilla, ja F-testisuure on niiden suhde:

    MSB = SSB ÷ dfB, MSW = SSW ÷ dfW

    F = MSB ÷ MSW

    Tässä k on ryhmien määrä, nⱼ ryhmän j koko, N havaintojen kokonaismäärä, x̄ⱼ ryhmäkeskiarvo ja x̄ kokonaiskeskiarvo.

    Vaiheittainen esimerkki

    Kolme ryhmää: {4, 5, 6}, {7, 8, 9} ja {1, 2, 3}. Ryhmäkeskiarvot ovat 5, 8 ja 2, ja kokonaiskeskiarvo 5.

    1. Ryhmien välinen: SSB = 3·(5−5)² + 3·(8−5)² + 3·(2−5)² = 0 + 27 + 27 = 54, dfB = 3 − 1 = 2.
    2. Ryhmien sisäinen: jokaisessa ryhmässä hajonta on sama, SSW = 2 + 2 + 2 = 6, dfW = 9 − 3 = 6.
    3. Keskineliöt: MSB = 54 ÷ 2 = 27 ja MSW = 6 ÷ 6 = 1.
    4. Testisuure: F = 27 ÷ 1 = 27, p-arvo ≈ 0,001.

    Koska p on hyvin pieni, ryhmien keskiarvot eroavat tilastollisesti merkitsevästi.

    Tuloksen tulkinta

    Käyttökohteet

    ANOVA ja sen suhde t-testiin

    Kun ryhmiä on vain kaksi, yksisuuntainen ANOVA antaa saman tuloksen kuin kahden otoksen t-testi: F-arvo on tällöin t-arvon neliö. ANOVAn etu tulee esiin, kun ryhmiä on kolme tai enemmän, sillä se testaa kaikki ryhmät kerralla ilman, että monien parittaisten vertailujen virhetaso kasvaa. Jos ANOVA osoittaa merkitsevän eron, jälkivertailut paljastavat, mitkä ryhmät eroavat toisistaan.

    Usein kysytyt kysymykset

    Mikä on varianssianalyysi (ANOVA)?
    Varianssianalyysi (ANOVA) on menetelmä, jolla verrataan kolmen tai useamman ryhmän keskiarvoja samanaikaisesti. Se tutkii, onko ryhmien välillä tilastollisesti merkitseviä eroja. Yksisuuntainen ANOVA jakaa havaintojen kokonaisvaihtelun kahteen osaan: ryhmien väliseen vaihteluun (erot keskiarvojen välillä) ja ryhmien sisäiseen vaihteluun (satunnaisvaihtelu ryhmien sisällä).
    Miksi keskiarvoja ei verrata t-testillä pareittain?
    Jos kaikki ryhmäparit testattaisiin erikseen t-testillä, vertailujen määrä kasvaisi nopeasti ja virhepäätelmän todennäköisyys nousisi. ANOVA testaa kaikki ryhmät kerralla yhdellä testillä ja pitää virhetason hallinnassa. Se vastaa kysymykseen, eroaako ainakin yksi ryhmä muista. Jos ANOVA on merkitsevä, voidaan sen jälkeen tehdä tarkentavia jälkivertailuja.
    Miten F-testisuure lasketaan ANOVAssa?
    F-arvo on ryhmien välisen ja sisäisen keskineliön suhde: F = MSB ÷ MSW. Ryhmien välinen keskineliö MSB = SSB ÷ (k − 1) ja ryhmien sisäinen MSW = SSW ÷ (N − k), jossa k on ryhmien määrä ja N havaintojen kokonaismäärä. Suuri F tarkoittaa, että ryhmien väliset erot ovat suuria suhteessa ryhmien sisäiseen satunnaisvaihteluun.
    Mitä ryhmien välinen ja sisäinen neliösumma tarkoittavat?
    Ryhmien välinen neliösumma SSB mittaa, kuinka kaukana ryhmäkeskiarvot ovat kokonaiskeskiarvosta – se kuvaa ryhmien välisiä eroja. Ryhmien sisäinen neliösumma SSW mittaa havaintojen hajontaa oman ryhmänsä keskiarvon ympärillä – se kuvaa satunnaisvaihtelua. Niiden summa on kokonaisneliösumma SST. ANOVA vertaa näiden osuuksia.
    Mitkä ovat ANOVAn oletukset?
    Yksisuuntainen ANOVA olettaa, että havainnot ovat riippumattomia, kussakin ryhmässä muuttuja on likimain normaalijakautunut ja ryhmien varianssit ovat suunnilleen yhtä suuret (varianssien homogeenisuus). Lisäksi ryhmät ovat erillisiä. Jos varianssit eroavat selvästi tai ryhmäkoot ovat hyvin epätasaiset, kannattaa harkita vaihtoehtoisia menetelmiä, kuten Welchin ANOVAa.
    Oliko tästä laskurista apua?

    Linkitä tämä laskuri

    Kopioi koodi ja liitä se omalle sivustollesi.

    Suositut laskurit