Laske kahden otoksen yhdistetty keskihajonta (pooled SD), joka on kahden otoksen t-testin perusta.
Syöttötapa
Otosten havainnot
Syötä molempien ryhmien havainnot pilkulla, välilyönnillä tai rivinvaihdolla eroteltuina.
Otosten tunnusluvut
Anna kummankin otoksen koko (n) ja otoskeskihajonta (s).
Tulokset
Yhdistetty keskihajonta – kahden otoksen yhteinen hajonta
Yhdistetty keskihajonta (pooled standard deviation) yhdistää kahden otoksen hajonnan yhdeksi arvioksi, kun oletetaan, että otokset tulevat populaatioista, joilla on sama varianssi. Se on kahden otoksen t-testin ja vaikutuksen koon laskennan keskeinen osa. Tämä laskuri laskee yhdistetyn keskihajonnan joko raakadatasta tai valmiista tunnusluvuista.
Määritelmä
Kun vertaillaan kahta ryhmää, kummallakin on oma keskihajontansa. Jos ryhmien oletetaan olevan yhtä hajanaisia, niiden hajonnat kannattaa yhdistää yhdeksi tarkemmaksi arvioksi. Yhdistetty keskihajonta on kummankin otoksen varianssin painotettu keskiarvo, jossa painona ovat vapausasteet. Suurempi otos vaikuttaa tulokseen enemmän.
Tässä n₁ ja n₂ ovat otoskoot sekä s₁ ja s₂ otoskeskihajonnat. Osoittajassa kummankin otoksen varianssi kerrotaan sen vapausasteilla (n − 1). Nimittäjä n₁ + n₂ − 2 on yhteenlaskettujen vapausasteiden määrä. Neliöjuuri palauttaa tuloksen alkuperäisen suureen yksiköihin.
Vaiheittainen esimerkki
Ryhmä 1: n₁ = 10, s₁ = 4. Ryhmä 2: n₂ = 12, s₂ = 5.
Yhteinen hajonnan arvio asettuu kummankin otoksen keskihajonnan väliin, lähemmäs suuremman otoksen arvoa.
Tuloksen tulkinta
Yhdistetty keskihajonta kuvaa ryhmien yhteistä hajontaa, kun varianssit oletetaan samoiksi.
Vapausasteet n₁ + n₂ − 2 määräävät t-testin jakauman, jossa s_p toimii nimittäjänä.
Painotus: suurempi otos vetää yhdistettyä arvoa puoleensa.
Oletus: jos varianssit eroavat selvästi, yhdistäminen ei ole perusteltua.
Käyttökohteet
Kahden otoksen t-testi: yhdistetty keskihajonta on testisuureen nimittäjän pohja.
Vaikutuksen koko (Cohenin d): keskiarvojen ero standardoidaan yhdistetyllä keskihajonnalla.
Laadunvalvonta: kahden erän hajonnan yhdistäminen.
Tutkimus: koe- ja vertailuryhmän hajonnan yhdistäminen.
Yhdistetty keskihajonta t-testin taustalla
Yhdistetty keskihajonta on kahden riippumattoman otoksen t-testin perusta. Testisuureessa keskiarvojen erotus jaetaan keskivirheellä, joka lasketaan yhdistetystä keskihajonnasta. Menetelmä olettaa, että ryhmien varianssit ovat yhtä suuret; tätä oletusta voidaan tarkastella esimerkiksi F-testillä. Jos varianssit poikkeavat selvästi, käytetään Welchin t-testiä, joka ei yhdistä hajontoja.
Usein kysytyt kysymykset
Mikä on yhdistetty keskihajonta?
Yhdistetty keskihajonta (pooled standard deviation) on kahden otoksen yhteinen hajonnan arvio, kun otosten oletetaan tulevan populaatioista, joilla on sama varianssi. Se lasketaan painottamalla kummankin otoksen varianssi sen vapausasteilla ja ottamalla painotetun keskiarvon neliöjuuri. Yhdistetty keskihajonta antaa luotettavamman hajonnan arvion kuin kumpikaan otos yksinään.
Miten yhdistetty keskihajonta lasketaan?
Kaava on s_p = √[((n₁−1)·s₁² + (n₂−1)·s₂²) ÷ (n₁+n₂−2)], jossa n₁ ja n₂ ovat otoskoot sekä s₁ ja s₂ otoskeskihajonnat. Ensin lasketaan yhdistetty varianssi painottamalla kummankin otoksen varianssi vapausasteilla (n−1), summaamalla ne ja jakamalla yhteenlasketuilla vapausasteilla. Yhdistetty keskihajonta on tämän neliöjuuri.
Milloin yhdistettyä keskihajontaa käytetään?
Sitä käytetään ennen kaikkea kahden riippumattoman otoksen t-testissä, kun oletetaan, että ryhmillä on yhtä suuri varianssi. Yhdistetty keskihajonta muodostaa testisuureen nimittäjän pohjan. Sitä käytetään myös vaikutuksen koon (Cohenin d) laskennassa standardointiin. Jos varianssien oletetaan eroavan, käytetään sen sijaan erillistä Welchin menetelmää.
Miksi varianssit painotetaan vapausasteilla?
Suurempi otos antaa tarkemman arvion varianssista, joten sen pitäisi vaikuttaa yhteiseen arvioon enemmän. Painottamalla kummankin otoksen varianssi sen vapausasteilla (n−1) suurempi otos saa suuremman painon. Jako yhteenlasketuilla vapausasteilla (n₁+n₂−2) tuottaa harhattoman arvion yhteisestä varianssista olettaen, että populaatioiden varianssit ovat samat.
Mitä eroa on yhdistetyllä varianssilla ja keskihajonnalla?
Yhdistetty varianssi on painotettu keskiarvo kummankin otoksen varianssista, eli s_p². Yhdistetty keskihajonta on tämän neliöjuuri s_p. Varianssi on neliöyksiköissä, kun taas keskihajonta on alkuperäisen suureen yksiköissä ja siten helpommin tulkittava. T-testissä ja vaikutuksen koossa käytetään keskihajontaa s_p.