Luokitellun aineiston keskihajonta – hajonta frekvenssitaulukosta
Kun aineisto on esitetty luokiteltuna eli frekvenssitaulukkona, alkuperäisiä yksittäisiä arvoja ei tunneta, vaan ainoastaan luokat ja niiden havaintomäärät. Keskihajonta lasketaan tällöin luokkakeskusten avulla. Tämä laskuri antaa keskiarvon, varianssin ja keskihajonnan sekä otoksena että perusjoukkona suoraan frekvenssitaulukosta.
Mitä luokiteltu aineisto tarkoittaa?
Luokiteltu aineisto on jaettu väleihin, kuten 0–10, 10–20 ja niin edelleen, ja jokaiselle luokalle on ilmoitettu frekvenssi eli havaintojen lukumäärä. Koska tarkkoja arvoja ei tunneta, oletetaan, että kunkin luokan havainnot sijaitsevat keskimäärin luokan keskikohdassa eli luokkakeskuksessa.
Kaava ja selitys
Merkitään luokkakeskusta m:llä ja sen frekvenssiä f:llä. Havaintojen kokonaismäärä on N = Σf. Keskiarvo lasketaan painotettuna:
x̄ = Σ(f · m) ÷ Σf
Varianssi on painotettu poikkeamien neliöiden keskiarvo. Perusjoukolle jaetaan N:llä ja otokselle N − 1:llä:
Perusjoukko: σ² = Σ(f · (m − x̄)²) ÷ N
Otos: s² = Σ(f · (m − x̄)²) ÷ (N − 1)
Keskihajonta on varianssin neliöjuuri.
Vaiheittainen esimerkki
Frekvenssitaulukossa on luokkakeskukset 5, 15, 25, 35 ja 45 sekä frekvenssit 2, 8, 15, 10 ja 5.
- Havaintojen määrä: N = 2 + 8 + 15 + 10 + 5 = 40.
- Painotettu summa: Σ(f·m) = 10 + 120 + 375 + 350 + 225 = 1080.
- Keskiarvo: x̄ = 1080 ÷ 40 = 27.
- Poikkeamien neliösumma: Σ(f·(m − 27)²) = 4440.
- Perusjoukon varianssi: 4440 ÷ 40 = 111, keskihajonta √111 ≈ 10,54.
- Otosvarianssi: 4440 ÷ 39 ≈ 113,85, keskihajonta ≈ 10,67.
Luokkakeskuksen valinta
Luokkakeskus on luokan ala- ja ylärajan keskiarvo. Esimerkiksi luokan 20–30 keskus on (20 + 30) ÷ 2 = 25. Tasavälisillä luokilla keskukset etenevät luokkavälin pituuden mukaisin askelin. Anna laskuriin nämä keskukset ja vastaavat frekvenssit samassa järjestyksessä.
Tuloksen tulkinta
Keskihajonta kertoo, kuinka paljon havainnot keskimäärin poikkeavat keskiarvosta. Luokitellusta aineistosta laskettu arvo on aina arvio, koska havaintojen tarkkaa sijaintia luokan sisällä ei tunneta. Mitä kapeampia luokat ovat, sitä lähempänä arvio on raakadatasta laskettua keskihajontaa. Käytä otoksen jakajaa N − 1, kun aineisto on otos suuremmasta joukosta.
Käyttökohteet
- Kyselytutkimukset: ikä- tai tuloluokkiin ryhmitellyt vastaukset.
- Histogrammit: hajonnan arviointi luokkien ja frekvenssien pohjalta.
- Raportointi: tilanteet, joissa vain frekvenssitaulukko on käytettävissä.
- Opetus: luokitellun aineiston tunnuslukujen laskennan harjoittelu.