Luokitellun aineiston keskihajonta

Laske keskihajonta ja keskiarvo luokitellusta aineistosta eli frekvenssitaulukosta – anna luokkakeskukset ja niiden frekvenssit.

Luokkakeskukset

Anna kunkin luokan keskikohta pilkulla, välilyönnillä tai rivinvaihdolla eroteltuna. Esimerkiksi luokat 0–10, 10–20, … antavat keskukset 5, 15, 25, …

Frekvenssit

Anna kunkin luokan havaintojen lukumäärä samassa järjestyksessä kuin luokkakeskukset.

Korostettava tunnusluku

Tulokset

  • Tulosta
  • Linkitä
  • Luokitellun aineiston keskihajonta – hajonta frekvenssitaulukosta

    Kun aineisto on esitetty luokiteltuna eli frekvenssitaulukkona, alkuperäisiä yksittäisiä arvoja ei tunneta, vaan ainoastaan luokat ja niiden havaintomäärät. Keskihajonta lasketaan tällöin luokkakeskusten avulla. Tämä laskuri antaa keskiarvon, varianssin ja keskihajonnan sekä otoksena että perusjoukkona suoraan frekvenssitaulukosta.

    Mitä luokiteltu aineisto tarkoittaa?

    Luokiteltu aineisto on jaettu väleihin, kuten 0–10, 10–20 ja niin edelleen, ja jokaiselle luokalle on ilmoitettu frekvenssi eli havaintojen lukumäärä. Koska tarkkoja arvoja ei tunneta, oletetaan, että kunkin luokan havainnot sijaitsevat keskimäärin luokan keskikohdassa eli luokkakeskuksessa.

    Kaava ja selitys

    Merkitään luokkakeskusta m:llä ja sen frekvenssiä f:llä. Havaintojen kokonaismäärä on N = Σf. Keskiarvo lasketaan painotettuna:

    x̄ = Σ(f · m) ÷ Σf

    Varianssi on painotettu poikkeamien neliöiden keskiarvo. Perusjoukolle jaetaan N:llä ja otokselle N − 1:llä:

    Perusjoukko: σ² = Σ(f · (m − x̄)²) ÷ N

    Otos: s² = Σ(f · (m − x̄)²) ÷ (N − 1)

    Keskihajonta on varianssin neliöjuuri.

    Vaiheittainen esimerkki

    Frekvenssitaulukossa on luokkakeskukset 5, 15, 25, 35 ja 45 sekä frekvenssit 2, 8, 15, 10 ja 5.

    1. Havaintojen määrä: N = 2 + 8 + 15 + 10 + 5 = 40.
    2. Painotettu summa: Σ(f·m) = 10 + 120 + 375 + 350 + 225 = 1080.
    3. Keskiarvo: x̄ = 1080 ÷ 40 = 27.
    4. Poikkeamien neliösumma: Σ(f·(m − 27)²) = 4440.
    5. Perusjoukon varianssi: 4440 ÷ 40 = 111, keskihajonta √111 ≈ 10,54.
    6. Otosvarianssi: 4440 ÷ 39 ≈ 113,85, keskihajonta ≈ 10,67.

    Luokkakeskuksen valinta

    Luokkakeskus on luokan ala- ja ylärajan keskiarvo. Esimerkiksi luokan 20–30 keskus on (20 + 30) ÷ 2 = 25. Tasavälisillä luokilla keskukset etenevät luokkavälin pituuden mukaisin askelin. Anna laskuriin nämä keskukset ja vastaavat frekvenssit samassa järjestyksessä.

    Tuloksen tulkinta

    Keskihajonta kertoo, kuinka paljon havainnot keskimäärin poikkeavat keskiarvosta. Luokitellusta aineistosta laskettu arvo on aina arvio, koska havaintojen tarkkaa sijaintia luokan sisällä ei tunneta. Mitä kapeampia luokat ovat, sitä lähempänä arvio on raakadatasta laskettua keskihajontaa. Käytä otoksen jakajaa N − 1, kun aineisto on otos suuremmasta joukosta.

    Käyttökohteet

    Usein kysytyt kysymykset

    Mikä on luokiteltu aineisto?
    Luokiteltu eli ryhmitelty aineisto on jaettu luokkiin (väleihin), ja jokaiselle luokalle on ilmoitettu havaintojen lukumäärä eli frekvenssi. Alkuperäisiä yksittäisiä arvoja ei tunneta, vain se, montako havaintoa kuhunkin luokkaan osuu. Tällaista esitystä käytetään frekvenssitaulukoissa ja histogrammeissa.
    Miten keskihajonta lasketaan luokitellusta aineistosta?
    Käytä luokkakeskuksia m alkuperäisten arvojen sijasta. Laske ensin keskiarvo x̄ = Σ(f·m) ÷ Σf. Sen jälkeen varianssi: perusjoukolle Σ(f·(m − x̄)²) ÷ N ja otokselle Σ(f·(m − x̄)²) ÷ (N − 1). Keskihajonta on varianssin neliöjuuri. N on havaintojen kokonaismäärä eli frekvenssien summa.
    Mikä on luokkakeskus?
    Luokkakeskus on luokan ala- ja ylärajan keskiarvo. Esimerkiksi luokan 20–30 keskus on (20 + 30) ÷ 2 = 25. Koska yksittäisiä arvoja ei tunneta, oletetaan että ne sijaitsevat keskimäärin luokkansa keskellä. Tämä oletus tekee tuloksesta arvion.
    Miksi tulos on vain arvio?
    Luokittelussa menetetään tieto havaintojen tarkasta sijainnista luokan sisällä. Kun kaikkien luokan havaintojen oletetaan olevan luokkakeskuksessa, keskihajonta poikkeaa hieman alkuperäisestä raakadatasta lasketusta arvosta. Mitä kapeampia luokat ovat, sitä tarkempi arvio on.
    Käytänkö jakajaa n vai n − 1?
    Käytä jakajaa N (perusjoukko), kun frekvenssitaulukko kattaa koko tutkittavan joukon. Käytä jakajaa N − 1 (otos), kun aineisto on otos suuremmasta perusjoukosta. Tilastollisissa otoksissa käytetään lähes aina jakajaa N − 1, joka antaa harhattoman estimaatin perusjoukon varianssille.
    Oliko tästä laskurista apua?

    Linkitä tämä laskuri

    Kopioi koodi ja liitä se omalle sivustollesi.

    Suositut laskurit