Frekvenssijakauma kokoaa havaintoaineiston taulukoksi, jossa näkyy kunkin arvon esiintymiskertojen lukumäärä eli frekvenssi. Tämä laskuri muodostaa frekvenssitaulukon automaattisesti: se laskee frekvenssin, suhteellisen frekvenssin prosentteina sekä kumulatiiviset frekvenssit jokaiselle aineistossa esiintyvälle arvolle.
Määritelmä
Frekvenssi (f) on luku, joka kertoo, montako kertaa tietty arvo esiintyy aineistossa. Suhteellinen frekvenssi on tämä luku jaettuna havaintojen kokonaismäärällä N. Kumulatiivinen frekvenssi kertyy ylhäältä alas: se on kyseiseen arvoon mennessä laskettujen frekvenssien summa.
Kaava ja selitys
Suhteellinen frekvenssi lasketaan jakamalla luokan frekvenssi kokonaismäärällä:
suhteellinen frekvenssi = f ÷ N
Kumulatiivinen frekvenssi on järjestyksessä siihen asti kertyneiden frekvenssien summa:
kumulatiivinen frekvenssi = f₁ + f₂ + … + fₖ
Tässä N on havaintojen kokonaismäärä ja fₖ on k:nnen arvon frekvenssi. Kaikkien frekvenssien summa on N ja kaikkien suhteellisten frekvenssien summa on 1 eli 100 %.
Vaiheittainen esimerkki
Aineisto: 2, 3, 3, 5. Havaintojen kokonaismäärä N = 4.
Kumulatiiviset frekvenssit: 1, sitten 1 + 2 = 3, sitten 3 + 1 = 4 = N.
Taulukosta nähdään, että arvo 3 on yleisin (moodi) ja että puolet havainnoista on enintään arvon 3 suuruisia.
Tuloksen tulkinta
Frekvenssitaulukosta luetaan suoraan aineiston rakenne:
Suurin frekvenssi osoittaa moodin eli yleisimmän arvon.
Suhteellinen frekvenssi kertoo arvon osuuden koko aineistosta.
Kumulatiivisen suhteellisen frekvenssin avulla löytyy mediaani (50 %:n kohta) ja persentiilit.
Käyttökohteet
Kyselyaineistot: vastausvaihtoehtojen osuudet.
Arvosanat ja pisteet: jakautuminen ja yleisimmät arvot.
Kuvaajat: pylväsdiagrammin ja histogrammin pohja.
Tunnusluvut: moodin, mediaanin ja persentiilien paikantaminen.
Missä frekvenssijakaumaa käsitellään opinnoissa?
Frekvenssijakauma on tilastotieteen perusteiden ensimmäisiä aiheita. Peruskoulun ja lukion matematiikassa harjoitellaan frekvenssitaulukon laatimista, suhteellisten frekvenssien laskemista ja jakauman kuvaamista pylväsdiagrammilla. Taulukko toimii pohjana keskiluvuille (keskiarvo, mediaani, moodi) sekä jatkuvan aineiston luokittelulle histogrammia varten.
Usein kysytyt kysymykset
Mikä on frekvenssijakauma?
Frekvenssijakauma on taulukko, joka kertoo, kuinka monta kertaa kukin arvo (tai luokka) esiintyy aineistossa. Esiintymiskertojen lukumäärää kutsutaan frekvenssiksi ja merkitään f. Frekvenssijakauma tiivistää suuren havaintojoukon helposti luettavaan muotoon ja on lähtökohta monille tilastollisille tunnusluvuille ja kuvaajille, kuten histogrammille.
Mitä suhteellinen frekvenssi tarkoittaa?
Suhteellinen frekvenssi on yksittäisen arvon frekvenssi jaettuna havaintojen kokonaismäärällä N. Se kertoo, kuinka suuren osuuden koko aineistosta arvo muodostaa, ja ilmaistaan usein prosentteina. Kaikkien suhteellisten frekvenssien summa on aina 1 eli 100 %. Esimerkiksi jos arvo esiintyy 5 kertaa ja N = 20, suhteellinen frekvenssi on 5 ÷ 20 = 0,25 eli 25 %.
Mitä kumulatiivinen frekvenssi tarkoittaa?
Kumulatiivinen frekvenssi eli summafrekvenssi on kyseiseen arvoon mennessä kertynyt frekvenssien summa. Se kertoo, kuinka monta havaintoa on pienempiä tai yhtä suuria kuin tarkasteltava arvo. Vastaavasti kumulatiivinen suhteellinen frekvenssi kertoo saman osuutena. Kumulatiiviset frekvenssit ovat hyödyllisiä esimerkiksi mediaanin ja persentiilien paikantamisessa.
Mitä eroa on frekvenssillä ja luokkafrekvenssillä?
Kun aineistossa on vähän eri arvoja, jokaiselle arvolle voidaan laskea oma frekvenssi. Kun arvoja on paljon tai ne ovat jatkuvia (esimerkiksi pituuksia), arvot ryhmitellään luokkiin ja lasketaan luokkafrekvenssit. Tämä laskuri tekee frekvenssitaulukon yksittäisistä arvoista; jos haluat ryhmitellä luokkiin, käytä histogrammilaskuria, joka jakaa aineiston luokkaväleihin.
Mihin frekvenssitaulukkoa käytetään?
Frekvenssitaulukkoa käytetään aineiston jakauman kuvaamiseen ja jatkoanalyysin pohjana. Sen avulla nähdään, mitkä arvot ovat yleisiä ja mitkä harvinaisia, voidaan paikantaa moodi (yleisin arvo) ja mediaani sekä piirtää pylväs- tai histogrammikuvaaja. Taulukko on myös perusta suhteellisten ja kumulatiivisten frekvenssien laskennalle.