Muodosta aineistosta histogrammi: luokittele havainnot tasalevyisiin luokkiin ja näe frekvenssit, luokkavälit sekä pylväskuvaaja.
Aineisto
Syötä havainnot pilkulla, välilyönnillä tai rivinvaihdolla eroteltuina.
Luokkien määrä
Anna luokkien lukumäärä tai jätä 0, jolloin laskuri valitsee sen Sturgesin säännöllä k = 1 + 3,322 · log₁₀(n).
Tulokset
Histogrammilaskuri – aineiston luokittelu ja jakauman kuva
Histogrammi näyttää, miten aineiston arvot jakautuvat tasalevyisiin luokkiin. Tämä laskuri jakaa havainnot luokkaväleihin, laskee jokaisen luokan rajat, keskiarvon, frekvenssin ja suhteellisen frekvenssin sekä piirtää jakauman pylväskuvaajana. Luokkien määrän voit antaa itse tai jättää Sturgesin sääntöön perustuvaan automaattiseen valintaan.
Määritelmä
Histogrammi on jatkuvan aineiston jakaumakuvaaja. Arvot ryhmitellään peräkkäisiin, yhtä leveisiin luokkiin, ja kunkin luokan frekvenssi esitetään pylvään korkeutena. Pylväät ovat kiinni toisissaan, koska luokkavälit kattavat koko vaihtelualueen aukottomasti.
Kaava ja selitys
Luokkien lukumäärä arvioidaan usein Sturgesin säännöllä:
k = 1 + 3,322 · log₁₀(n)
Luokkavälin leveys saadaan vaihteluvälistä jaettuna luokkien määrällä:
leveys = (suurin − pienin) ÷ k
Yksittäisen luokan keskiarvo eli luokkakeskus on:
luokkakeskus = (alaraja + yläraja) ÷ 2
Tässä n on havaintojen lukumäärä ja k luokkien määrä. Suhteellinen frekvenssi on luokan frekvenssi jaettuna kokonaismäärällä N.
Vaiheittainen esimerkki
Aineistossa on 12 koetulosta välillä 52–96. Valitaan luokkia k = 5.
Luokat ovat 52–61, 61–70, 70–79, 79–88, 88–97; lasketaan kuhunkin osuvat havainnot.
Pylväiden korkeudet ovat luokkien frekvenssit, ja kuvaaja näyttää jakauman muodon.
Tuloksen tulkinta
Histogrammin muoto kertoo aineiston rakenteesta:
Symmetrinen, yksihuippuinen: arvot keskittyvät keskelle (lähellä normaalia).
Vino: häntä venyy oikealle (oikea vinous) tai vasemmalle (vasen vinous).
Monihuippuinen: useita keskittymiä – aineisto voi koostua eri ryhmistä.
Luokkien määrän muuttaminen vaikuttaa kuvaan: liian harvat luokat tasoittavat ja liian monet rosottavat jakauman.
Käyttökohteet
Laadunvalvonta: mittausten hajonta ja keskittyminen.
Tutkimus: jakauman muodon arviointi ennen analyysiä.
Koetulokset: arvosanojen ja pisteiden jakautuminen.
Poikkeavat arvot: erillään olevien luokkien tunnistaminen.
Missä histogrammia käsitellään opinnoissa?
Histogrammi kuuluu tilastotieteen perusteisiin. Peruskoulun ja lukion matematiikassa harjoitellaan aineiston luokittelua, luokkavälin leveyden laskemista ja histogrammin piirtämistä. Yliopistossa histogrammi on keskeinen työkalu tutkivassa data-analyysissä ja jakaumaoletusten tarkistamisessa, ja se liittyy läheisesti tiheysfunktioon ja frekvenssijakaumaan.
Usein kysytyt kysymykset
Mikä on histogrammi?
Histogrammi on pylväskuvaaja, joka esittää jatkuvan tai luokitellun aineiston jakauman. Aineisto jaetaan tasalevyisiin luokkiin eli luokkaväleihin, ja kunkin luokan frekvenssi piirretään pylvään korkeudeksi. Toisin kuin tavallisessa pylväsdiagrammissa, histogrammin pylväät ovat kiinni toisissaan, koska luokkavälit ovat peräkkäisiä ja jatkuvia. Histogrammi paljastaa jakauman muodon: onko se symmetrinen, vino tai monihuippuinen.
Kuinka monta luokkaa histogrammiin kannattaa valita?
Yleinen ohje on Sturgesin sääntö: luokkien lukumäärä k = 1 + 3,322 · log₁₀(n), jossa n on havaintojen määrä. Esimerkiksi 50 havainnolle k ≈ 1 + 3,322 · 1,70 ≈ 6,6 eli noin 7 luokkaa. Muita ohjeita ovat neliöjuurisääntö (√n) ja Ricen sääntö (2 · n^(1/3)). Liian harvat luokat peittävät yksityiskohdat ja liian monet tekevät kuvaajasta rosoisen, joten arvoa kannattaa säätää aineiston mukaan.
Miten luokkavälin leveys lasketaan?
Luokkavälin leveys saadaan jakamalla aineiston vaihteluväli luokkien lukumäärällä: leveys = (suurin − pienin) ÷ k. Tulos pyöristetään yleensä ylöspäin sopivaan tasalukuun, jotta luokkarajat ovat selkeitä. Esimerkiksi jos arvot ovat välillä 10–58 ja luokkia on 6, leveys on (58 − 10) ÷ 6 = 8. Kaikki luokat ovat tällöin yhtä leveitä.
Mikä on luokan keskiarvo eli luokkakeskus?
Luokan keskiarvo eli luokkakeskus on luokan ala- ja ylärajan keskiarvo: (alaraja + yläraja) ÷ 2. Sitä käytetään edustamaan koko luokkaa esimerkiksi laskettaessa luokitellun aineiston keskiarvoa tai keskihajontaa. Esimerkiksi luokan 10–18 keskus on (10 + 18) ÷ 2 = 14. Luokkakeskukset ovat hyödyllisiä, kun alkuperäisiä yksittäisiä arvoja ei ole käytettävissä.
Mihin histogrammia käytetään?
Histogrammia käytetään suuren aineiston jakauman havainnollistamiseen. Sen avulla nähdään, mihin arvot keskittyvät, kuinka leveä hajonta on ja onko jakauma vino. Histogrammi auttaa myös tunnistamaan poikkeavia arvoja ja arvioimaan, voidaanko aineistoa pitää likimain normaalijakautuneena. Sitä hyödynnetään laajasti laadunvalvonnassa, tutkimuksessa ja datan tutkivassa analyysissä.