Piirrä x- ja y-arvopareista hajontakuvio ja sovita siihen pienimmän neliösumman trendiviiva korrelaatioineen.
Arvoparit
Syötä x- ja y-arvot samassa järjestyksessä, pilkulla, välilyönnillä tai rivinvaihdolla eroteltuina. Listoissa on oltava yhtä monta arvoa.
Tulokset
Hajontakuvio – pisteparvi ja trendiviiva
Hajontakuvio on yksi tilastotieteen havainnollisimmista kuvaajista. Se esittää kahden muuttujan havaintoparit pisteinä ja paljastaa yhdellä silmäyksellä, liittyvätkö muuttujat toisiinsa. Tämä laskuri piirtää syöttämistäsi x- ja y-arvoista pisteparven, sovittaa siihen pienimmän neliösumman trendiviivan ja kertoo suoran yhtälön, korrelaation r sekä selitysasteen r².
Määritelmä
Hajontakuviossa jokainen havainto koostuu kahdesta arvosta: selittävästä muuttujasta x ja vastemuuttujasta y. Pari (x, y) merkitään yhtenä pisteenä koordinaatistoon. Kun kaikki parit on piirretty, syntyy pisteparvi, jonka muoto kertoo muuttujien yhteydestä: nouseva parvi viittaa positiiviseen riippuvuuteen, laskeva negatiiviseen ja muodoton parvi siihen, ettei lineaarista yhteyttä ole.
Kaava ja selitys
Pisteparveen sovitetaan pienimmän neliösumman suora, jonka yhtälö on:
y = a + b · x
Kulmakerroin b ja vakio a lasketaan havainnoista:
b = (n · Σxy − Σx · Σy) ÷ (n · Σx² − (Σx)²)
a = ȳ − b · x̄
Kulmakerroin b kertoo, kuinka paljon y muuttuu, kun x kasvaa yhdellä. Vakio a on suoran ja y-akselin leikkauspiste. Yhteyden voimakkuutta mitataan korrelaatiokertoimella r ja selitysasteella r² = r².
Trendiviiva on siis y = 1,8 + 0,8 · x. Korrelaatio r ≈ 0,853 ja selitysaste r² ≈ 0,727.
Suora nousee oikealle, joten x:n ja y:n välillä on melko voimakas positiivinen yhteys.
Tuloksen tulkinta
Kulmakertoimen merkki: positiivinen b tarkoittaa nousevaa ja negatiivinen laskevaa trendiä.
Korrelaatio r: mitä lähempänä arvoa ±1, sitä tiukemmin pisteet asettuvat suoralle.
Selitysaste r²: esimerkiksi r² = 0,73 tarkoittaa, että suora selittää noin 73 % y:n vaihtelusta.
Hajonta: jos pisteet ovat kaukana suorasta, malli ennustaa heikosti, vaikka kulmakerroin olisi nollasta poikkeava.
Käyttökohteet
Tutkimus: kahden mitatun suureen yhteyden havainnollistaminen, esimerkiksi pituus ja paino.
Talous: myynnin ja mainoskulujen tai hinnan ja kysynnän tarkastelu.
Laadunvalvonta: prosessimuuttujan ja lopputuotteen ominaisuuden riippuvuus.
Opetus: regressiosuoran ja korrelaation käsitteiden havainnollistaminen.
Hajontakuvio osana tilastollista analyysiä
Hajontakuvio on usein ensimmäinen askel kahden muuttujan analyysissä. Se kannattaa piirtää ennen korrelaation tai regression laskemista, koska kuvaaja paljastaa epälineaariset yhteydet, ryhmittymät ja poikkeavat havainnot, joita pelkkä tunnusluku ei näytä. Lukion matematiikassa pisteparvi ja regressiosuora kuuluvat tilastojen perusteisiin, ja korkeakoulun tilastotieteessä hajontakuvio on vakiotyökalu aineiston tarkastelussa.
Usein kysytyt kysymykset
Mikä on hajontakuvio?
Hajontakuvio eli pisteparvi (scatter plot) on kuvaaja, jossa jokainen havaintopari (x, y) merkitään yhtenä pisteenä koordinaatistoon. Vaaka-akseli vastaa selittävää muuttujaa x ja pystyakseli vastemuuttujaa y. Pisteiden muodostamasta parvesta nähdään, onko muuttujien välillä yhteyttä: nouseva parvi viittaa positiiviseen ja laskeva negatiiviseen riippuvuuteen.
Miten trendiviiva lasketaan?
Trendiviiva on pienimmän neliösumman suora y = a + b·x. Kulmakerroin b = (n·Σxy − Σx·Σy) ÷ (n·Σx² − (Σx)²) ja vakio a = ȳ − b·x̄. Suora kulkee niin, että pystysuuntaisten poikkeamien neliöiden summa pisteistä suoralle on mahdollisimman pieni. Se on sama suora kuin lineaarisessa regressiossa.
Mitä korrelaatiokerroin r kertoo hajontakuviossa?
Korrelaatiokerroin r kuvaa lineaarisen yhteyden suuntaa ja voimakkuutta välillä −1…+1. Arvo lähellä +1 tarkoittaa, että pisteet asettuvat nousevalle suoralle, lähellä −1 laskevalle suoralle ja lähellä nollaa hajanaiseen parveen. Selitysaste r² (r:n neliö) kertoo, kuinka suuren osan y:n vaihtelusta suora selittää.
Kuinka monta pistettä hajontakuvioon tarvitaan?
Pisteitä tarvitaan vähintään kaksi, jotta suora voidaan piirtää, mutta luotettava kuva yhteydestä syntyy vasta useammasta havainnosta. Mitä enemmän pareja, sitä paremmin parvi ja trendiviiva kuvaavat muuttujien todellista riippuvuutta. Yksittäiset poikkeavat havainnot voivat vetää suoraa puoleensa, joten ne kannattaa tunnistaa kuvaajasta.
Voiko hajontakuviosta päätellä syy-yhteyden?
Ei suoraan. Hajontakuvio ja korrelaatio kertovat vain, että muuttujat vaihtelevat yhdessä, eivät sitä, että toinen aiheuttaa toisen. Yhteys voi johtua kolmannesta tekijästä tai sattumasta. Syy-seuraussuhteen osoittaminen vaatii koeasetelmaa tai muuta lisätietoa pelkän kuvaajan lisäksi.