Hajontakuvio

Piirrä x- ja y-arvopareista hajontakuvio ja sovita siihen pienimmän neliösumman trendiviiva korrelaatioineen.

Arvoparit

Syötä x- ja y-arvot samassa järjestyksessä, pilkulla, välilyönnillä tai rivinvaihdolla eroteltuina. Listoissa on oltava yhtä monta arvoa.

Tulokset

  • Tulosta
  • Linkitä
  • Hajontakuvio – pisteparvi ja trendiviiva

    Hajontakuvio on yksi tilastotieteen havainnollisimmista kuvaajista. Se esittää kahden muuttujan havaintoparit pisteinä ja paljastaa yhdellä silmäyksellä, liittyvätkö muuttujat toisiinsa. Tämä laskuri piirtää syöttämistäsi x- ja y-arvoista pisteparven, sovittaa siihen pienimmän neliösumman trendiviivan ja kertoo suoran yhtälön, korrelaation r sekä selitysasteen r².

    Määritelmä

    Hajontakuviossa jokainen havainto koostuu kahdesta arvosta: selittävästä muuttujasta x ja vastemuuttujasta y. Pari (x, y) merkitään yhtenä pisteenä koordinaatistoon. Kun kaikki parit on piirretty, syntyy pisteparvi, jonka muoto kertoo muuttujien yhteydestä: nouseva parvi viittaa positiiviseen riippuvuuteen, laskeva negatiiviseen ja muodoton parvi siihen, ettei lineaarista yhteyttä ole.

    Kaava ja selitys

    Pisteparveen sovitetaan pienimmän neliösumman suora, jonka yhtälö on:

    y = a + b · x

    Kulmakerroin b ja vakio a lasketaan havainnoista:

    b = (n · Σxy − Σx · Σy) ÷ (n · Σx² − (Σx)²)

    a = ȳ − b · x̄

    Kulmakerroin b kertoo, kuinka paljon y muuttuu, kun x kasvaa yhdellä. Vakio a on suoran ja y-akselin leikkauspiste. Yhteyden voimakkuutta mitataan korrelaatiokertoimella r ja selitysasteella r² = r².

    r = (n · Σxy − Σx · Σy) ÷ √[(n · Σx² − (Σx)²)(n · Σy² − (Σy)²)]

    Vaiheittainen esimerkki

    Tarkastellaan viittä havaintoparia: (1, 2), (2, 4), (3, 5), (4, 4) ja (5, 6).

    1. Summat: Σx = 15, Σy = 21, Σxy = 71, Σx² = 55, n = 5.
    2. Kulmakerroin: b = (5 · 71 − 15 · 21) ÷ (5 · 55 − 15²) = (355 − 315) ÷ (275 − 225) = 40 ÷ 50 = 0,8.
    3. Keskiarvot: x̄ = 3, ȳ = 4,2. Vakio: a = 4,2 − 0,8 · 3 = 1,8.
    4. Trendiviiva on siis y = 1,8 + 0,8 · x. Korrelaatio r ≈ 0,853 ja selitysaste r² ≈ 0,727.

    Suora nousee oikealle, joten x:n ja y:n välillä on melko voimakas positiivinen yhteys.

    Tuloksen tulkinta

    Käyttökohteet

    Hajontakuvio osana tilastollista analyysiä

    Hajontakuvio on usein ensimmäinen askel kahden muuttujan analyysissä. Se kannattaa piirtää ennen korrelaation tai regression laskemista, koska kuvaaja paljastaa epälineaariset yhteydet, ryhmittymät ja poikkeavat havainnot, joita pelkkä tunnusluku ei näytä. Lukion matematiikassa pisteparvi ja regressiosuora kuuluvat tilastojen perusteisiin, ja korkeakoulun tilastotieteessä hajontakuvio on vakiotyökalu aineiston tarkastelussa.

    Usein kysytyt kysymykset

    Mikä on hajontakuvio?
    Hajontakuvio eli pisteparvi (scatter plot) on kuvaaja, jossa jokainen havaintopari (x, y) merkitään yhtenä pisteenä koordinaatistoon. Vaaka-akseli vastaa selittävää muuttujaa x ja pystyakseli vastemuuttujaa y. Pisteiden muodostamasta parvesta nähdään, onko muuttujien välillä yhteyttä: nouseva parvi viittaa positiiviseen ja laskeva negatiiviseen riippuvuuteen.
    Miten trendiviiva lasketaan?
    Trendiviiva on pienimmän neliösumman suora y = a + b·x. Kulmakerroin b = (n·Σxy − Σx·Σy) ÷ (n·Σx² − (Σx)²) ja vakio a = ȳ − b·x̄. Suora kulkee niin, että pystysuuntaisten poikkeamien neliöiden summa pisteistä suoralle on mahdollisimman pieni. Se on sama suora kuin lineaarisessa regressiossa.
    Mitä korrelaatiokerroin r kertoo hajontakuviossa?
    Korrelaatiokerroin r kuvaa lineaarisen yhteyden suuntaa ja voimakkuutta välillä −1…+1. Arvo lähellä +1 tarkoittaa, että pisteet asettuvat nousevalle suoralle, lähellä −1 laskevalle suoralle ja lähellä nollaa hajanaiseen parveen. Selitysaste r² (r:n neliö) kertoo, kuinka suuren osan y:n vaihtelusta suora selittää.
    Kuinka monta pistettä hajontakuvioon tarvitaan?
    Pisteitä tarvitaan vähintään kaksi, jotta suora voidaan piirtää, mutta luotettava kuva yhteydestä syntyy vasta useammasta havainnosta. Mitä enemmän pareja, sitä paremmin parvi ja trendiviiva kuvaavat muuttujien todellista riippuvuutta. Yksittäiset poikkeavat havainnot voivat vetää suoraa puoleensa, joten ne kannattaa tunnistaa kuvaajasta.
    Voiko hajontakuviosta päätellä syy-yhteyden?
    Ei suoraan. Hajontakuvio ja korrelaatio kertovat vain, että muuttujat vaihtelevat yhdessä, eivät sitä, että toinen aiheuttaa toisen. Yhteys voi johtua kolmannesta tekijästä tai sattumasta. Syy-seuraussuhteen osoittaminen vaatii koeasetelmaa tai muuta lisätietoa pelkän kuvaajan lisäksi.
    Oliko tästä laskurista apua?

    Linkitä tämä laskuri

    Kopioi koodi ja liitä se omalle sivustollesi.

    Suositut laskurit