Kovarianssi

Laske kahden muuttujan kovarianssi eli yhteisvaihtelu havaintopareista (x, y) – sekä otoksena (n − 1) että perusjoukkona (n).

Havaintoparit (x, y)

Syötä x- ja y-arvot samassa järjestyksessä ja yhtä monta kumpaakin. Erota luvut pilkulla, välilyönnillä tai rivinvaihdolla, desimaalit pisteellä.

Korostettava kovarianssi

Tulokset

  • Tulosta
  • Linkitä
  • Kovarianssi – kahden muuttujan yhteisvaihtelu

    Kovarianssi kertoo, vaihtelevatko kaksi muuttujaa samaan vai eri suuntaan. Se on korrelaation ja monien tilastomenetelmien perusta. Tällä laskurilla saat kovarianssin sekä otoksena että perusjoukkona ja näet samalla korrelaatiokertoimen, joka tekee tuloksesta helpommin tulkittavan.

    Määritelmä

    Kovarianssi on havaintoparien poikkeamatulojen keskiarvo: kunkin parin x-poikkeama keskiarvostaan kerrotaan y-poikkeamalla keskiarvostaan, ja näiden tulojen keskiarvo on kovarianssi. Positiivinen tulo syntyy, kun molemmat ovat samalla puolella keskiarvoaan, ja negatiivinen, kun ne ovat eri puolilla.

    Kaava ja selitys

    Kovarianssi lasketaan perusjoukolle jakajalla n ja otokselle jakajalla n − 1:

    Perusjoukko: Cov = Σ(xᵢ − x̄)(yᵢ − ȳ) ÷ n

    Otos: Cov = Σ(xᵢ − x̄)(yᵢ − ȳ) ÷ (n − 1)

    Kaavassa ja ȳ ovat muuttujien keskiarvot. Kovarianssi on samassa yksikössä kuin x:n ja y:n yksiköiden tulo, mikä tekee sen suorasta tulkinnasta hankalaa – siksi se usein standardoidaan korrelaatiokertoimeksi.

    Yhteys korrelaatioon

    Korrelaatiokerroin saadaan jakamalla kovarianssi muuttujien keskihajontojen tulolla:

    r = Cov(x, y) ÷ (sₓ × s_y)

    Näin saatu arvo on aina väliltä −1 ja 1 ja kuvaa yhteyden voimakkuutta yksiköttömänä.

    Vaiheittainen esimerkki

    Otetaan parit (1, 2), (2, 4), (3, 6).

    1. Keskiarvot: x̄ = 2, ȳ = 4.
    2. Poikkeamatulot: (1−2)(2−4) + (2−2)(4−4) + (3−2)(6−4) = 2 + 0 + 2 = 4.
    3. Otoskovarianssi: 4 ÷ (3 − 1) = 2. Perusjoukon kovarianssi: 4 ÷ 3 ≈ 1,333.

    Kovarianssi on positiivinen, joten muuttujat kasvavat yhdessä – tässä tapauksessa korrelaatio on jopa täydellinen (r = 1).

    Tuloksen tulkinta

    Kovarianssin lukuarvoa ei kannata verrata eri aineistojen välillä, koska se riippuu yksiköistä. Vertailuun käytetään korrelaatiokerrointa.

    Käyttökohteet

    Kovarianssi opinnoissa

    Kovarianssi kuuluu tilastotieteen perusteisiin ja on korrelaation välitön esiaste. Lukion pitkän matematiikan tilasto- ja regressio-osiossa käsitellään muuttujien yhteyttä, ja kovarianssi on käsitteellinen silta poikkeamista korrelaatioon. Yliopiston tilastotieteessä kovarianssi ja kovarianssimatriisi ovat keskeisiä monimuuttujamenetelmissä, kuten regressiossa ja pääkomponenttianalyysissä.

    Usein kysytyt kysymykset

    Mikä on kovarianssi?
    Kovarianssi mittaa, miten kaksi muuttujaa vaihtelevat yhdessä. Positiivinen kovarianssi tarkoittaa, että kun toinen muuttuja on keskiarvoaan suurempi, myös toinen on yleensä suurempi. Negatiivinen kovarianssi tarkoittaa päinvastaista yhteyttä, ja lähellä nollaa oleva arvo viittaa siihen, ettei lineaarista yhteyttä juuri ole.
    Mitä eroa on kovarianssilla ja korrelaatiolla?
    Molemmat mittaavat muuttujien yhteyttä, mutta kovarianssin suuruus riippuu muuttujien yksiköistä, joten sitä on vaikea tulkita suoraan. Korrelaatiokerroin on standardoitu kovarianssi, joka jaetaan keskihajontojen tulolla, jolloin se on aina väliltä −1 ja 1. Korrelaatio kertoo yhteyden voimakkuuden yksiköttömänä.
    Milloin käytän jakajaa n ja milloin n − 1?
    Käytä jakajaa n (perusjoukon kovarianssi), kun havaintoparit kattavat koko tarkasteltavan joukon. Käytä jakajaa n − 1 (otoskovarianssi), kun parit ovat otos suuremmasta perusjoukosta ja haluat harhattoman estimaatin. Tutkimuksessa käytetään lähes aina jakajaa n − 1.
    Mitä kovarianssin etumerkki kertoo?
    Positiivinen kovarianssi tarkoittaa, että muuttujat liikkuvat samaan suuntaan: kun toinen kasvaa, myös toinen yleensä kasvaa. Negatiivinen kovarianssi tarkoittaa, että ne liikkuvat vastakkaisiin suuntiin. Nolla tarkoittaa, ettei lineaarista yhteyttä ole, vaikka epälineaarinen riippuvuus olisi yhä mahdollinen.
    Voiko kovarianssin arvoa verrata eri aineistojen välillä?
    Suoraan ei, koska kovarianssin suuruus riippuu muuttujien mittayksiköistä ja vaihteluvälistä. Eri aineistojen yhteyksien vertailuun käytetään korrelaatiokerrointa, joka on standardoitu ja yksikötön. Kovarianssi on kuitenkin korrelaation ja monien tilastomenetelmien, kuten regression ja pääkomponenttianalyysin, perusta.
    Oliko tästä laskurista apua?

    Linkitä tämä laskuri

    Kopioi koodi ja liitä se omalle sivustollesi.

    Suositut laskurit