Laske aineiston poikkeamien neliöiden summa SS = Σ (x − x̄)² sekä siihen perustuvat varianssit.
Aineisto
Syötä havainnot pilkulla, välilyönnillä tai rivinvaihdolla eroteltuina.
Tulokset
Neliösumma – poikkeamien neliöiden summa
Neliösumma (sum of squares, SS) on yksi tilastotieteen peruskäsitteistä. Se mittaa aineiston kokonaisvaihtelua laskemalla yhteen havaintojen poikkeamien neliöt keskiarvosta. Neliösumma on varianssin, keskihajonnan, regression ja varianssianalyysin perusta. Tämä laskuri laskee neliösumman syöttämästäsi aineistosta ja näyttää myös siihen perustuvat varianssit.
Määritelmä
Neliösumma on havaintojen ja keskiarvon erotusten neliöiden summa. Jokainen poikkeama kertoo, kuinka kaukana yksittäinen arvo on keskiarvosta. Neliöön korottaminen tekee poikkeamista positiivisia ja painottaa suuria poikkeamia, joten neliösumma kuvaa aineiston kokonaishajontaa. Se kasvaa, kun arvot leviävät kauemmas keskiarvosta.
Kaava ja selitys
Neliösumma määritellään poikkeamien neliöiden summana:
SS = Σ (xᵢ − x̄)²
Sama tulos saadaan käytännöllisellä laskukaavalla, jossa keskiarvoa ei tarvitse vähentää erikseen:
SS = Σx² − (Σx)² ÷ n
Tässä x̄ on keskiarvo, Σx arvojen summa, Σx² niiden neliöiden summa ja n havaintojen lukumäärä. Neliösummasta saadaan varianssi jakamalla se luvulla n (populaatio) tai n − 1 (otos).
Populaatiovarianssi on 20 ÷ 4 = 5 ja otosvarianssi 20 ÷ 3 ≈ 6,67.
Tuloksen tulkinta
Suuri neliösumma tarkoittaa, että havainnot ovat kaukana keskiarvosta – aineistossa on paljon vaihtelua.
Neliösumma 0 tarkoittaa, että kaikki arvot ovat keskiarvon suuruisia – vaihtelua ei ole.
Varianssi on neliösumma havaintoa kohti, joten se on vertailukelpoinen eri kokoisten aineistojen välillä.
Yksiköt: neliösumma on alkuperäisen suureen neliöyksiköissä – keskihajonta palauttaa alkuperäisen yksikön.
Käyttökohteet
Varianssi ja keskihajonta: neliösumma on niiden laskennan ydin.
Regressio: jäännösneliösumman ja selitetyn neliösumman vertailu (selitysaste r²).
Varianssianalyysi (ANOVA): kokonaisneliösumman jako ryhmien sisäiseen ja väliseen osaan.
Laadunvalvonta: mittausten vaihtelun seuranta.
Neliösumma tilastollisen analyysin perustana
Neliösumma on niin keskeinen, että monet tilastomenetelmät rakentuvat sen ympärille. Varianssi on neliösumma jaettuna vapausasteilla, ja varianssianalyysissä koko aineiston neliösumma pilkotaan osiin, jotka kuvaavat ryhmien välistä ja sisäistä vaihtelua. Regressiossa puolestaan verrataan mallin selittämää ja selittämättä jäänyttä neliösummaa. Neliösumman ymmärtäminen avaa siten useimpien hajontaan perustuvien menetelmien logiikan.
Usein kysytyt kysymykset
Mikä on neliösumma (SS)?
Neliösumma eli poikkeamien neliöiden summa on SS = Σ (xᵢ − x̄)². Se mittaa, kuinka kaukana havainnot ovat keskimäärin keskiarvosta: jokaisesta arvosta vähennetään keskiarvo, erotus korotetaan neliöön ja neliöt summataan. Mitä suurempi neliösumma, sitä enemmän aineistossa on vaihtelua. SS on varianssin ja keskihajonnan perusta.
Miksi poikkeamat korotetaan neliöön?
Jos poikkeamat keskiarvosta laskettaisiin yhteen sellaisenaan, summa olisi aina nolla, koska positiiviset ja negatiiviset poikkeamat kumoavat toisensa. Neliöön korottaminen tekee kaikista poikkeamista positiivisia ja korostaa suuria poikkeamia. Näin neliösumma kuvaa hajontaa eikä mene nollaan. Sama periaate on varianssin ja keskihajonnan taustalla.
Miten neliösummasta saadaan varianssi?
Varianssi on neliösumma jaettuna havaintojen lukumäärällä. Populaatiovarianssi on SS ÷ n ja otosvarianssi SS ÷ (n − 1). Otosvarianssissa jaetaan luvulla n − 1, jotta otoksesta saatava arvio populaation varianssista olisi harhaton. Keskihajonta on varianssin neliöjuuri.
Voiko neliösumman laskea ilman keskiarvon vähentämistä?
Kyllä, samaan tulokseen pääsee laskukaavalla SS = Σx² − (Σx)² ÷ n, jossa Σx on arvojen summa ja Σx² niiden neliöiden summa. Tämä kaava on usein nopeampi käsin laskettaessa, koska keskiarvoa ei tarvitse vähentää jokaisesta arvosta erikseen. Tulos on täsmälleen sama kuin poikkeamien neliöistä laskettuna.
Mihin neliösummaa käytetään?
Neliösumma on keskeinen monissa tilastomenetelmissä. Se on varianssin ja keskihajonnan laskennan ydin, ja se esiintyy regressiossa (selitettyä ja jäännösneliösummaa vertaillaan) sekä varianssianalyysissä (ANOVA), jossa kokonaisneliösumma jaetaan ryhmien sisäiseen ja väliseen osaan. Neliösumma on siten hajonnan perusmitta.