Laske khiin neliö -testisuure (χ²) havaituista ja odotetuista frekvensseistä – sekä yhteensopivuus- että riippumattomuustesti.
Testin tyyppi ja merkitsevyystaso
Havaitut ja odotetut frekvenssit
Anna havaitut frekvenssit ja odotetut frekvenssit samassa järjestyksessä, pilkulla tai välilyönnillä eroteltuina. Odotetut voivat olla lukumääriä tai suhteita (skaalataan havaintojen summaan).
Ristiintaulukon havaitut arvot
Syötä taulukko riveittäin: yksi rivi per tekstirivi, solut eroteltuina pilkulla, välilyönnillä tai sarkaimella. Odotetut arvot lasketaan automaattisesti.
Tulokset
Khiin neliö -testi (χ²) – havaitut vastaan odotetut frekvenssit
Khiin neliö -testi vertaa havaittuja frekvenssejä odotettuihin ja kertoo, ovatko erot tilastollisesti merkitseviä. Tämä laskuri tukee kahta yleisintä χ²-testiä: yhteensopivuustestiä (sopiiko jakauma odotettuun) ja riippumattomuustestiä (ovatko kaksi muuttujaa riippumattomia ristiintaulukossa). Saat χ²-arvon, vapausasteet ja p-arvon heti.
Määritelmä
Khiin neliö -testisuure mittaa, kuinka kaukana havaitut frekvenssit ovat odotetuista. Jos havaitut ja odotetut ovat lähellä toisiaan, χ² on pieni eikä eroa ole. Jos ne poikkeavat selvästi, χ² kasvaa ja ero voi olla merkitsevä. Testisuuretta verrataan khiin neliö -jakaumaan, jonka muoto riippuu vapausasteista.
Kaava ja selitys
Molemmissa testeissä testisuure lasketaan samalla kaavalla:
χ² = Σ (havaittu − odotettu)² ÷ odotettu
Vapausasteet riippuvat testistä:
Yhteensopivuustesti: df = k − 1, jossa k on luokkien lukumäärä.
Riippumattomuustesti: df = (r − 1)(c − 1), jossa r on rivien ja c sarakkeiden lukumäärä.
Riippumattomuustestissä kunkin solun odotettu arvo lasketaan kaavalla:
odotettu = (rivin summa · sarakkeen summa) ÷ kokonaissumma
P-arvo on noin 0,157, joten ero ei ole merkitsevä tasolla 0,05.
Vaiheittainen esimerkki (riippumattomuus)
Ristiintaulukossa rivit ovat sukupuoli ja sarakkeet tuotevalinta. Solujen odotetut arvot lasketaan rivien ja sarakkeiden summista, minkä jälkeen χ² lasketaan samalla kaavalla solu solulta ja summataan. Esimerkiksi 2×2-taulukossa vapausasteet ovat df = (2 − 1)(2 − 1) = 1.
Tuloksen tulkinta
Vertaa p-arvoa merkitsevyystasoon (yleensä 0,05):
p < 0,05: havaitut poikkeavat odotetuista merkitsevästi – nollahypoteesi hylätään.
p ≥ 0,05: ero voi johtua sattumasta – nollahypoteesia ei hylätä.
Testi edellyttää, että odotetut frekvenssit ovat riittävän suuria, yleensä vähintään 5 jokaisessa luokassa. Hyvin pienillä odotetuilla arvoilla tulos on epäluotettava.
Käyttökohteet
Yhteensopivuus: noudattaako havaittu jakauma teoreettista (noppa, syntymäkuukaudet).
Riippumattomuus: liittyvätkö kaksi luokittelumuuttujaa toisiinsa kyselyaineistossa.
Khiin neliö -testi kuuluu tilastollisen päättelyn menetelmiin. Lukion matematiikassa testiä sivutaan tilastojen ja todennäköisyyden yhteydessä, ja yliopiston tilastotieteen peruskursseilla χ²-testit ovat keskeisiä ei-parametrisia menetelmiä luokitellun aineiston analyysiin. Sama jakauma esiintyy myös varianssin estimoinnissa ja muissa testeissä.
Usein kysytyt kysymykset
Mihin khiin neliö -testiä käytetään?
Khiin neliö -testi (χ²) vertaa havaittuja frekvenssejä odotettuihin. Yhteensopivuustestillä tutkitaan, noudattaako luokitellun muuttujan jakauma odotettua jakaumaa (esimerkiksi onko noppa rehellinen). Riippumattomuustestillä tutkitaan ristiintaulukosta, ovatko kaksi luokittelumuuttujaa riippumattomia toisistaan (esimerkiksi sukupuoli ja tuotevalinta).
Miten χ²-testisuure lasketaan?
Testisuure on χ² = Σ (havaittu − odotettu)² ÷ odotettu, eli jokaiselle luokalle lasketaan havaitun ja odotetun erotuksen neliö jaettuna odotetulla arvolla, ja nämä summataan. Mitä suurempi χ², sitä enemmän havaitut poikkeavat odotetuista. Esimerkiksi havaituille 30 ja 20 sekä odotetuille 25 ja 25 saadaan χ² = 1 + 1 = 2.
Kuinka vapausasteet lasketaan?
Yhteensopivuustestissä vapausasteet ovat df = luokkien lukumäärä − 1. Riippumattomuustestissä df = (rivien lukumäärä − 1) · (sarakkeiden lukumäärä − 1). Esimerkiksi 2×3-ristiintaulukossa df = (2 − 1) · (3 − 1) = 2. Vapausasteet määräävät, mihin khiin neliö -jakaumaan testisuuretta verrataan.
Miten odotetut frekvenssit lasketaan riippumattomuustestissä?
Jokaisen solun odotettu frekvenssi on (kyseisen rivin summa · kyseisen sarakkeen summa) ÷ kaikkien havaintojen summa. Tämä vastaa tilannetta, jossa muuttujat olisivat täysin riippumattomia. Laskuri laskee odotetut arvot automaattisesti ristiintaulukon riviltä ja sarakkeelta.
Mitä p-arvo kertoo khiin neliö -testissä?
P-arvo on todennäköisyys saada vähintään yhtä suuri χ²-arvo, jos nollahypoteesi (esimerkiksi riippumattomuus) pitää paikkansa. Jos p-arvo on pienempi kuin valittu merkitsevyystaso (yleensä 0,05), nollahypoteesi hylätään ja ero on tilastollisesti merkitsevä. Testi edellyttää, että odotetut frekvenssit ovat riittävän suuria, yleensä vähintään 5.