Residuaalilaskuri

Laske regression residuaalit e = y − ŷ eli havaitun ja ennustetun arvon erotukset, sekä residuaalineliösumma ja keskineliövirhe.

Havaitut ja ennustetut arvot

Syötä havaitut arvot y ja mallin ennustamat arvot ŷ samassa järjestyksessä ja yhtä monta kumpaakin. Erota luvut pilkulla, välilyönnillä tai rivinvaihdolla, desimaalit pisteellä.

Tulokset

  • Tulosta
  • Linkitä
  • Residuaalit – havaitun ja ennustetun arvon erotus

    Residuaali on regression keskeisin diagnostiikkasuure: se kertoo, kuinka kaukana mallin ennuste on todellisesta havainnosta. Residuaaleista lasketaan mallin kokonaisvirhe ja niistä piirretyn kuvaajan avulla arvioidaan, sopiiko malli aineistoon. Tällä laskurilla saat jokaisen residuaalin sekä yhteenvetoluvut yhdellä syötöllä.

    Määritelmä

    Residuaali eli jäännös on havaitun arvon ja mallin ennustaman arvon erotus. Jokaisella havainnolla on oma residuaalinsa, ja se ilmaistaan samassa yksikössä kuin alkuperäinen muuttuja. Residuaalit kuvaavat sitä osaa vaihtelusta, jota malli ei selitä.

    Kaava ja selitys

    Yksittäinen residuaali lasketaan kaavalla:

    e = y − ŷ

    Kaavassa y on havaittu arvo ja ŷ mallin ennuste. Mallin kokonaisvirhettä kuvaa residuaalineliösumma, ja tyypillistä virhettä keskineliövirhe:

    SSE = Σ(y − ŷ)²

    RMSE = √( SSE ÷ n )

    Neliöinti tekee kaikista poikkeamista positiivisia ja painottaa suuria virheitä, joten yksikin iso poikkeama kasvattaa summaa selvästi.

    Vaiheittainen esimerkki

    Havaitut arvot ovat 3, 5, 7 ja mallin ennusteet 2,8, 5,2, 6,9.

    1. Laske residuaalit: 3 − 2,8 = 0,2; 5 − 5,2 = −0,2; 7 − 6,9 = 0,1.
    2. Residuaalineliösumma: 0,2² + (−0,2)² + 0,1² = 0,04 + 0,04 + 0,01 = 0,09.
    3. Keskineliövirhe: √(0,09 ÷ 3) = √0,03 ≈ 0,173.

    Tuloksen tulkinta

    Residuaalin etumerkki kertoo virheen suunnan ja suuruus sen koon:

    Hyvässä mallissa residuaalit jakautuvat satunnaisesti nollan molemmin puolin eikä niissä näy systemaattista kaavaa. Suuri yksittäinen residuaali voi viitata poikkeavaan havaintoon.

    Käyttökohteet

    Residuaalit opinnoissa

    Residuaalit kuuluvat tilastotieteen regressioanalyysin perusteisiin. Lukion pitkän matematiikan tilastokurssilla käsitellään regressiosuoraa ja pienimmän neliösumman ajatusta, ja yliopiston tilastotieteessä residuaalianalyysi on keskeinen osa mallin diagnostiikkaa. Residuaaleista johdetut tunnusluvut, kuten selitysaste ja keskineliövirhe, kertovat, kuinka hyvin malli kuvaa aineistoa.

    Usein kysytyt kysymykset

    Mikä on residuaali?
    Residuaali eli jäännös on yksittäisen havainnon todellisen arvon ja mallin ennustaman arvon erotus: e = y − ŷ. Se kertoo, kuinka kaukana mallin ennuste on todellisesta havainnosta. Positiivinen residuaali tarkoittaa, että havainto on ennustetta suurempi (malli aliarvioi), ja negatiivinen, että havainto on ennustetta pienempi (malli yliarvioi).
    Mitä residuaalineliösumma (SSE) kertoo?
    Residuaalineliösumma SSE on residuaalien neliöiden summa, SSE = Σ(y − ŷ)². Se mittaa mallin selittämättä jäävän kokonaisvaihtelun: mitä pienempi SSE, sitä paremmin malli sopii aineistoon. Pienimmän neliösumman regressio valitsee suoran, joka minimoi juuri tämän summan.
    Mitä eroa on residuaalineliösummalla ja keskineliövirheellä?
    Residuaalineliösumma (SSE) on kaikkien residuaalien neliöiden summa, joka kasvaa havaintojen määrän myötä. Keskineliövirhe (RMSE) on tämän summan keskiarvon neliöjuuri, RMSE = √(SSE ÷ n), joten se ilmaisee tyypillisen virheen alkuperäisessä yksikössä ja on vertailukelpoinen eri aineistojen välillä.
    Miksi residuaalien summa on lähellä nollaa?
    Kun ennusteet tulevat pienimmän neliösumman regressiosuorasta, residuaalien summa on tasan nolla, koska suora kulkee aineiston painopisteen kautta ja positiiviset ja negatiiviset poikkeamat kumoavat toisensa. Jos ennusteet ovat muusta mallista, summa ei välttämättä ole nolla, ja sen etumerkki kertoo, aliarvioiko vai yliarvioiko malli keskimäärin.
    Mihin residuaaleja käytetään?
    Residuaaleja käytetään mallin sopivuuden arviointiin. Residuaalikuvaajasta tarkistetaan, jakautuvatko jäännökset satunnaisesti nollan ympärille: selvä kaava (esimerkiksi kaareva muoto) viittaa siihen, että malli ei ole oikeanlainen. Residuaalit auttavat myös tunnistamaan poikkeavia havaintoja, joilla on poikkeuksellisen suuri jäännös.
    Oliko tästä laskurista apua?

    Linkitä tämä laskuri

    Kopioi koodi ja liitä se omalle sivustollesi.

    Suositut laskurit