Tilastokentässä on kahdenlaisia muuttujia: riippuvaisia ja riippumattomia. Lopuksi voidaan todeta, että tilastotieteilijät käyttävät erilaisia testejä, joista kaksi on parametrisia ja ei-parametrisia testejä. Nämä ovat erittäin laajoja luokituksia erilaisista tilastomenetelmistä, joita käytetään laajassa tilastosovellusten maailmassa.
Parametrinen vs ei-parametrinen
Ero näiden kahden testin välillä on se, että toinen niistä on riippuvainen ja toinen jossain määrin riippumaton parametreista, kuten keskiarvo, keskihajonta, variaatio ja keskirajalause. Kaikki nämä ovat eri parametreja, jotka on laskettu käytettävissä olevien tietojen perusteella. Vaikka jokaisella parametrisella testillä on ei-parametrinen vastine tai vastaava.
Parametrisiksi tilastollisiksi toimenpiteiksi kuvataan niitä, joiden tulokset perustuvat tiedon jakauman muodon oletukseen (Esimerkki: Normaalijakauma) ja oletetun jakauman parametreihin. On olemassa erilaisia parametritestejä, kuten t-testi, Pearson-korrelaatiokerroin, parillinen t-testi ja monia muita.
Ei-parametrisiksi tilastollisiksi proseduureiksi kuvataan niitä, joiden tulokset perustuvat ei lainkaan tai vain harvoin oletukseen datajakauman muodosta tai oletetun jakauman parametreista. Niiden sovellus on joustavampi ja vankempi, koska ne eivät ole riippuvaisia mistään oletuksista tai ennalta määritellyistä tiedoille määritellyistä ehdoista.
Parametrisen ja ei-parametrisen vertailutaulukko
Vertailuparametrit | Parametrinen | Ei-parametrinen |
Määritelmä | Testiä, jonka tulokset riippuvat jakaumasta, kutsutaan parametritestiksi. | Testiä, jonka tulokset eivät riipu jakaumasta, kutsutaan ei-parametriseksi testiksi. |
Tilastollinen teho | Parametrisilla testeillä on suurempi tilastollinen teho. | Ei-parametrisilla testeillä on pienempi tilastollinen teho. |
Monipuolisuus | Parametriset testit eivät sovellu kaikkiin tilanteisiin. | Ei-parametriset testit ovat vankempia ja niitä voidaan soveltaa erilaisiin tilanteisiin. |
Keskitrendin arvo | Keskiarvo on tämän testin keskeinen taipumusarvo. | Mediaaniarvo on tämän testin keskeinen taipumusarvo. |
Jakelun tyyppi | Sitä käytetään datassa, joka noudattaa normaalijakaumaa. | Sitä käytetään tiedoissa, jotka seuraavat mitä tahansa mielivaltaista jakautumista. |
Mikä on parametrinen testi?
Parametrinen tilastollinen testi olettaa populaation parametrit ja sen saatujen tietojen jakaumat. Parametritestiä käytetään kvantitatiivisille tiedoille jatkuvilla muuttujilla. Data, johon parametritestejä käytetään, mitataan suhdeasteikolla ja noudattavat normaalijakaumaa.
Laajimmin ja yleisimmin käytetyt parametriset testit ovat t-testi (alle 30 näytteen koolle), Z-testi (yli 30 näytteen koolle), ANOVA, Pearsonin rankkorrelaatio. Huomioon otettava keskeinen trendiarvo on jakauman keskiarvo ja se soveltuu enimmäkseen datan normaalijakaumaan. Tämäntyyppisen testin haittana on, että koska keskeinen suuntausarvo on keskiarvo, data on erittäin altis poikkeaville arvoille ja siten altis vääristymään, mikä vähentää tämän testin tilastollista tehoa.
Jatkuvat jakaumat, kuten tiedot lajin eri pituuksista tai painoista ajan mittaan, tiedot lämpötiloista ovat esimerkkejä, joissa käytetään parametritestejä. Vaikka dataa koskevien oletusten vuoksi sen sovellus on hieman vähemmän monipuolinen tosielämässä.
Mikä on ei-parametrinen testi?
Ei-parametriset testit ovat testejä, jotka eivät ole riippuvaisia mistään tietojen jakautumista koskevista oletuksista tai parametreista niiden analysoimiseksi. Niitä kutsutaan joskus myös "jakeluvapaiksi testeiksi". Ei-parametrinen ei välttämättä tarkoita, että emme tiedä mitään väestöstä, se tarkoittaa, että tiedot ovat vinoa tai "ei normaalijakaumaa".
Syyt, miksi käytämme ei-parametrisia testejä, ovat seuraavat: jos tiedot eivät täytä populaatiootoksen oletuksia tai kun tiedot ovat vinoa, populaatiootoskoko on liian pieni tai analysoitava data on nimellistä tai järjestyslukua. Erityyppiset ei-parametriset testit ovat merkkitesti, Wilcoxonin etumerkitty arvotesti, Kruskal-Wallis-testi, Mann-Whitney-testi, Spearmanin rankkorrelaatiotesti, Moodin mediaanitesti. Mediaaniarvo on keskeinen trendiarvo.
Se on joustavampi tosielämän sovelluksissa, koska tosielämässä löydetyt tiedot eivät välttämättä ole normaalisti jakautuneita ja ovat enimmäkseen kasautuneita tai epälineaarisia. Yksinkertaisuuden ja vankan luonteensa vuoksi ei-parametristen testien katsotaan olevan vähemmän alttiita väärälle käytölle ja väärinkäsityksille. Niitä käytetään enimmäkseen populaatioissa, jotka tulevat paremmuusjärjestykseen, kuten elokuvien luokitukset ja arvostelut, ravintoloiden luokitukset ja niin edelleen. Mutta suuren otoskoon datan osalta nämä testit menettävät paljon tilastollista tehoaan.
Tärkeimmät erot parametrisen ja ei-parametrisen testin välillä
Suurin ero parametristen ja ei-parametristen testien välillä on, että parametriset testit riippuvat tiedoista, jotka noudattavat tiettyjä oletuksia tai ehtoja, kun taas ei-parametristen testien ei tarvitse noudattaa tällaisia oletuksia. Jotkut muista eroista näiden kahden testin välillä ovat seuraavat:
Johtopäätös
Yhteenvetona voidaan todeta, että parametriset ja ei-parametriset testit ovat olennainen osa minkä tahansa datan analysointia. Riippuen siitä, onko se normaalijakautumassa vai ei, käytetään joko parametrista tai ei-parametrista testiä. Suoritettavan testin valinta riippuu siitä, millaisia tietoja meillä on, mikä on otoskoko ja kuinka paljon ennakkotietoa populaatiosta meillä on.
Tiedot, joilla on suuri otoskoko, vaativat parametrisen testin ei-parametrisen sijaan, koska se on tarkempaa. Jos otoskoko on pieni, ei-parametrinen testi on edullinen. Mikään testi ei ole parempi kuin toinen, koska molemmat toimivat eri tilanteissa. Tilastotyöntekijöinä sinun on pidettävä mielessä, että ei-parametrinen testi on vaihtoehto parametriselle testille, ei korvike.