T-testi ja Lineaarinen regressio ovat termejä, jotka liittyvät päättelytilastoihin, jotka ovat tilastollinen menetelmä, joka auttaa meitä tekemään yleistyksiä ja ennusteita populaatiosta ottamalla siitä pienen mutta havainnollisen otoksen. Päättelytilastoissa käytetään tyypillisesti kolmenlaisia menetelmiä - luottamusvälit, hypoteesitestit ja regressioanalyysi.
T-testi vs lineaarinen regressio
Ero T-testin ja lineaarisen regression välillä on se, että lineaarista regressiota käytetään selvittämään yhden tai kahden muuttujan välistä korrelaatiota suoralla viivalla. Vaikka T-testi on yksi hypoteesitestien työkaluista, joita sovelletaan kaltevuuskertoimiin tai regressiokertoimiin, jotka on johdettu yksinkertaisesta lineaarisesta regressiosta.
Vaikka T-testi on yksi hypoteesitestauksessa käytetyistä testeistä, lineaarinen regressio on yksi regressioanalyysin tyypeistä. Lineaarista regressiota käytetään tulosmuuttujan (riippuvaisen muuttujan) ja yhden tai useamman ennustajamuuttujan (riippumattoman muuttujan) välisen lineaarisen suhteen määrittämiseksi.
T-testi on yksi hypoteesitesteistä, joilla selvitetään, että ero kahden ryhmän keskiarvojen välillä on merkittävä vai ei, eli ovatko erot sattuneet vai eivät.
T-testin ja lineaarisen regression vertailutaulukko (taulukkomuodossa)
Vertailuparametri | T-testi | Lineaarinen regressio |
---|---|---|
Tilastollinen menetelmä | T-testi on yksi hypoteettisen testauksen työkaluista, joka puolestaan on päättelytilastojen menetelmä. | Lineaarinen regressio on yksi regressioanalyysin tyypeistä, joka on myös päättelytilastojen menetelmä. |
Käyttö | T-testillä verrataan kahden erilaisen havaitun datajoukon keskiarvoja ja selvitetään, missä määrin ero on "sattumalta". | Lineaarista regressiota käytetään määrittämään suhde yhden riippuvaisen tai tulosmuuttujan ja yhden tai useamman riippumattoman tai ennustavan muuttujan välillä. |
Tyypit | T-testejä on pääasiassa kolmea tyyppiä, nimittäin riippumattoman näytteen t-testi (kahden datajoukon keskiarvon vertailu), parillinen näyte-T-testi (vertaa samojen tietosarjojen keskiarvoja eri intervalleina) ja yhden näytteen T-testi. testi (vertaamalla yksittäisen tietojoukon keskiarvoa tunnettuun keskiarvoon). | Lineaarista regressiota on kahta tyyppiä, nimittäin yksinkertainen lineaarinen regressio (sisältää yhden riippuvan ja yhden riippumattoman muuttujan) ja moninkertainen lineaarinen regressio (koostuu yhdestä riippuvasta muuttujasta ja kahdesta tai useammasta riippumattomasta muuttujasta). |
Käytännön sovellukset | T-testillä voidaan testata kahden eri sijoitussalkun tuottoa kahdella eri sijoitusstrategialla. Sitä käytettiin ensin stoutin tasaisen laadun tarkistamiseen panimoyrityksessä. | Lineaarista regressiota käytetään pääasiassa asiakaskäyttäytymisen, hinnoittelun, yrityksen myynnin, sään, BKT:n kasvun jne. |
Käytettävien muuttujien tai joukkojen määrä. | T-testissä voidaan käyttää vain kahta datajoukkoa tai ryhmää. | Vaikka on vain yksi regressio, regressoreita voi olla enemmän kuin kaksi. |
Mikä on T-testi?
T-testi on yksi hypoteesitestauksessa käytettävistä välineistä, joilla verrataan kahta erilaista datajoukkoa ja niiden keskiarvoja tai keskiarvoja. Muut ovat Varianssianalyysi, Z-testi, Chi-Square Test ja F-testi.
T-testiä käytetään kahden tietojoukon välisen merkittävän eron tarkistamiseen. Sitä käytetään määrittämään, kuinka paljon tällainen ero on sattumalta.
Sitä käytti ensimmäistä kertaa William Sealy Gosset, kemisti, joka työskenteli Guinness-nimisessä panimoyhtiössä valvomaan stoutin tasaista laatua.
Vähitellen sitä päivitettiin ja nyt se viittaa kaikkiin hypoteesitesteihin, joissa analysoitujen tietojen oletetaan vastaavan t-jakaumaa (kellomainen jakautumakäyrä raskaammilla pyrstillä), jos nollahypoteesi (oletus, ettei suhdetta ole). tietojoukkojen välillä) osoittautuu oikeaksi.
Standardin tulkinnassa ja validoinnissa se riippuu tietyistä otantapopulaatiota koskevista oletuksista.
Tällaiset oletukset käsittävät dataa eli satunnaisotoksia, datamuuttujia, jotka noudattavat normaalijakaumaa, tuntemattomasta ja homogeeniseksi katsotusta varianssista sekä mittausasteikosta, joka kerättyyn dataan sovellettaessa johtaa jatkuvaan viivaan.
T-testejä on kolmenlaisia:
Lähestymistavana hypoteesin testaamiseen T-testi on varsin konservatiivinen. Sitä voidaan soveltaa vain kahteen tietosarjaan, ja sen katsotaan sopivan vain pienille tietojoukoille.
Mikä on lineaarinen regressio?
Lineaarinen regressio on päättelytilastojen menetelmä, joka yrittää selittää riippuvan muuttujan (Y) ja yhden tai useamman riippumattoman muuttujan (X) välisen korrelaation suoralla viivalla. Se käsittelee pääasiassa kolmenlaisia kysymyksiä:
- Ennustaako joukko selittäviä muuttujia oikein tulosmuuttujan?
- Jos on, mitkä ovat näkyvimmät riippumattomat tai selittävät muuttujat, jotka vaikuttavat merkittävästi riippuvaiseen tai tulosmuuttujaan?
- Ja lopuksi, missä määrin näiden riippumattomien tai selittävien muuttujien muutos vaikuttaa tulokseen tai riippuvaan muuttujaan?
Tulosmuuttujan ja selittävien muuttujien välisen suhteen katsotaan olevan positiivinen, jos jälkimmäisen kasvu johtaa edellisen kasvuun.
Vastaavasti riippuvan ja riippumattoman muuttujan välisen suhteen sanotaan olevan negatiivinen, jos edellinen pienenee jälkimmäisen kasvaessa.
Lineaarisella regressiolla on kolme käyttötarkoitusta:
- Riippumattomien muuttujien vahvuuden päättämiseen eli kuinka paljon ne vaikuttavat riippumattomaan muuttujaan.
- Riippumattomien muuttujien aiheuttaman riippuvaisen muuttujan muutoksen ennustamiseen.
- Tulevaisuuden trendien ja arvojen ennustamiseen.
Lineaarisia regressioita on pääasiassa kahdenlaisia: Yksinkertainen lineaarinen regressio joka koostuu yhdestä riippuvasta muuttujasta ja yhdestä riippumattomasta muuttujasta ja Useita lineaarisia regressioita joka koostuu riippuvasta muuttujasta ja kahdesta tai useammasta riippumattomasta muuttujasta.
T-testin ja lineaarisen regression väliset tärkeimmät erot
Johtopäätös
Sekä T-testi että lineaarinen regressio kuuluvat päättelytilastojen laajempiin puitteisiin, joita käytetään oletusten tekemiseen tietystä populaatiosta käyttämällä pientä otosta. Niillä on erilaisia rooleja ja ne ovat olennaisia työkaluja populaation yleisten ominaisuuksien päättelemiseen.
Vaikka lineaarinen regressio auttaa tekemään tiettyjä ennusteita tietystä näytteestä, esim. asiakaskäyttäytymistä, T-testi auttaa testaamaan hypoteesin soveltuvuutta otospopulaatioon.