Sadržaj
- Što je T-test?
- Objašnjenje T-testa
- Dvojni rezultati ispitivanja
- Pretpostavke T-testa
- Proračun T-testova
- Korelirani (ili upareni) T-test
- T-test s jednakom varijancom (na skupu)
- T-test neravnomjerne varijance
- Određivanje koji T-test treba koristiti
- Primjer nejednake varijance T-testa
Što je T-test?
T-test je vrsta inferencijalne statistike koja se koristi da se utvrdi postoji li značajna razlika između sredstava dviju skupina, koja se u određenim značajkama može povezati. Najčešće se koristi kada će skupovi podataka, poput skupa podataka zabilježenih kao rezultat prebacivanja novčića 100 puta, uslijediti nakon normalne distribucije i možda će imati nepoznate varijance. T-test koristi se kao alat za testiranje hipoteza, koji omogućava testiranje pretpostavke primjenjive na populaciju.
T-testom se promatra t-statistika, vrijednosti t-distribucije i stupnjevi slobode kako bi se utvrdila vjerojatnost razlike između dva skupa podataka. Za provođenje testa s tri ili više varijabli, treba koristiti analizu varijance.
T-test
Objašnjenje T-testa
T-test u osnovi omogućuje nam da usporedimo prosječne vrijednosti dvaju skupa podataka i utvrdimo jesu li potjecale iz iste populacije. U gornjim primjerima, ako bismo uzeli uzorak učenika iz razreda A i drugog uzorka učenika iz razreda B, ne bismo očekivali da oni imaju točno jednaku srednju vrijednost i standardnu devijaciju. Slično, uzorci uzeti iz placebo hranjene kontrolne skupine i oni uzeti iz skupine propisane lijekovima trebali bi imati malo drugačiju srednju vrijednost i standardnu devijaciju.
Matematički, t-test uzima uzorak iz svakog od dva skupa i uspostavlja iskaz problema pretpostavljajući nultu hipotezu da su dva sredstva jednaka. Na temelju primjenjivih formula, određene vrijednosti se izračunavaju i uspoređuju sa standardnim vrijednostima, te se pretpostavljena nulta hipoteza prihvaća ili odbija u skladu s tim.
Ako nijedna hipoteza ispunjava uvjete za odbacivanje, to znači da su očitanja podataka snažna i nisu slučajna. T-test je samo jedan od mnogih testova koji se koriste u tu svrhu. Statističari moraju dodatno koristiti testove koji nisu t-test kako bi ispitali više varijabli i testove veće veličine uzorka. Za veliku veličinu uzorka, statističari koriste z-test. Ostale mogućnosti testiranja uključuju hi-kvadrat test i f-test.
Postoje tri vrste t-testova i kategoriziraju se kao ovisni i neovisni t-testovi.
Ključni odvodi
- T-test je vrsta inferencijalne statistike koja se koristi da se utvrdi postoji li značajna razlika između sredstava dviju skupina koje se mogu povezati u određenim značajkama. T-test je jedan od mnogih testova koji se koriste u svrhu ispitivanja hipoteza u statistici. Izračunavanje t-testa zahtijeva tri ključne vrijednosti podataka. Uključuju razliku između srednjih vrijednosti iz svakog skupa podataka (zvanih srednja razlika), standardnog odstupanja svake skupine i broja podataka podataka svake skupine. Postoji nekoliko različitih vrsta t-testa koji se mogu obaviti ovisno na podatke i vrstu potrebne analize.
Dvojni rezultati ispitivanja
Smatrajte da proizvođač lijekova želi testirati novo izumljeni lijek. Slijedi standardni postupak pokušaja lijeka na jednoj skupini bolesnika i davanje placeba drugoj skupini, koji se naziva kontrolna skupina. Placebo dodijeljen kontrolnoj skupini je tvar bez namjeravane terapijske vrijednosti i služi kao mjerilo za mjerenje kako reagira druga skupina, na koju je dana stvarni lijek.
Nakon pokusa s drogom, članovi kontrolne skupine s hranom placebom izvijestili su o povećanju prosječnog životnog vijeka od tri godine, dok članovi grupe kojoj je propisan novi lijek navode povećanje prosječne životne dobi za četiri godine. Trenutno promatranje može ukazivati na to da lijek doista djeluje jer su rezultati bolji za grupu koja koristi lijek. Međutim, također je moguće da opažanje može biti slučajna pojava, posebno iznenađujuća sreća. T-test je koristan za zaključak jesu li rezultati tačni i primjenjivi na cijelu populaciju.
U školi, 100 učenika u razredu A postiglo je prosjek 85% sa standardnim odstupanjem od 3%. Još 100 učenika koji pripadaju razredu B postiglo je prosječno 87% sa standardnim odstupanjem od 4%. Iako je prosjek razreda B bolji od razreda A, možda nije ispravno skočiti na zaključak da je ukupna uspješnost učenika u razredu B bolja od one u razredu A. To je zato što je, zajedno s znači, standardno odstupanje klase B je također veće od onog u klasi A. To ukazuje da su njihovi ekstremni postoci na nižim i višim stranama znatno rašireniji u usporedbi s onom klase A. Pomoću t-testa može se utvrditi koja je klasa bolje prošla.
Pretpostavke T-testa
- Prva pretpostavka napravljena u vezi s t-testovima tiče se mjerne skale. Pretpostavka za t-test je da mjerna ljestvica primijenjena na prikupljene podatke slijedi kontinuiranu ili ordinalnu ljestvicu, poput rezultata za IQ test. Druga pretpostavka je da je riječ o jednostavnom slučajnom uzorku, da su podaci prikupljeni od reprezentativnog, nasumično odabranog dijela ukupne populacije. Treća pretpostavka su podaci, kada se crtaju, rezultira normalnom raspodjelom, koristi se zvonasta krivulja distribucije. Četvrta pretpostavka koristi se relativno velika veličina uzorka. Veća veličina uzorka znači da bi se distribucija rezultata trebala približiti normalnoj krivulji u obliku zvona. Posljednja pretpostavka je homogenost varijance. Homogena ili jednaka varijanca postoji kada su standardna odstupanja uzoraka približno jednaka.
Proračun T-testova
Izračunavanje t-testa zahtijeva tri ključne vrijednosti podataka. Uključuju razliku između srednjih vrijednosti iz svakog skupa podataka (zvanih srednja razlika), standardnog odstupanja svake skupine i broja vrijednosti podataka svake skupine.
Rezultat t-testa daje t-vrijednost. Ova izračunata t-vrijednost tada se uspoređuje s vrijednošću dobivenom iz tablice kritičnih vrijednosti (koja se naziva T-razdioba tablice). Ova usporedba pomaže da se utvrdi kolika je vjerojatnost da se razlika između sredstava dogodila slučajno ili da se skupovi podataka zaista nalaze unutarnje razlike. T-test postavlja pitanje je li razlika između skupina stvarna razlika u studiji ili je vjerovatno besmislena statistička razlika.
T-distribucijske tablice
T-razdjelna tablica dostupna je u formatima s jednim repom i s dva repa. Prva se koristi za procjenu slučajeva koji imaju fiksnu vrijednost ili raspon s jasnim smjerom (pozitivnim ili negativnim). Na primjer, kolika je vjerojatnost da će izlazna vrijednost ostati ispod -3 ili dobiti više od sedam prilikom kotrljanja para kockica? Potonja se koristi za analizu ograničenja raspona, poput postavljanja pitanja da li koordinate padaju između -2 i +2.
Izračuni se mogu izvoditi sa standardnim softverskim programima koji podržavaju potrebne statističke funkcije, poput onih koje se nalaze u MS Excel-u.
T-vrijednosti i stupnjevi slobode
T-test daje dvije vrijednosti kao svoj izlaz: t-vrijednost i stupanj slobode. T-vrijednost je omjer razlike između srednje vrijednosti dva skupa uzoraka i razlike koja postoji unutar skupa uzoraka. Iako je brojčana vrijednost (razlika između srednje vrijednosti dva skupa uzoraka) jednostavno izračunati, nazivnik (razlika koja postoji unutar skupa uzoraka) može postati malo kompliciran ovisno o vrsti vrijednosti podataka. Naziv omjer je mjerenje disperzije ili varijabilnosti. Veće vrijednosti t-vrijednosti, koja se naziva i t-ocjena, ukazuju na postojanje velike razlike između dva skupa uzoraka. Što je manja t-vrijednost, to je sličnost između dva skupa uzoraka.
- Veliki t-rezultat ukazuje na to da su grupe različite. Mali t-rezultat ukazuje na to da su grupe slične.
Stupnjevi slobode odnose se na vrijednosti studije koja ima slobodu variranja i bitna je za procjenu važnosti i valjanosti nulte hipoteze. Izračunavanje ovih vrijednosti obično ovisi o broju zapisa podataka koji su dostupni u skupu uzoraka.
Korelirani (ili upareni) T-test
Korelirani t-test izvodi se kad se uzorci obično sastoje od parnih parova sličnih jedinica ili kad postoje slučajevi ponovljenih mjera. Na primjer, mogu postojati slučajevi da se isti pacijenti opetovano testiraju - prije i nakon primanja određenog liječenja. U takvim se slučajevima svaki pacijent koristi kao kontrolni uzorak protiv sebe.
Ova se metoda također primjenjuje u slučajevima kada su uzorci na neki način povezani ili imaju odgovarajuće karakteristike, poput usporedne analize koja uključuje djecu, roditelje ili braću i sestre. Korelirani ili upareni t-testovi ovise o vrsti, jer uključuju slučajeve kada su dva skupa uzoraka međusobno povezana.
Formula za računanje t-vrijednosti i stupnjeva slobode za upareni t-test je:
- Srednja vrijednost 1 i srednja vrijednost 2 su prosječne vrijednosti svakog skupa uzoraka, dok var1 i var2 predstavljaju varijancu svakog uzorka.
Preostale dvije vrste pripadaju neovisnim t-testovima. Uzorci ove vrste odabrani su neovisno jedan o drugom - to jest, skupovi podataka u dvije skupine ne odnose se na iste vrijednosti. Uključuju slučajeve poput skupine od 100 pacijenata koji su podijeljeni u dva skupa od 50 pacijenata. Jedna od skupina postaje kontrolna skupina i dobiva joj placebo, dok druga skupina prima propisani tretman. To čini dvije neovisne skupine uzoraka koje nisu spojene jedna s drugom.
T-test s jednakom varijancom (ili sjedinjen)
T-test za jednaku varijancu koristi se kada je broj uzoraka u svakoj skupini isti ili je varijanca dvaju skupa podataka slična. Za izračunavanje t-vrijednosti i stupnjeva slobode za t-test jednake varijance koristi se sljedeća formula:
T-vrijednost = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 srednja1-srednja2 gdje: srednja vrijednost1 i srednja vrijednost 2 = Prosječne vrijednosti za uzorke skupa1 i var2 = Varijanca svakog skupa uzorakan1 i n2 = Broj zapisa u svakom skupu uzoraka
i, Stupnjevi slobode = n1 + n2−2 drugdje: n1 i n2 = broj zapisa u svakom skupu uzoraka
T-test neravnomjerne varijance
T-test nejednake varijance koristi se kada je broj uzoraka u svakoj grupi različit, a varijanca dvaju skupa podataka je također različita. Ovaj test se naziva i Welchov t-test. Za izračunavanje t-vrijednosti i stupnjeva slobode za t-test nejednake varijance koristi se sljedeća formula:
T-vrijednost = n1var12 + n2var22 srednja1-srednja2 gdje: srednja vrijednost1 i srednja vrijednost 2 = Prosječne vrijednosti uzorka skupa1 i var2 = Varijanca svakog uzorka skupa n1 i n2 = Broj zapisa u svakom skupu uzoraka
i, Stupnjevi slobode = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 gdje su: var1 i var2 = Varijanca svakog uzorka skupa n1 i n2 = Broj zapisa u svakom skupu uzoraka
Određivanje ispravnog T-testa za upotrebu
Sljedeća shema tijeka može se koristiti za određivanje koji se t-test treba koristiti na temelju karakteristika skupa uzoraka. Ključne stavke koje treba uzeti u obzir uključuju jesu li uzorci zapisa slični, broj zapisa podataka u svakom skupu uzoraka i varijanca svakog skupa uzoraka.
Slika Julie Bang © Investopedia 2019
Primjer nejednake varijance T-testa
Pretpostavimo da provodimo dijagonalno mjerenje slika primljenih u umjetničkoj galeriji. Jedna skupina uzoraka uključuje 10 slika, dok druga sadrži 20 slika. Skupovi podataka s odgovarajućim srednjim i vrijednostima varijance su kako slijedi:
Skup 1 | Skup 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20, 6 | |
21.95 | 13.7 | |
23.2 | ||
17.5 | ||
20, 6 | ||
18 | ||
23, 9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23, 9 | ||
13.3 | ||
srednja | 19.4 | 21.6 |
varijacija | 1.4 | 17.1 |
Iako je sredina skupa 2 veća od one iz skupa 1, ne možemo zaključiti da sve slike imaju prosječnu dužinu oko 21, 6 jedinica jer je varijanca skupa 2 značajno veća od skupa 1. Je li to slučajno ili postoje razlike zaista u ukupnoj populaciji svih slika dobivenih u umjetničkoj galeriji? Problem uspostavljamo pretpostavljanjem nulte hipoteze da je srednja vrijednost jednaka između dva skupa uzoraka i provedemo t-test kako bismo potvrdili je li hipoteza istinita.
Kako je broj zapisa podataka različit (n1 = 10 i n2 = 20), a varijanca je također različita, t-vrijednost i stupnjevi slobode izračunavaju se za gornji skup podataka koristeći formulu navedenu u T-testu neravnomjerne varijance. odjeljak.
Vrijednost t je -2.24787. Budući da se znak minus može zanemariti pri uspoređivanju dviju t-vrijednosti, izračunata vrijednost je 2, 24787.
Stupanj vrijednosti slobode iznosi 24, 38 i smanjuje se na 24, zahvaljujući definiciji formule koja zahtijeva zaokruživanje vrijednosti na najmanju moguću cijeli broj.
Kad god se pretpostavi normalna raspodjela, može se odrediti razina vjerojatnosti (alfa razina, razina značajnosti, p ) kao kriterij za prihvaćanje. U većini slučajeva može se pretpostaviti vrijednost od 5%.
Koristeći stupanj vrijednosti slobode kao 24 i 5-postotnu razinu značaja, pogled na tablicu raspodjele t-vrijednosti daje vrijednost od 2.064. Usporedba ove vrijednosti s izračunatom vrijednošću od 2, 224 pokazuje da je izračunata t-vrijednost veća od vrijednosti tablice na razini značajnosti od 5%. Stoga je sigurno odbaciti ništavnu hipotezu da nema razlike između sredstava. Skup stanovništva ima intrinzične razlike i nisu slučajno.
Usporedite investicijske račune × Ponude koje se pojavljuju u ovoj tablici potječu od partnerstava od kojih Investopedia prima naknadu. Opis pružatelja uslugaPovezani uvjeti
Kako djeluje analiza varijance (ANOVA) Analiza varijance (ANOVA) je alat za statističku analizu koji ukupnu varijabilnost koja se nalazi unutar skupa podataka odvaja u dvije komponente: slučajni i sustavni faktori. više Definicija Z-testa Z-test je statistički test koji se koristi da se utvrdi razlikuju li se dva populacijska sredstva kad su poznate varijancije i veličina uzorka. više Stupnjevi slobode Stupnjevi slobode odnose se na maksimalni broj logički neovisnih vrijednosti koje su vrijednosti u kojima se sloboda može mijenjati u uzorku podataka. više Razumijevanje T Distribucija AT raspodjela je vrsta vjerojatne funkcije koja je prikladna za procjenu parametara populacije za male veličine uzorka ili nepoznate varijance. više Koje mjere za odstupanje Polu-odstupanje je metoda za procjenu ispodprosječnih fluktuacija u povratu ulaganja. Koristi se kao alternativa standardnom odstupanju. više Bonferroni test Bonferroni test vrsta je višestrukog usporednog testa koji se koristi u statističkoj analizi. više partnerskih vezapovezani članci
Ekonomija
Kakve se pretpostavke daju prilikom provođenja t-testa?
Upravljanje rizicima
Korištenjem povijesne volatilnosti za procjenu budućeg rizika
Stock Trading Strategy & Education
Kako koristiti Excel za simulaciju cijena dionica
Financijski omjer
Kako se izračunava IRR u Excelu?
Matematika i statistika
Što je relativna standardna greška
Financijski omjer