Što su neparametrijska statistika?
Neparametrijska statistika odnosi se na statističku metodu u kojoj se podaci ne trebaju prilagoditi normalnoj distribuciji. Neparametrijska statistika koristi podatke koji su često redoslijedi, što znači da se ne oslanjaju na brojeve, već na poredak ili redoslijed vrsta. Na primjer, anketa koja prenosi preferencije potrošača u rasponu od nepodnošljivosti smatrat će se redovnim podacima.
Neparametrijska statistika uključuje neparametrijske opisne statistike, statističke modele, zaključke i statističke testove. Struktura modela neparametrijskih modela nije unaprijed određena , već je umjesto toga određena iz podataka. Izraz neparametrijski ne znači da takvim modelima u potpunosti nedostaju parametri, već da su broj i priroda parametara fleksibilni i nisu unaprijed određeni. Histogram je primjer neparametrijske procjene distribucije vjerojatnosti.
Razumijevanje neparametrijske statistike
U statističkim podacima, parametrijska statistika uključuje parametre kao što su srednja, srednja, standardna devijacija, varijanca itd. Ovaj oblik statistike koristi promatrane podatke za procjenu parametara distribucije. Pod parametrijskom statistikom pretpostavlja se da podaci odgovaraju normalnoj distribuciji s nepoznatim parametrima μ (prosječna populacija) i σ 2 (varijanca populacije), koji se zatim procjenjuju korištenjem srednje vrijednosti uzorka i varijance uzorka.
Neparametrijska statistika ne pretpostavlja veličinu uzorka ili jesu li promatrani podaci kvantitativni.
Neparametrijska statistika ne pretpostavlja da su podaci dobiveni iz normalne distribucije. Umjesto toga, oblik distribucije procjenjuje se prema ovom obliku statističkog mjerenja. Iako postoji mnogo situacija u kojima se može pretpostaviti normalna distribucija, postoje i neki scenariji u kojima neće biti moguće odrediti hoće li se podaci normalno distribuirati.
Primjeri neparametrijske statistike
U prvom primjeru razmislite o istraživaču koji želi da procjena broja beba u Sjevernoj Americi rođenih smeđih očiju može odlučiti uzeti uzorak od 150 000 beba i pokrenuti analizu skupa podataka. Mjerenje koje dobivaju koristit će se za procjenu cjelokupne populacije beba sa smeđim očima rođenim sljedeće godine.
Za drugi primjer, razmislite o drugom istraživaču koji želi znati je li odlazak u krevet rano ili kasno povezan s time koliko često neko oboli. Pod pretpostavkom da je uzorak odabran nasumično iz populacije, može se pretpostaviti da je raspodjela učestalosti bolesti u uzorku normalna. Međutim, za eksperiment koji mjeri otpornost ljudskog tijela na soj bakterija ne može se pretpostaviti da ima normalnu distribuciju.
To je zato što slučajno odabrani podaci uzoraka mogu biti otporni na soj. S druge strane, ako istraživač razmotri čimbenike kao što su genetska struktura i etnička pripadnost, možda će otkriti da veličina uzorka odabrana korištenjem ovih karakteristika možda nije otporna na soj. Stoga se ne može pretpostaviti normalna raspodjela.
Ova je metoda korisna kada podaci nemaju jasnu numeričku interpretaciju i najbolje ih je koristiti s podacima koji imaju sortiranje. Na primjer, test za procjenu ličnosti može imati rangiranje svojih mjernih podataka postavljenih kao jako ne slažući se, ne slagati, ravnodušan, slagati i snažno se slagati. U ovom slučaju treba koristiti neparametrijske metode.
Posebna razmatranja
Neparametrijska statistika stekla je na uvidu zbog svoje jednostavnosti upotrebe. Kako se smanjuje potreba za parametrima, podaci postaju primjenjiviji na veće testove. Ova vrsta statistike može se koristiti bez srednje vrijednosti, veličine uzorka, standardnog odstupanja ili procjene bilo kojih drugih povezanih parametara kada nijedan od tih podataka nije dostupan.
Budući da neparametrijska statistika čini manje pretpostavki o uzorkovanim podacima, njegova primjena je šireg opsega od parametrijske statistike. U slučajevima kada je parametrijsko ispitivanje prikladnije, neparametrijske metode bit će manje učinkovite. To je zato što rezultati dobiveni iz neparametrijske statistike imaju niži stupanj pouzdanosti nego ako su rezultati dobiveni korištenjem parametrijske statistike.
Ključni odvodi
- Neparametrijske statistike su jednostavne za korištenje, ali ne nude preciznu točnost ostalih statističkih modela. Ova vrsta analize je najprikladnija za razmatranje redoslijeda nečega, čak i ako se brojčani podaci promijene, rezultati će vjerojatno ostati isti.