Što je distribucija uzorkovanja?
Distribucija uzorkovanja je raspodjela vjerojatnosti statistike dobivena putem velikog broja uzoraka uzetih iz određene populacije. Distribucija uzorkovanja određene populacije jest raspodjela frekvencija niza različitih ishoda koji bi se mogli dogoditi za statistiku populacije.
Razumijevanje distribucije uzorkovanja
Mnogo podataka koje su prikupili i koristili akademici, statističari, istraživači, trgovci, analitičari itd. Zapravo su uzorci, a ne populacija. Uzorak je podskupina populacije. Na primjer, medicinski istraživač koji je želio usporediti prosječnu težinu svih beba rođenih u Sjevernoj Americi od 1995. do 2005. s onima rođenim u Južnoj Americi u istom vremenskom roku ne može u razumnom roku izvući podatke za cjelokupnu populaciju preko milijun porođaja koji su se dogodili tijekom deset godina. Umjesto toga, upotrijebit će samo težinu, recimo, 100 beba, na svakom kontinentu kako bi zaključio. Težina 200 korištenih beba je uzorak, a prosječna težina izračunata je vrijednost uzorka.
Pretpostavimo sada da umjesto uzimanja samo jednog uzorka od 100 uteža novorođenčadi sa svakog kontinenta, medicinski istraživač uzima ponavljane slučajne uzorke iz opće populacije i izračunava vrijednost uzorka za svaku skupinu uzoraka. Dakle, za Sjevernu Ameriku on izvlači podatke za 100 utega novorođenčadi zabilježenih u SAD-u, Kanadi i Meksiku na sljedeći način: četiri 100 uzoraka iz odabranih bolnica u SAD-u, pet 70 uzoraka iz Kanade i tri 150 zapisa iz Meksika, ukupno od 1200 težina novorođenih beba grupiranih u 12 skupina. Također prikuplja uzorke podataka o 100 rođenih utega iz svake od 12 zemalja Južne Amerike.
Svaki uzorak ima svoju prosječnu vrijednost uzorka, a raspodjela sredstava uzorka poznata je kao raspodjela uzorka.
Izračunana prosječna težina za svaki skup uzoraka je raspodjela uzorka srednje vrijednosti. Iz uzorka se ne može izračunati samo srednja vrijednost. Iz statističkih podataka mogu se izračunati ostale statistike, kao što su standardno odstupanje, varijanca, omjer i raspon. Standardno odstupanje i varijanca mjere varijabilnost raspodjele uzorka.
Broj promatranja u populaciji, broj opažanja u uzorku i postupak koji se koristi za izvlačenje skupa uzoraka određuju varijabilnost raspodjele uzorka. Standardno odstupanje raspodjele uzorka naziva se standardnom pogreškom. Dok je sredina raspodjele uzorka jednaka prosjeku populacije, standardna pogreška ovisi o standardnom odstupanju populacije, veličini populacije i veličini uzorka.
Znajući koliko su srednje vrijednosti svake od skupina uzoraka razdvojene jedna od druge i od prosjeka populacije, dat će podatak koliko je uzorak prosječan od prosjeka populacije. Standardna pogreška raspodjele uzorka smanjuje se kako se povećava veličina uzorka.
Posebna razmatranja
Populacija ili jedan uzorak skupa brojeva imat će normalnu raspodjelu. Međutim, budući da raspodjela uzoraka uključuje više skupova opažanja, neće nužno imati zvonasto zakrivljen oblik.
Slijedom našeg primjera, prosječna težina beba u Sjevernoj i Južnoj Americi ima normalnu raspodjelu, jer će neke bebe imati manje tjelesne težine (ispod srednje vrijednosti) ili prekomjerne težine (iznad srednje vrijednosti), a većina beba će pasti između (oko srednje vrijednosti)). Ako je prosječna težina novorođenčadi u Sjevernoj Americi sedam kilograma, prosječna težina uzorka u svakom od 12 skupa uzoraka promatranih za Sjevernu Ameriku bit će blizu 7 kilograma.
Međutim, ako prikažete grafikon svakog prosjeka izračunatog u svakoj od 1.200 skupina uzoraka, rezultirajući oblik može rezultirati ujednačenom raspodjelom, ali teško je sa sigurnošću predvidjeti kakav će se stvarni oblik pokazati. Što više uzoraka istraživač koristi iz populacije od preko milion težinskih podataka, to će više graf početi formirati normalnu distribuciju.
- Distribucija uzorkovanja je vjerojatnost raspodjele statistike dobivene putem velikog broja uzoraka uzetih iz određene populacije. Distribucija uzorkovanja određene populacije je raspodjela frekvencija u nizu različitih ishoda koji se mogu pojaviti za statistiku Mnogo podataka koje su prikupili i koristili akademici, statističari, istraživači, trgovci i analitičari zapravo su uzorci, a ne populacija.