Što je zanemarivanje veličine uzorka?
Zanemarivanje veličine uzorka kognitivna je pristranost koju su sjajno proučavali Amos Tversky i Daniel Kahneman. To se događa kada korisnici statističkih podataka donose lažne zaključke ne uzimajući u obzir veličinu uzorka dotičnih podataka.
Osnovni uzrok zanemarivanja veličine uzorka je taj što ljudi često ne razumiju da je visoka razina varijance vjerojatnije za male uzorke. Stoga je presudno utvrditi je li veličina uzorka koja se koristi za izradu određene statistike dovoljno velika da dopušta smislene zaključke.
Znati kada je veličina uzorka dovoljno velika može biti izazovno za one koji nemaju dobro razumijevanje statističkih metoda.
Ključni odvodi
- Zanemarivanje veličine uzorka je kognitivna pristranost koju su proučavali Amos Tversky i Daniel Kahneman. Sastoji se od izvlačenja lažnih zaključaka iz statističkih podataka, jer nisu uzeli u obzir učinke veličine uzorka. Oni koji žele smanjiti rizik od zanemarivanja veličine uzorka, trebali bi imati na umu da je manji veličine uzorka povezane su s volatilnijim statističkim rezultatima i obrnuto.
Razumijevanje zanemarivanja veličine uzorka
Kada je veličina uzorka premala, ne mogu se donijeti točni i pouzdani zaključci. U kontekstu financija ovo može na različite načine uvesti investitore.
Na primjer, ulagač bi mogao potražiti novi investicijski fond, hvali se da je ostvario 15% godišnjeg povrata od njegovog osnivanja. Investitor bi mogao brzo uključiti da je ovaj fond njihova karta za brzo stvaranje bogatstva. Međutim, ovaj bi zaključak mogao biti opasno pogrešan ako fond ne ulaže dugo. U tom bi slučaju rezultati mogli biti posljedica kratkoročnih anomalija i imati malo veze sa stvarnom metodologijom ulaganja fonda.
Zanemarivanje veličine uzorka često se brka s zanemarivanjem osnovne stope, što je zasebna kognitivna pristranost. Iako se zanemarivanje veličine uzorka odnosi na ne razmatranje uloge veličina uzoraka u određivanju pouzdanosti statističkih tvrdnji, zanemarivanje bazne stope odnosi se na sklonost ljudi da zanemaruju postojeće znanje o fenomenu prilikom procjene novih podataka.
Primjer iz stvarnog svijeta zanemarivanja veličine uzorka
Da biste bolje razumjeli zanemarivanje veličine uzorka, razmotrite sljedeći primjer, koji je izveden iz istraživanja Amosa Tverskog i Daniela Kahnemana:
Od osobe se traži da crpi iz uzorka pet kuglica i utvrdi da su četiri crvene, a jedna zelene.
Osoba crpi iz uzorka od 20 kuglica i otkriva da je 12 crveno, a osam zeleno.
Koji uzorak pruža bolji dokaz da su kuglice pretežno crvene?
Većina ljudi kaže da prvi, manji uzorak pruža mnogo jače dokaze, jer je omjer crvene i zelene boje mnogo veći od većeg uzorka. Međutim, u stvarnosti veći omjer nadmašuje manja veličina uzorka. Uzorak od 20 zapravo pruža mnogo jače dokaze.
Drugi primjer Amosa Tverskog i Daniela Kahnemana je sljedeći:
Grad služe dvije bolnice. U većoj bolnici dnevno se rodi prosječno 45 beba, a u manjoj bolnici svaki dan se rodi oko 15 beba. Iako je 50% svih beba dječaka, točan postotak varira iz dana u dan.
Tijekom jedne godine svaka je bolnica bilježila dane kad su više od 60% beba bili dječaci. Koja je bolnica zabilježila više takvih dana?
Na pitanje, 22% ispitanika odgovorilo je da će veća bolnica prijaviti više takvih dana, dok 56% kaže da će rezultati biti isti za obje bolnice. U stvari, točan je odgovor da bi manja bolnica zabilježila više takvih dana, jer bi njena manja veličina stvorila veću varijabilnost.
Kao što smo ranije napomenuli, korijen zanemarivanja veličine uzorka je u tome što ljudi često ne razumiju da se visoke varijance mogu pojaviti u malim uzorcima. Ulaganje, to zaista može biti skupo.