Što je lažna korelacija
U statistici se lažna korelacija, ili lažna, odnosi na vezu između dvije varijable koja se čini uzročno, ali nije. Lažni odnosi često imaju izgled jedne varijable koja utječe na drugu. Ovu lažnu korelaciju često uzrokuje treći faktor koji nije očit u vrijeme ispitivanja, ponekad nazvan zbunjujući faktor.
Ključni odvodi
- Lažna korelacija ili lažljivost je kada se dva čimbenika pojavljuju slučajno povezana, ali nisu. Pojava uzročno-posljedične veze često je posljedica sličnog kretanja na grafikonu koje ispada da je slučajno ili uzrokovano trećim "zbunjujućim" faktorom. Lažna korelacija često mogu biti uzrokovane malim veličinama uzorka ili proizvoljnim krajnjim točkama.
Kako djeluje lažna korelacija
Kad se dvije slučajne varijable međusobno pomno prate na grafu, lako je posumnjati u korelaciju ili odnos između dva faktora, gdje promjena utječe na drugu. Izbacujući još jednu temu "uzročno-posljedične veze", ovo promatranje može navesti čitatelja grafikona da vjeruje da je kretanje varijable A povezano s kretanjem u varijabli B ili obrnuto. ali ponekad su, nakon pomnijeg statističkog ispitivanja, poravnata kretanja slučajna ili uzrokovana trećim faktorom koji utječe na prva dva. Ovo je lažna korelacija. Istraživanja provedena s malim veličinama uzoraka ili proizvoljnim završnim točkama posebnost je podložna lažljivosti.
Primjer lažnih korelacija
Otkrivati zanimljive korelacije nije previše teško. Međutim, mnogi će ispasti lažni. Za mušku vrstu na Wall Streetu, dvije popularne lažne korelacije uključuju žene i sport. Iz 1920-ih potječe teorija duljine suknje koja drži da su duljine suknje i smjer dionica na tržištu povezano. Ako su suknje dugačke, to znači da berza propada; ako su kratki, tržište raste. Krajem siječnja govori se o takozvanom pokazatelju Super Bowla, koji sugerira da pobjeda AFC tima vjerojatno znači da će tržište dionica pasti u narednoj godini, dok pobjeda NFC tima predstavlja rast porasta tržište. Od 1966. godine pokazatelj je imao tačnost od 80%. To je zabavan dio razgovora, ali vjerojatno ne nešto što bi ozbiljni financijski savjetnici preporučili kao investicijsku strategiju za klijente.
Evo još primjera uobičajenih lažnih korelacija:
- Utapanja rastu kada poraste prodaja sladoleda. Možda se čini da povećana prodaja sladoleda uzrokuje više utapanja, ali u stvarnosti, rastuća vrućina može natjerati više ljudi da plivaju, kao i kupuju više sladoleda. Stopa ubojstava u SAD-u od 2006. do 2011. pala je istom brzinom kao i Microsoft Internet Explorer upotreba. Izvršitelji koji kažu molim vas i zahvaljuju vam češće uživaju u boljem dijeljenju performansi. Ljudi koji nose opremu tima Oakland Raiders imaju veću vjerojatnost da će počiniti zločine.
Kako uočiti lažne korelacije
Statističari i drugi znanstvenici koji analiziraju podatke stalno moraju biti u potrazi za lažnim vezama. Postoje brojne metode koje se koriste, uključujući:
- Osiguravanje odgovarajućeg reprezentativnog uzorka. Dobivanje odgovarajuće veličine uzorka. Pažnju proizvoljnih krajnjih točaka. Kontroliranje za što je moguće više vanjskih varijabli. Korištenje nulte hipoteze i provjeravanje jake p-vrijednosti.