Što je multikolinearnost?
Multikolinearnost je pojava visokih interkorelacija među neovisnim varijablama u modelu višestruke regresije. Multikolinearnost može dovesti do iskrivljenih ili pogrešnih rezultata kada istraživač ili analitičar pokušava odrediti koliko se svaka neovisna varijabla može najučinkovitije koristiti za predviđanje ili razumijevanje ovisne varijable u statističkom modelu. Općenito, multikolinearnost može dovesti do većih intervala pouzdanosti i manje pouzdanih vrijednosti vjerojatnosti za neovisne varijable. Odnosno, statistički zaključci modela s multikolinearnošću možda ne mogu biti pouzdani.
Razumijevanje multikolinearnosti
Statistički analitičari koriste više regresijskih modela za predviđanje vrijednosti određene ovisne varijable na temelju vrijednosti dvije ili više neovisnih varijabli. Ovisna varijabla ponekad se naziva varijabla ishoda, cilja ili kriterija. Primjer je multivarijantni regresijski model koji pokušava predvidjeti prinose dionica na temelju stavki poput omjera cijene i zarade, tržišne kapitalizacije, dosadašnjih rezultata ili drugih podataka. Povrat dionica je ovisna varijabla, a različiti dijelovi financijskih podataka su neovisne varijable.
Ključni odvodi
- Multicollinearnost je statistički koncept u kojem su nezavisne varijable u modelu povezane. Multikolinearnost među neovisnim varijablama rezultirat će manje pouzdanim statističkim zaključivanjem. Bolje je koristiti neovisne varijable koje nisu u korelaciji ili se ponavljaju pri izgradnji više regresijskih modela koji koriste dvije ili više varijabli.,
Multikolinearnost u modelu višestruke regresije ukazuje da su kolinearne neovisne varijable na neki način povezane, mada odnos može biti, a ne mora biti i slučajan. Na primjer, prošli učinak mogao bi biti povezan s tržišnom kapitalizacijom, jer će dionice koje su u prošlosti dobro poslovale imati povećanu tržišnu vrijednost. Drugim riječima, multikolinearnost može postojati kada su dvije neovisne varijable visoko povezane. Također se može dogoditi ako se nezavisna varijabla izračuna iz drugih varijabli u skupu podataka ili ako dvije neovisne varijable daju slične i ponavljajuće rezultate.
Jedan od najčešćih načina uklanjanja problema multikolinearnosti je prvo identificirati kolinearne neovisne varijable, a zatim ukloniti sve osim jedne. Također je moguće eliminirati multikolinearnost kombiniranjem dvije ili više kolinearnih varijabli u jednu varijablu. Tada se može provesti statistička analiza kako bi se proučio odnos između navedene ovisne varijable i samo jedne neovisne varijable.
Primjer multikolinearnosti
Za ulaganje je multikolinearnost uobičajena pažnja prilikom provođenja tehničke analize kako bi se predvidjelo moguće buduće kretanje cijena vrijednosnog papira, poput zaliha ili budućnosti robe. Tržišni analitičari žele izbjeći korištenje tehničkih pokazatelja koji su kolinearni jer se temelje na vrlo sličnim ili srodnim podacima; obično otkrivaju slična predviđanja o ovisnoj varijabli kretanja cijena. Umjesto toga, analiza tržišta mora se temeljiti na izrazito različitim neovisnim varijablama kako bi se osiguralo da oni analiziraju tržište s različitih neovisnih analitičkih stajališta.
Istaknuti tehnički analitičar John Bollinger, tvorac indikatora Bollinger Bands, primjećuje da "kardinalno pravilo za uspješnu upotrebu tehničke analize zahtijeva izbjegavanje multikolinearnosti usred pokazatelja".
Da bi riješili problem, analitičari izbjegavaju koristiti dva ili više tehničkih pokazatelja iste vrste. Umjesto toga, oni analiziraju sigurnost koristeći jednu vrstu pokazatelja, kao što je pokazatelj zamaha, a zatim rade zasebne analize koristeći drugu vrstu pokazatelja, kao što je pokazatelj trenda.
Primjer potencijalnog problema multikolinearnosti je izvođenje tehničke analize samo korištenjem nekoliko sličnih pokazatelja, kao što su stohastika, indeks relativne čvrstoće (RSI) i Williams% R, koji su svi pokazatelji zamaha koji se oslanjaju na slične inpute i vjerovatno će proizvesti slične rezultati. U ovom je slučaju bolje ukloniti sve pokazatelje, osim jednog, ili pronaći način da ih nekoliko spajate u samo jedan indikator, istovremeno dodajući indikator trenda koji vjerojatno neće biti u korelaciji s pokazateljem momenta.