Što je faktor inflacije varijance?
Varijacijski inflatorni faktor inflacije u varijanti (VIF) mjera je količine multikolinearnosti u skupu više regresijskih varijabli. Matematički, VIF za varijablu regresijskog modela jednak je omjeru ukupne varijance modela prema varijanci modela koji uključuje samo tu jednu nezavisnu varijablu. Taj se omjer izračunava za svaku neovisnu varijablu. Visoki VIF ukazuje da je pridružena neovisna varijabla visoko kolinearna s ostalim varijablama u modelu.
Ključni odvodi
- Faktor inflacije varijance (VIF) pruža mjeru multikolinearnosti među neovisnim varijablama u modelu višestruke regresije. Otkrivanje multikolinearnosti važno je jer, iako ne smanjuje objašnjavajuću snagu modela, smanjuje statističku značajnost neovisnih varijabli. Veliki VIF na neovisnoj varijabli ukazuje na visoko kolinearni odnos prema drugim varijablama koje treba uzeti u obzir ili prilagoditi u strukturi modela i odabiru neovisnih varijabli.
Razumijevanje faktora inflacije varijance
Višestruka regresija koristi se kada osoba želi testirati učinak više varijabli na određeni ishod. Ovisna varijabla je ishod na koji djeluju neovisne varijable koje su ulazi u model. Multikolinearnost postoji kada postoji linearni odnos ili korelacija između jedne ili više neovisnih varijabli ili ulaza. Multikolinearnost stvara problem u višestrukoj regresiji jer budući da svi ulazi utječu jedni na druge, oni zapravo nisu neovisni i teško je testirati koliko kombinacija neovisnih varijabli utječe na ovisnu varijablu ili ishod, unutar regresijskog modela, Statistički gledano, višestruki regresijski model u kojem postoji visoka multikolinearnost otežat će procjenu odnosa između svake neovisne varijable i ovisne varijable. Male promjene korištenih podataka ili strukture jednadžbe modela mogu proizvesti velike i pogrešne promjene u procijenjenim koeficijentima na neovisnim varijablama.
Kako bi se osiguralo da je model pravilno specificiran i da pravilno funkcionira, postoje testovi koji se mogu pokrenuti za multikolinearnost. Faktor inflacije varijance jedan je od takvih mjernih alata. Upotreba faktora inflacije varijance pomaže u prepoznavanju ozbiljnosti problema s multikolinearnošću kako bi se model mogao prilagoditi. Faktor inflacije varijance mjeri koliko utječe ili napuhava na ponašanje (varijanca) nezavisne varijable njegova interakcija / korelacija s drugim neovisnim varijablama. Faktori inflacije varijance omogućuju brzo mjerenje koliko varijabla doprinosi standardnoj pogrešci u regresiji. Kada postoje značajna pitanja multikolinearnosti, faktor inflacije varijance će biti vrlo velik za uključene varijable. Nakon što se te varijable identificiraju, za uklanjanje ili kombiniranje kolinearnih varijabli može se upotrijebiti nekoliko pristupa, rješavajući pitanje multikolinearnosti.
Iako multikolinearnost ne smanjuje opću prediktivnu moć modela, ona može dati procjene koeficijenata regresije koji nisu statistički značajni. U određenom smislu, to se može zamisliti kao vrsta dvostrukog brojanja u modelu. Kad su dvije ili više nezavisnih varijabli usko povezane ili mjere gotovo istu stvar, tada se temeljni efekt koji oni mjere dvaput (ili više) obračunava u varijablama i postaje teško ili nemoguće reći koja varijabla stvarno utječe na neovisna varijabla. To je problem jer je cilj mnogih ekonometrijskih modela testirati upravo takav statistički odnos između neovisnih varijabli i ovisne varijable.
Na primjer, ako ekonomist želi testirati postoji li statistički značajna veza između stope nezaposlenosti (kao neovisne varijable) i stope inflacije (kao ovisne varijable). Uključivanje dodatnih neovisnih varijabli koje su povezane sa stopom nezaposlenosti, takva nova početna zahtjeva za nezaposlenima vjerojatno će uvesti multikolinearnost u model. Cjelokupni model mogao bi pokazati jaku, statistički dovoljnu objašnjenu moć, ali neće biti u stanju utvrditi je li posljedica uglavnom posljedica stope nezaposlenosti ili novih početnih zahtjeva za nezaposlene. To je što bi VIF otkrio i predložio je da se možda jedna od varijabli izbaci iz modela ili pronađe neki način da ih konsolidira kako bi zabilježio njihov zajednički učinak, ovisno o tome koja je specifična hipoteza istraživača zainteresirana za testiranje.