Što je postupna regresija?
Regresijska analiza široko je korišteni statistički pristup koji nastoji utvrditi odnos između varijabli. Ideja je objediniti relevantne podatke za donošenje bolje informiranih odluka i uobičajena je praksa u svijetu ulaganja. Postepena regresija je korak po korak iterativna konstrukcija regresijskog modela koja uključuje automatski odabir neovisnih varijabli. Dostupnost statističkih softverskih paketa omogućuje postupnu regresiju, čak i kod modela sa stotinama varijabli.
Vrste postepene regresije
Temeljni cilj postupne regresije je, kroz niz testova (F-testovi, t-testovi), pronaći skup neovisnih varijabli koje značajno utječu na zavisnu varijablu. To se događa s računalima kroz iteraciju, što je proces donošenja rezultata ili odluka prolaskom ponovljenih krugova ili ciklusa analize. Prednost automatskog provođenja uz pomoć statističkih softverskih paketa ima prednost u uštedi vremena za pojedinca.
Ključni odvodi
- Regresijska analiza je statistički pristup koji nastoji razumjeti i izmjeriti odnose između neovisnih i ovisnih varijabli. Postupno regresija je metoda koja ispituje statističku značajnost svake neovisne varijable unutar modela. Pristup odabiru naprijed dodaje varijablu, a zatim provjerava statistički značaj.Način uklanjanja unatrag započinje modelom opterećenim mnogo varijabli, a zatim uklanja jednu varijablu kako bi se ispitala njena važnost u odnosu na sveukupne rezultate. Postupka regresije ima mnogo kritičara, jer pristup koji uklapa podatke u model postiže željeni rezultat.
Postepena regresija može se postići ili isprobavanjem jedne nezavisne varijable odjednom i uključivanjem u regresijski model ako je ona statistički značajna ili uključivanjem svih potencijalnih neovisnih varijabli u model i eliminiranjem onih koje nisu statistički značajne. Neki koriste kombinaciju obje metode i stoga postoje tri pristupa postupnoj regresiji:
- Odabir naprijed započinje bez varijabli u modelu, testira svaku varijablu kako je dodana modelu, a zatim zadržava one koje se smatraju statistički najznačajnijima - ponavlja postupak dok rezultati nisu optimalni. brišući jednu po jednu, a zatim testiranje da li je uklonjena varijabla statistički značajna. Dvosmjerno uklanjanje kombinacija je prve dvije metode koja testira koje varijable treba uključiti ili isključiti.
Primjer postupne regresije korištenjem metode eliminacije unatrag bio bi pokušaj razumijevanja potrošnje energije u tvornici pomoću varijabli poput vremena rada opreme, starosti opreme, veličine osoblja, temperature izvan i doba godine. Model uključuje sve varijable - a zatim se uklanja svaka, jedna po jedna, kako bi se utvrdilo najmanje statistički značajno. Na kraju bi model mogao pokazati da su doba godine i temperature najznačajnije, što možda sugerira da je najveća potrošnja energije u tvornici kad je potrošnja klima uređaja najveća.
Ograničenja postupne regresije
Regresijska analiza, linearna i multivarijantna, danas se široko koristi u svijetu ulaganja. Ideja je često pronaći obrasce koji su postojali u prošlosti, a koji bi se mogli ponoviti i u budućnosti. Jednostavna linearna regresija, na primjer, može razmotriti omjere cijene i zarade i prinose dionica tijekom godina kako bi utvrdila nude li dionice s malim P / E omjerima (neovisna varijabla) veći prinos (ovisna varijabla). Problem ovog pristupa je što se tržišni uvjeti često mijenjaju i odnosi koji su se održali u prošlosti ne moraju uvijek biti istiniti u sadašnjosti ili budućnosti.
U međuvremenu, postupni regresijski postupak ima mnogo kritičara, pa čak postoje i pozivi da se metoda potpuno prestane koristiti. Statističari primjećuju nekoliko nedostataka pristupa, uključujući netočne rezultate, urođenu pristranost u samom procesu i potrebu za značajnom računalnom snagom za razvoj složenih regresijskih modela kroz iteraciju.