Što je linearna regresija?
Linearna regresija je grafikon podataka koji grafički prikazuje linearni odnos između neovisne i ovisne varijable. Obično se koristi da vizualno pokaže snagu odnosa i disperziju rezultata - a sve u svrhu objašnjenja ponašanja ovisne varijable.
Recimo da smo htjeli testirati čvrstoću veze između količine pojedenog sladoleda i pretilosti. Uzeli bismo neovisnu varijablu, količinu sladoleda i povezali je s ovisnom varijablom, pretilošću, da vidimo postoji li veza. S obzirom da je regresija grafički prikaz ovog odnosa, manja je varijabilnost u podacima, to je odnos jači i čvršće je prileganje liniji regresije.
Ključni odvodi
- Linearna regresija modelira odnos između ovisne i neovisne varijable. Analiza progresije može se postići ako su varijable neovisne, nema heteroscedastičnosti i pojmovi pogrešaka varijabli nisu povezani. Modeliranje linearne regresije u Excelu je lakše s ToolPak za analizu podataka.
Važna razmatranja
Postoji nekoliko kritičkih pretpostavki o vašem skupu podataka koje moraju biti istinite za nastavak regresijske analize:
- Varijable moraju biti doista neovisne (pomoću Chi-kvadrat testa). Podaci ne smiju imati različite varijacije pogrešaka (to se naziva heteroskedastičnost (također napisana heteroscedastičnost)). Pojmovi pogrešaka svake varijable moraju biti neusklađeni. Ako nije, to znači da su varijable serijski povezane.
Ako te tri stvari zvuče komplicirano, jesu. Ali učinak jednog od tih razloga koji nije istinit je pristrana procjena. U suštini, pogrešno biste uspostavili odnos koji mjerite.
Izlaženje regresije u Excelu
Prvi korak u pokretanju regresijske analize u Excelu je dvostruka provjera je li instaliran besplatni Excel dodatak za analizu podataka ToolPak. Ovaj dodatak olakšava izračun niza statistika. Nije potrebno crtati linearnu regresijsku liniju, ali to stvara jednostavnije kreiranje tablica. Da biste provjerili je li instaliran, odaberite "Podaci" na alatnoj traci. Ako je opcija "Analiza podataka" opcija, značajka je instalirana i spremna za upotrebu. Ako nije instalirana, možete zatražiti ovu opciju klikom na gumb Office i odabirom opcije "Excel opcije".
Pomoću alata za analizu podataka, regresijski izlaz stvara se u samo nekoliko klikova.
Neovisna varijabla ide u rasponu X.
S obzirom na prinos S&P 500, kažu da želimo znati možemo li procijeniti snagu i odnos povrata Visa (V). Podaci Visa (V) vraća podatke o stupcu 1 kao zavisnu varijablu. S&P 500 vraća podatke pušta stupac 2 kao nezavisnu varijablu.
- Na alatnoj traci odaberite "Podaci". Prikazuje se izbornik "Podaci". Odaberite "Analiza podataka". Prikazuje se dijaloški okvir Analiza podataka - Alati za analizu. Iz izbornika odaberite "Regresija" i kliknite "U redu". U dijaloškom okviru Regresija pritisnite okvir "Ulazni raspon Y" i odaberite ovisne varijable podataka (Visa (V) zaliha vraća). Kliknite na polje "Ulazni raspon X" i odaberite neovisne podatke varijable (S&P 500 se vraća). Kliknite da biste pokrenuli rezultate.
Protumačite rezultate
Pomoću tih podataka (isti iz našeg članka R-kvadrata) dobivamo sljedeću tablicu:
Vrijednost R2, poznata i kao koeficijent određivanja, mjeri udio varijacije u zavisnoj varijabli koja se objašnjava neovisnom varijablom ili koliko dobro regresijski model odgovara podacima. Vrijednost R2 se kreće od 0 do 1, a veća vrijednost ukazuje na bolje prianjanje. P-vrijednost ili vrijednost vjerojatnosti također se kreće od 0 do 1 i ukazuje da li je test značajan. Za razliku od vrijednosti R2, manja p-vrijednost je povoljna jer ukazuje na korelaciju između ovisne i neovisne varijable.
Nacrt regresije u Excelu
Regresiju u programu Excel možemo dijagramirati tako da označimo podatke i crtamo je kao crtež rasipanja. Da biste dodali liniju regresije, odaberite "Izgled" na izborniku "Alati grafikona". U dijaloškom okviru odaberite "Trendline", a zatim "Linear Trendline". Da biste dodali vrijednost R2, odaberite "Više opcija trend-a" na izborniku "Trendline. Konačno, odaberite" Prikažite vrijednost R-kvadrata na grafikonu ". Vizualni rezultat sažima snagu odnosa, iako na štetu ne pružanja onoliko detalja kao gornja tablica.