Sadržaj
- Formula za korelaciju
- Česte pogreške s korelacijom
- Pronalaženje korelacije u Excelu
Korelacija mjeri linearni odnos dviju varijabli. Mjerenjem i povezivanjem varijance svake varijable, korelacija daje jačinu odnosa. Ili drugačije rečeno, korelacija odgovara na pitanje: Koliko varijabla A (neovisna varijabla) objašnjava varijablu B (ovisnu varijablu)?
Ključni odvodi
- Korelacija je statistička linearna podudarnost varijacija između dvije varijable. U financijama, korelacija se koristi u nekoliko aspekata analize, uključujući izračun ili standardno odstupanje portfelja. Računanje računa može biti dugotrajno, ali softver poput Excel-a olakšava izračunavanje.
Formula za korelaciju
Korelacija kombinira nekoliko važnih i povezanih statističkih koncepata, naime varijancu i standardno odstupanje. Varijanca je disperzija varijable oko srednje vrijednosti, a standardna devijacija je kvadratni korijen varijance.
Formula je:
Budući da korelacija želi procijeniti linearni odnos dviju varijabli, ono što je stvarno potrebno je vidjeti koliku kovarijansu imaju te dvije varijable i u kojoj mjeri se ta kovarijancija odražava standardnim odstupanjima svake varijable pojedinačno.
Česte pogreške s korelacijom
Najčešća jedina pogreška je pretpostavka da je korelacija koja se približava +/- 1 statistički značajna. Čitanje koje se približava +/- 1 definitivno povećava šanse za stvarni statistički značaj, ali bez daljnjeg testiranja nemoguće je znati. Statističko testiranje korelacije može se zakomplicirati iz više razloga; uopće nije ravno. Kritična pretpostavka korelacije je da su varijable neovisne i da je odnos među njima linearan. Teoretski, te tvrdnje biste testirali da biste utvrdili je li odgovarajući izračun.
Zapamtite, povezanost dviju varijabli NE znači da je A uzrokovao B ili obrnuto.
Druga najčešća greška je zaboravljanje normalizacije podataka u zajedničku jedinicu. Ako se izračuna korelacija na dvije beta, tada su jedinice već normalizirane: beta je jedinica. Međutim, ako želite povezati dionice, najvažnije je da ih normalizirate u postotni povrat, a ne da mijenjate cijene. To se događa prečesto, čak i među investicijskim profesionalcima.
Za korelaciju cijena dionica postavljate u osnovi dva pitanja: Koliki je povrat u određenom broju razdoblja i kako taj povrat odgovara povratu drugog vrijednosnog papira u istom razdoblju? To je i razlog zašto je teško povezati cijene dionica: Dvije vrijednosne papire mogu imati visoku korelaciju ako se povrat dnevno mijenja u postocima, ali niska korelacija ako se povrat mjesečno mijenja u protekla 52 tjedna. Koji je bolji"? Doista ne postoji savršeni odgovor, a ovisi o svrsi testa.
Pronalaženje korelacije u Excelu
Postoji nekoliko metoda za izračunavanje korelacije u Excelu. Najjednostavnije je dobiti dva skupa podataka i koristiti ugrađenu formulu korelacije:
Ovo je prikladan način da se izračuna povezanost između samo dva skupa podataka. Ali što ako želite stvoriti korelacijsku matricu u nizu podataka? Da biste to učinili, morate koristiti Excel dodatak za analizu podataka. Dodatak se nalazi na kartici Podaci, pod stavkom Analiziraj.
Odaberite tablicu povrata. U ovom slučaju, stupci su naslovi, pa želimo potvrditi okvir "Oznake u prvom redu", pa Excel to zna tretirati kao naslove. Tada možete odlučiti za ispis na istom listu ili na novom listu.
Jednom kada pritisnete Enter, podaci se automatski izrađuju. Možete dodati malo tekstualnog i uvjetnog oblikovanja da biste očistili rezultat.