Što je Homoskedastic?
Homoskedastički (također napisan "homoscedastički") odnosi se na stanje u kojem je varijanca zaostalog ili pogrešnog izraza u regresijskom modelu konstantna. Odnosno, izraz pogreške se ne razlikuje puno jer se mijenja vrijednost varijable predviđanja. Međutim, nedostatak homoskedastičnosti može ukazivati na to da regresijski model možda mora uključivati dodatne varijable predviđanja da bi se objasnila učinkovitost ovisne varijable.
Ključni odvodi
- Homoskedastičnost se javlja kada je varijanca pojma pogreške u regresijskom modelu konstantna. Ako je varijanca pojma pogreške homoskedastična, model je bio dobro definiran. Ako postoji prevelika razlika, model možda nije dobro definiran. Dodavanje dodatnih varijabli predviđanja može pomoći u objašnjenju performansi ovisne varijable. Suprotno tome, heteroskedastičnost se javlja kada varijancija termina pogreške nije konstantna.
Kako djeluje Homoskedastic
Homoskedastičnost je jedna pretpostavka modeliranja linearne regresije. Ako varijanca pogrešaka oko regresijske linije znatno varira, regresijski model može biti loše definiran. Suprotnost homoskedastičnosti je heteroskedastičnost jednako kao što je suprotnost "homogenosti" "heterogena". Heteroskedastičnost (također napisana „heteroscedastičnost“) odnosi se na stanje u kojem varijanca pojma pogreške u jednadžbi regresije nije konstantna.
Ako uzmemo u obzir da je varijanca izmjerena razlika između predviđenog ishoda i stvarnog ishoda određene situacije, određivanje homoskedastičnosti može pomoći u određivanju koji faktori se moraju prilagoditi za točnost.
Posebna razmatranja
Jednostavni regresijski model, ili jednadžba, sastoji se od četiri pojma. Na lijevoj strani je ovisna varijabla. Predstavlja fenomen koji model nastoji „objasniti“. Na desnoj su strani konstanta, varijabla prediktora i rezidualni ili pogrešni izraz. Pojam pogreške pokazuje količinu varijabilnosti u zavisnoj varijabli koja nije objašnjena varijablom predviđanja.
Primjer Homoskedastičkog
Na primjer, pretpostavimo da ste htjeli objasniti rezultate studentskih testova koristeći količinu vremena koje je svaki student proveo studirajući. U ovom slučaju, rezultati testova bili bi ovisna varijabla, a vrijeme provedeno u proučavanju bilo bi varijabla prediktora.
Pojam pogreške pokazao bi količinu varijance u rezultatima testa koja nije objasnjena količinom vremena proučavanja. Ako je ta varijanca jednolična ili homoskedastična, onda bi taj model mogao sugerirati adekvatno objašnjenje performansi testa - objašnjavajući ga vremenom provedenim u studiranju.
Ali varijanca može biti heteroskedastična. Nacrt podataka o pojmu pogreške može pokazati da je velika količina vremena ispitivanja jako odgovarala visokim rezultatima ispitivanja, ali da su rezultati testa s malim vremenom ispitivanja varirali i uključivali su neke vrlo visoke ocjene. Varijanta rezultata ne bi se objasnila jednostavno jednom varijablom prediktora - količinom vremena proučavanja. U ovom je slučaju neki drugi faktor vjerojatno na djelu, a model će možda trebati poboljšati kako bi ga prepoznali. Daljnja istraga može otkriti da su neki studenti odgovor na test vidjeli unaprijed ili da su prethodno prošli sličan test, pa im nije trebalo proučavati upravo ovaj test.
Da bi se poboljšao regresijski model, istraživač bi, stoga, dodao još jednu objašnjenu varijablu koja pokazuje je li učenik vidio odgovore prije testa. Regresijski model bi tada imao dvije objašnjavajuće varijable - vrijeme proučavanja i je li učenik prethodno znao odgovore. S ove dvije varijable objasnila bi se više varijanca rezultata ispitivanja i varijanca pojma pogreške tada bi mogla biti homoskadastična, što sugerira da je model dobro definiran.