Što je analiza varijance (ANOVA)?
Analiza varijance (ANOVA) je alat za analizu koji se koristi u statistici koji dijeli uočenu agregatnu varijabilnost koja se nalazi unutar skupa podataka na dva dijela: sustavni faktori i slučajni faktori. Sustavni čimbenici imaju statistički utjecaj na dani skup podataka, dok slučajni faktori ne. Analitičari koriste ANOVA test kako bi utvrdili utjecaj koji neovisne varijable imaju na zavisnu varijablu u regresijskoj studiji.
Metode t- i z-testa razvijene u 20. stoljeću korištene su za statističku analizu sve do 1918., kada je Ronald Fisher kreirao analizu varijancijske metode. ANOVA se naziva i Fisherova analiza varijance i ona je proširenje t- i z-testova. Termin je postao poznat 1925. godine, nakon što se pojavio u Fisherovoj knjizi "Statističke metode za istraživačke radnike". Primijenjena je u eksperimentalnu psihologiju, a kasnije se proširila na teme složenije.
Formula za ANOVA je:
F = MSEMST gdje je: F = koeficijent ANOVAMST = srednji zbroj kvadrata zbog obradeMSE = srednji zbroj kvadrata zbog pogreške
Što otkriva analiza varijance?
ANOVA test je početni korak u analizi faktora koji utječu na određeni skup podataka. Nakon što je test završen, analitičar provodi dodatno ispitivanje metodičkih čimbenika koji mjerljivo doprinose nedosljednosti skupa podataka. Analitičar koristi rezultate ANOVA testa u f-testu kako bi stvorio dodatne podatke koji se poklapaju s predloženim regresijskim modelima.
ANOVA test omogućuje usporedbu više od dvije skupine istovremeno kako bi se utvrdilo postoji li odnos između njih. Rezultat ANOVA formule, F statistika (koja se naziva i F-omjer), omogućava analizu više skupina podataka kako bi se utvrdila varijabilnost između uzoraka i unutar uzoraka.
Ako ne postoji stvarna razlika između testiranih skupina, što se naziva nultom hipotezom, rezultat statistike ANOVA-ovog F-omjera bit će blizu 1. Fluktuacije u njegovom uzorkovanju vjerojatno će slijediti Fisher-ovu distribuciju. Ovo je zapravo skupina distribucijskih funkcija, s dva karakteristična broja, koja se nazivaju brojevima stupnjeva slobode i nazivnikom stupnjeva slobode.
Ključni odvodi
- Analiza varijance ili ANOVA je statistička metoda koja razdvaja promatrane podatke o varijanci u različite komponente koje se koriste za dodatna ispitivanja. Jednosmjerna ANOVA koristi se za tri ili više skupina podataka, za dobivanje podataka o odnosu između ovisnog i neovisne varijable.Ako ne postoji prava odstupanja između skupina, F-omjer ANOVA trebao bi biti jednak 1.
Primjer kako koristiti ANOVA
Na primjer, istraživač može testirati studente s više fakulteta kako bi utvrdio da li studenti s jednog od viših učilišta dosljedno nadmašuju studente s drugih fakulteta. U poslovnoj aplikaciji, istraživački i istraživački rad može testirati dva različita procesa stvaranja proizvoda da vidi je li jedan proces bolji od drugog u smislu troškovne učinkovitosti.
Vrsta korištenog ANOVA testa ovisi o brojnim čimbenicima. Primjenjuje se kada podaci trebaju biti eksperimentalni. Analiza varijance koristi se ako nema pristupa statističkom softveru koji rezultira ručnim računanjem ANOVA-e. Jednostavan je za upotrebu i najprikladniji za male uzorke. Kod mnogih eksperimentalnih dizajna, veličine uzoraka moraju biti iste za različite kombinacije nivoa faktora.
ANOVA je korisna za testiranje tri ili više varijabli. Slično je s višestrukim t-testovima s dva uzorka. Međutim, to rezultira sa manje pogrešaka tipa I i pogodno je za niz problema. ANOVA grupira razlike uspoređujući sredstva svake skupine i uključuje širenje varijance u različite izvore. Zaposlen je kod ispitanika, ispitnih skupina, između grupa i unutar grupa.
Jednosmjerna ANOVA vs dvosmjerna ANOVA
Postoje dvije vrste ANOVA: jednosmjerna (ili jednosmjerna) i dvosmjerna. Jednosmjerna ili dvosmjerna odnosi se na broj neovisnih varijabli u vašoj analizi testa varijance. Jednosmjerna ANOVA procjenjuje utjecaj jedinog faktora na varijablu odgovora jedina. Utvrđuje jesu li svi uzorci isti. Jednosmjerna ANOVA koristi se za utvrđivanje postoje li statistički značajne razlike između sredstava tri ili više neovisnih (nepovezanih) skupina.
Dvosmjerna ANOVA produžetak je jednosmjerne ANOVA. Jednosmjerno imate jednu neovisnu varijablu koja utječe na ovisnu varijablu. S dvosmjernom ANOVA dva su neovisna. Na primjer, dvosmjerna ANOVA omogućava poduzeću da usporedi produktivnost radnika na temelju dvije neovisne varijable, poput plaće i skupa vještina. Koristi se za promatranje interakcije dvaju čimbenika i ispituje učinak dvaju čimbenika istovremeno.