Što je kvartil?
Kvartil je statistički izraz koji opisuje podjelu opažanja u četiri definirana intervala na temelju vrijednosti podataka i njihovog uspoređivanja s cijelim nizom opažanja.
Razumijevanje kvartila
Da bismo razumjeli kvart, važno je shvatiti medijan kao mjerilo središnje tendencije. Medijan u statistici je srednja vrijednost niza brojeva. To je točka u kojoj točno polovica podataka leži ispod i iznad središnje vrijednosti.
Dakle, s obzirom na skup od 13 brojeva, medijan bi bio sedmi broj. Šest brojeva koji prethode toj vrijednosti najmanji su brojevi u podacima, a šest brojeva nakon medijane najveći su brojevi u danom skupu podataka. Zbog toga što na medijanu ne utječu ekstremne vrijednosti ili izdatci u raspodjeli, ponekad se preferira srednja vrijednost.
Medijan je robustan procjenitelj lokacije, ali ne govori ništa o tome kako se podaci s obje strane njegove vrijednosti šire ili šire. U tom se koraku događaju četvrtine. Kvatil mjeri širenje vrijednosti iznad i ispod srednje vrijednosti tako što dijeli raspodjelu na četiri skupine.
Ključni odvodi
- Kvartil mjeri širenje vrijednosti iznad i ispod srednje vrijednosti tako što dijeli raspodjelu u četiri skupine. Četverac dijeli podatke u tri točke - donji kvartil, srednji i gornji kvartil - kako bi se formirale četiri grupe skupa podataka. Koriste se kvartili izračunati interkvartilni raspon koji je mjera varijabilnosti oko medijane.
Kako djeluju kvartili
Baš kao što medijana dijeli podatke na pola tako da 50% mjerenja leži ispod medijane, a 50% leži iznad nje, tako se i kvartil rastavlja na četvrtine tako da je 25% mjerenja manje od donjeg kvartila, 50 % su manje od prosjeka, a 75% manje od gornjeg kvartila.
Četvrt dijeli podatke u tri točke - donji kvartil, srednji i gornji kvartil - kako bi formirali četiri grupe skupa podataka. Donji kvartil ili prvi kvartil označen je kao Q1 i srednji je broj koji pada između najmanje vrijednosti skupa podataka i medijane. Drugi kvartil, Q2, je također medijan. Gornji ili treći kvartil, označen kao Q3, središnja je točka koja leži između medijala i najvećeg broja distribucije.
Sada možemo mapirati četiri skupine formirane od kvartila. Prva skupina vrijednosti sadrži najmanji broj do Q1; druga grupa uključuje Q1 do medijane; treći skup je medijan do Q3; četvrta kategorija obuhvaća Q3 na najvišu podatkovnu točku cijelog skupa.
Svaki kvartil sadrži 25% ukupnih opažanja. Podaci su raspoređeni od najmanjeg do najvećeg:
- Prvi kvartil: najniži 25% brojeva. Drugi kvartil: između 25, 1% i 50% (do medijane) Treći kvartil: 51% do 75% (iznad medijane) Četvrti kvartil: najveći 25% brojeva
Četvrti primjer
Radimo s primjerom. Pretpostavimo da je raspodjela matematičkih bodova u razredu od 19 učenika uzlaznim redoslijedom:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Najprije označite medijan, Q2, koji je u ovom slučaju deseta vrijednost: 75.
Q1 je središnja točka između najmanje vrijednosti i medijane. U ovom slučaju Q1 pada između prvog i petog rezultata: 68.
Q3 je srednja vrijednost između Q2 i najveća ocjena: 84.
Sad kad imamo svoje kvartile, protumačimo njihov broj. Ocjena 68 (Q1) predstavlja prvi kvartil i 25. je postotak. 68 je medijan donje polovice ocjene postavljen u dostupnim podacima, tj. Medijan rezultata od 59 do 75.
Q1 nam govori da je 25% bodova manje od 68 i 75% rezultata u klasi je veće. Q2 (srednja vrijednost) je 50. postotak i pokazuje da je 50% bodova manje od 75, a 50% bodova iznad 75. Konačno, Q3, 75. postotak, otkriva da je 25% bodova veći i 75% manji su od 84.
Posebna razmatranja
Ako je točka podataka za Q1 udaljenija od medijane, nego što je Q3 od medijane, tada možemo reći da postoji veća disperzija među manjim vrijednostima skupa podataka nego među većim vrijednostima. Ista logika primjenjuje se ako je Q3 udaljen od Q2 nego što je Q1 od medijana.
Alternativno, ako postoji parni broj podatkovnih točaka, medijan će biti prosjek srednjih dva broja. U našem gornjem primjeru, ako smo imali 20 učenika umjesto 19, srednja vrijednost njihovih rezultata bit će aritmetički prosjek desetog i jedanaestog broja.
Kvartili se koriste za izračun interkvartilnog raspona, što je mjera varijabilnosti oko medijane. Interkvartilni raspon jednostavno se izračunava kao razlika između prvog i trećeg kvartila: Q3 - Q1. Zapravo, raspon srednje polovice podataka pokazuje koliko su podaci rašireni.
Za velike skupove podataka, Microsoft Excel ima funkciju QUARTILE za izračun kvartila.