Koja je linija najprikladnijeg
Linija najboljeg podudaranja odnosi se na crtu kroz raspored raštrkanih podataka koji najbolje izražava odnos između tih točaka. Statističari obično koriste metodu najmanje kvadrata za postizanje geometrijske jednadžbe za liniju, bilo ručnim izračunima ili softverom za regresijsku analizu. Ravna linija proizvest će iz jednostavne linearne regresijske analize dviju ili više neovisnih varijabli. Regresija koja uključuje više povezanih varijabli može u nekim slučajevima stvoriti zakrivljenu liniju.
Linija najboljeg fit
Osnove linije najboljeg uklapanja
Linija najboljeg podudaranja jedan je od najvažnijih rezultata regresijske analize. Regresija se odnosi na kvantitativnu mjeru odnosa između jedne ili više neovisnih varijabli i rezultirajuće ovisne varijable. Regresija je od koristi profesionalcima u širokom rasponu područja od znanosti i javnih službi do financijskih analiza.
Za provođenje regresijske analize, statističar prikuplja skup podataka, od kojih svaka uključuje potpuni skup ovisnih i neovisnih varijabli. Na primjer, ovisna varijabla može biti cijena dionica tvrtke, a neovisne varijable mogu biti Standard i Poor's 500 indeks i nacionalna stopa nezaposlenosti, pod pretpostavkom da dionice nisu navedene u S&P 500. Skup uzoraka mogao bi biti svaki od ovih tri skupa podataka za posljednjih 20 godina.
Na grafikonu bi se te podatkovne točke pokazale kao raspršeni zaplet, skup točaka koje se mogu, a ne moraju činiti organizirane duž bilo koje crte. Ako se vidi linearni uzorak, možda je moguće skicirati najbolju liniju koja minimalizira udaljenost tih točaka od te crte. Ako nije vidljiva niti jedna organizacijska os, regresijska analiza može generirati liniju na temelju metode najmanje kvadrata. Ovom se metodom dobiva linija koja minimizira udaljenost kvadratne točke svake točke od linije koja se najbolje uklapa.
Za određivanje formule za ovu liniju, statističar unosi ta tri rezultata u posljednjih 20 godina u regresijsku softversku aplikaciju. Softver proizvodi linearnu formulu koja izražava uzročno-posljedičnu vezu između S&P 500, stope nezaposlenosti i cijene dionica dotične tvrtke. Ova jednadžba je formula za liniju koja najbolje odgovara. To je prediktivno sredstvo, pružajući analitičarima i trgovcima mehanizam za projiciranje buduće cijene dionica tvrtke na temelju te dvije neovisne varijable.
Linija najbolje odgovarajuće jednadžbe i njezine komponente
Regresija s dvije neovisne varijable, kao što je primjer koji je gore spomenut, proizvest će formulu s ovom osnovnom strukturom:
y = c + b 1 (x 1) + b 2 (x 2)
U ovoj jednadžbi y je ovisna varijabla, c je konstanta, b 1 je prvi koeficijent regresije i x 1 je prva neovisna varijabla. Drugi koeficijent i druga neovisna varijabla su b 2 i x 2. Iz gornjeg primjera, cijena dionica bila bi y, S&P 500 bila bi x 1, a stopa nezaposlenosti x 2. Koeficijent svake neovisne varijable predstavlja stupanj promjene y za svaku dodatnu jedinicu u toj varijabli. Ako se S&P 500 poveća za jedan, rezultirajući y ili cijena dionica porast će za količinu koeficijenta. Isto vrijedi i za drugu nezavisnu varijablu, stopu nezaposlenosti. U jednostavnoj regresiji s jednom neovisnom varijablom taj je koeficijent nagib linije koja se najbolje uklapa. U ovom primjeru ili bilo kojoj regresiji s dvije neovisne varijable, nagib je kombinacija dva koeficijenta. Konstanta c je y-presjek crte koja najbolje odgovara.
Ključni odvodi
- Linija najboljeg usklađivanja koristi se za izražavanje odnosa u rasporedu raspršivanja različitih podataka. Izlazi iz regresijske analize i može se koristiti kao alat za predviđanje pokazatelja i kretanja cijena.