Regresia celor mai mici pătrate - Cum se creează linia cea mai potrivită?

Definiția metodei de regresie a celor mai mici pătrate

O metodă de regresie a celor mai mici pătrate este o formă de analiză de regresie care stabilește relația dintre variabila dependentă și independentă împreună cu o linie liniară. Această linie este denumită „linia cea mai potrivită”.

Analiza de regresie este o metodă statistică cu ajutorul căreia se pot estima sau prezice valorile necunoscute ale unei variabile din valorile cunoscute ale altei variabile. Variabila care este utilizată pentru a prezice variabila dobândă se numește variabilă independentă sau explicativă, iar variabila care se prezice se numește variabilă dependentă sau explicată.

Să luăm în considerare două variabile, x & y. Acestea sunt reprezentate pe un grafic cu valori de x pe valorile axei x ale lui y pe axa y. Aceste valori sunt reprezentate de punctele din graficul de mai jos. Prin puncte se trasează o linie dreaptă - denumită linia cea mai potrivită.

Obiectivul regresiei celor mai mici pătrate este să se asigure că linia trasată prin setul de valori furnizate stabilește relația cea mai apropiată între valori.

Formula de regresie a celor mai mici pătrate

Linia de regresie în cadrul metodei celor mai mici pătrate este calculată utilizând următoarea formulă -

ŷ = a + bx

Unde,

  • ŷ = variabilă dependentă
  • x = variabilă independentă
  • a = interceptare y
  • b = panta liniei

Panta liniei b se calculează folosind următoarea formulă -

Sau

Interceptarea Y, „a” se calculează folosind următoarea formulă -

Linia de cea mai bună potrivire în regresia cel mai mic pătrat

Linia de potrivire cea mai bună este o linie dreaptă trasată printr-o dispersie de puncte de date care reprezintă cel mai bine relația dintre ele.

Să luăm în considerare următorul grafic în care un set de date este reprezentat de-a lungul axelor x și y. Aceste puncte de date sunt reprezentate folosind punctele albastre. Prin aceste puncte sunt trasate trei linii - o linie verde, roșie și albastră. Linia verde trece printr-un singur punct, iar linia roșie trece prin trei puncte de date. Cu toate acestea, linia albastră trece prin patru puncte de date, iar distanța dintre punctele reziduale până la linia albastră este minimă în comparație cu celelalte două linii.

În graficul de mai sus, linia albastră reprezintă linia cea mai potrivită, deoarece se află cel mai aproape de toate valorile, iar distanța dintre punctele din afara liniei până la linie este minimă (adică, distanța dintre reziduuri la linia cea mai potrivită - denumită și sumele de pătrate ale reziduurilor). În celelalte două linii, portocaliu și verde, distanța dintre reziduuri la linii este mai mare în comparație cu linia albastră.

Metoda celor mai mici pătrate oferă cea mai strânsă relație între variabilele dependente și independente prin minimizarea distanței dintre reziduuri și linia de potrivire cea mai bună, adică suma pătratelor reziduale este minimă în această abordare. De aici și termenul „cele mai mici pătrate”.

Exemple de linie de regresie a celor mai mici pătrate

Să aplicăm aceste formule în întrebarea de mai jos -

Exemplul nr. 1

Detaliile referitoare la experiența tehnicienilor într-o companie (într-un număr de ani) și la evaluarea performanței acestora sunt furnizate în tabelul de mai jos. Folosind aceste valori, estimați ratingul de performanță pentru un tehnician cu 20 de ani de experiență.

Experiența tehnicianului (în ani) rata de performanta
16 87
12 88
18 89
4 68
3 78
10 80
5 75
12 83

Soluție -

Pentru a calcula mai întâi cele mai mici pătrate vom calcula interceptarea Y (a) și panta unei linii (b) după cum urmează -

Panta liniei (b)

  • b = 6727 - ((80 * 648) / 8) / 1018 - ((80) cu 2 /8)
  • = 247/218
  • = 1,13

Interceptare Y (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

Linia de regresie este calculată după cum urmează -

Înlocuind 20 cu valoarea lui x în formulă,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Evaluarea performanței pentru un tehnician cu 20 de ani de experiență este estimată la 92,3.

Exemplul nr. 2

Ecuația de regresie a celor mai mici pătrate folosind Excel

Ecuația de regresie a celor mai mici pătrate poate fi calculată folosind excel prin următorii pași -

  • Introduceți tabelul de date în Excel.
  • Introduceți un grafic scatter folosind punctele de date.
  • Introduceți o linie de tendință în graficul scatter.
  • Sub opțiunile liniei de tendință - selectați linia de tendință liniară și selectați ecuația de afișare pe diagramă.
  • Ecuația de regresie a celor mai mici pătrate pentru setul dat de date Excel este afișată pe grafic.

Astfel, se calculează ecuația de regresie a celor mai mici pătrate pentru setul dat de date Excel. Folosind ecuația, se pot face predicții și analize de tendință. Instrumentele Excel oferă, de asemenea, calcule detaliate de regresie.

Avantaje

  • Metoda celor mai mici pătrate a analizei de regresie este cea mai potrivită pentru modelele de predicție și analiza tendințelor. Este cel mai bine utilizat în domeniile economiei, finanțelor și piețelor bursiere în care valoarea oricărei variabile viitoare este prevăzută cu ajutorul variabilelor existente și relația dintre acestea.
  • Metoda celor mai mici pătrate oferă cea mai apropiată relație între variabile. Diferența dintre sumele de pătrate de reziduuri la linia de potrivire cea mai bună este minimă în cadrul acestei metode.
  • Mecanismul de calcul este simplu și ușor de aplicat.

Dezavantaje

  • Metoda celor mai mici pătrate se bazează pe stabilirea celei mai strânse relații între un set dat de variabile. Mecanismul de calcul este sensibil la date și, în cazul unor valori excepționale (date excepționale), rezultatele pot tinde să afecteze în mod major.
  • Acest tip de calcul este cel mai potrivit pentru modelele liniare. Pentru ecuațiile neliniare, se aplică mecanisme de calcul mai exhaustive.

Concluzie

Metoda celor mai mici pătrate este una dintre cele mai utilizate metode populare pentru modele de predicție și analiza tendințelor. Atunci când este calculat corespunzător, acesta oferă cele mai bune rezultate.

Articole interesante...