Regresie (semnificație, tipuri) - Ce este analiza de regresie?

Ce este Regresia?

Analiza de regresie este o măsurare bazată pe statistici utilizată în finanțe, investiții etc., care are ca scop stabilirea unei relații între o variabilă dependentă și alte serii de variabile independente, iar accentul principal este determinarea puterii relației de mai sus.

Explicații

  • Pentru a explica analiza de regresie în termenul unui profan, să presupunem că un șef de vânzări al unei companii încearcă din greu să prevadă vânzările din luna următoare. Există numeroși factori implicați care determină vânzările produsului, începând de la vreme până la noua strategie a concurentului, festivalul și schimbarea stilului de viață al consumatorilor.
  • Aceasta este o metodă de aliniere dintre câțiva factori care afectează vânzarea, care sunt cei care au impactul major. Poate ajuta la răspunsul la multe întrebări precum care sunt cei mai importanți factori, ce factori sunt mai puțin importanți, care este relația dintre acești factori și, cel mai important, care este garanția acestor factori.
  • Acești factori se numesc variabile. Principalul factor pe care încercăm să îl prognozăm se numește variabila dependentă, iar ceilalți factori care au un impact asupra variabilei dependente se numesc variabile independente.

Formulă

Analiza de regresie liniară simplă în excel poate fi exprimată ca formula de mai jos și măsoară relația dintre o variabilă dependentă și o variabilă independentă.

Y = a + bX + ϵ

Aici:

  • Y - Variabilă dependentă
  • X - Variabilă independentă (explicativă)
  • a - Intercepta
  • b - Panta
  • ϵ - Rezidual (eroare)

Cum se interpretează analiza de regresie?

Acest lucru poate fi interpretat prin asumarea unui scenariu simplu. Aici luăm relația dintre prețurile colecției de antichități la licitație și durata vechimii sale. Cu cât o antichitate îmbătrânește, cu atât prețul este mai mare. Presupunând că am stabilit date pentru ultimele 50 de articole care au fost scoase la licitație, putem prezice care vor fi prețurile viitoare ale licitației pe baza vechimii articolului. Folosind aceste date, putem construi o ecuație de regresie.

Formula de regresie care poate stabili o relație între vârstă și preț este următoarea:

y = eroare β0 + β1 x +
  • Aici factorul dependent este Y. Y reprezintă prețul fiecărui articol care urmează să fie licitat, în timp ce factorul independent este X, care determină vârsta.
  • Parametrii β0 și β1 sunt parametri care nu sunt cunoscuți și vor fi estimate prin ecuație.
  • β0 este o constantă care este utilizată pentru a defini linia de tendință liniară interceptează axa Y.
  • β1 este o constantă care demonstrează magnitudinea modificării valorii variabilei dependente ca funcție asociată a modificării implicată variabilelor independente.
  • Aceasta se numește practic panta ecuației. Când panta este o linie, înseamnă că există o relație proporțională între vârstă și preț și, în cazul în care panta este inversă, înseamnă că relația este indirect proporțională.
  • Eroarea poate fi definită ca zgomotul sau variația variabilei țintă și este aleatoare în natură.

Exemple din analiza regresiei din viața reală

Să presupunem că trebuie să stabilim o relație între vânzările care au avut loc și suma cheltuită pentru publicitate legată de un produs.

În general, putem observa o relație pozitivă între cantitatea de vânzare și suma cheltuită pentru publicitate. Alianțând ecuația de regresie liniară simplă, avem:

Y = a + bX

Să presupunem că obținem valoarea ca

Y = 500 + 30X

Interpretarea rezultatului:

Panta estimată de 30 ne ajută să tragem o concluzie că vânzările medii cresc 30 USD pe an, pe măsură ce cheltuielile pentru publicitate cresc.

Tipuri de analize de regresie

# 1 - Liniar

Aceasta poate fi exprimată ca formula de mai jos și măsoară relația dintre o variabilă dependentă și o variabilă independentă.

# 2 - Polinom

În această metodă, analiza este utilizată pentru a măsura relația dintre factorii dependenți individuali și variabilele independente multiple.

# 3 - Logistică

Aici factorul sau variabila dependentă este de natură binară. Variabilele independente pot fi continue sau binare. În regresia logistică multinomială, ne putem permite să avem mai mult de două categorii în timp ce ne alegem variabila independentă.

# 4 - Quantile

Acesta este un concept aditiv de regresie liniară și este utilizat în principal atunci când valorile aberante și asimetria sunt prezente în date.

# 5 - Elastic Net

Acest lucru este util atunci când se manipulează variabile independente corelate foarte mari.

# 6 - Regresia componentelor principale (PCR)

Aceasta este o tehnică care este aplicabilă atunci când există prea multe variabile independente sau există multicoliniaritate în date

# 7 - Cele mai mici pătrate parțiale (PLS)

Este o metodă opusă componentei principale în care avem variabile independente foarte corelate. Este, de asemenea, aplicabil atunci când există multe variabile independente.

# 8 - Vector de asistență

Aceasta poate oferi o soluție la modelele liniare și neliniare. Folosește funcțiile nucleului neliniar pentru a găsi soluția optimă pentru modelele neliniare.

# 9 - Ordinal

Se aplică predicției valorilor clasate. Practic, este potrivit atunci când variabila dependentă este de natură ordinală

# 10 - Poisson

Acest lucru se aplică atunci când variabila dependentă are date de numărare.

# 11 - Binom negativ

De asemenea, se aplică gestionarea datelor de numărare numai că regresia binomială negativă nu presupune distribuția numărului având varianță egală cu media sa, în timp ce regresia Poisson presupune varianța egală cu media sa.

# 12 - Quasi Poisson

Este un substitut pentru regresia binomială negativă. Este, de asemenea, aplicabil pentru datele de numărare dispersate. Varianța unui model cvasi-Poisson este o funcție liniară a mediei, în timp ce varianța unui model binomial negativ este o funcție pătratică a mediei.

# 13 - Cox

Acesta intră mai mult în utilizare pentru analiza datelor despre timpul până la eveniment.

Diferența dintre regresie și corelație

  • Regresia stabilește relația dintre o varianță independentă și o variabilă dependentă în care ambele variabile sunt diferite, în timp ce corelația determină asocierea sau dependența a două variabile în care nu există nicio diferență între ambele variabile.
  • Obiectivul principal al regresiei este de a crea o linie de potrivire optimă și estimarea unei variabile se face pe baza altora, în timp ce în corelație demonstrează relația liniară dintre două variabile.
  • În acest sens, estimăm magnitudinea unei anumite modificări a variabilei recunoscute (X) pe variabila estimată (Y), în timp ce, în corelație, coeficientul este utilizat pentru a măsura în ce măsură cele două variabile se mișcă împreună.
  • Este un proces de estimare a mărimii variabilelor independente aleatoare bazate pe magnitudinea unei variabile statice dependente, în timp ce corelația ne ajută să decidem o anumită valoare pentru a exprima interdependența dintre ambele variabile.

Concluzie

  • Analiza de regresie utilizează în primul rând datele pentru a stabili o relație între două sau mai multe variabile. Aici se presupune că relațiile existente în trecut se vor reflecta și în prezent sau în viitor. Puțini consideră acest lucru ca un decalaj între trecut și prezent / viitor.
  • Cu toate acestea, este o tehnică de estimare și estimare pe scară largă. Deși implică matematică, pe care mulți utilizatori o pot considera dificilă, tehnica este relativ ușor de utilizat, mai ales atunci când este disponibil un model.

Articole interesante...