Formula de corelație - Cum se calculează? (Pas cu pas)

Formula pentru a calcula corelația

Corelația este o măsură statistică între două variabile și este definită ca schimbarea cantității într-o variabilă corespunzătoare schimbării în alta și se calculează prin însumarea produsului de suma primei variabile minus media primei variabile în suma celei de-a doua variabile minus media celei de-a doua variabile împărțită la întreg sub rădăcina produsului pătratului primei variabile minus media primei variabile în suma pătratului celei de-a doua variabile minus media celei de-a doua variabile.

Valoarea corelației este limitată între -1 și +1 și poate fi interpretată după cum urmează:

  • -1: Dacă este -1, atunci variabilele sunt cunoscute ca fiind perfect corelate negativ. Asta înseamnă că dacă o variabilă se mișcă într-o direcție, atunci alta se mișcă în direcția opusă.
  • 0: Asta înseamnă că variabila nu are nicio corelație.
  • +1: Dacă este +1, atunci variabilele sunt cunoscute ca fiind perfect corelate pozitiv. Ambele variabile se deplasează în direcții pozitive.

Dacă avem 2 variabile x și y, atunci coeficientul de corelație între 2 variabile poate fi găsit ca:

Coeficient de corelație = ∑ (x (i) - medie (x)) * (y (i) -mediu (y)) / √ (∑ (x (i) -mediu (x)) 2 * ∑ (y (i) -înțeles (y)) 2 )

Unde,

  • x (i) = valoarea lui x în eșantion
  • Media (x) = media tuturor valorilor lui x
  • y (i) = valoarea lui y în eșantion
  • Media (y) = media tuturor valorilor lui y

Exemple

Nu este ușor să calculați corelația în Excel. Sintaxa funcției utilizate este după cum urmează:

Coeficient de corelație = CORREL (matrice1, matrice2)

Exemplul nr. 1

Să luăm același exemplu pe care l-am luat mai sus pentru calcularea corelației folosind excel.

Soluţie:

Mai jos sunt valorile lui x și y:

Calculul este după cum urmează.

Formula excel de bază = CORREL (matrice (x), matrice (y))

Coeficient = +0,95

Deoarece acest coeficient este aproape de +1, prin urmare x și y sunt extrem de corelate pozitiv.

Exemplul nr. 2

Corelația este utilă în principal pentru analiza prețului acțiunilor companiilor și crearea unui portofoliu de acțiuni pe baza acestora.

Să aflăm corelația stocului Apple cu indicele Nasdaq pe baza performanței stocului din ultimul an. Apple este o companie multinațională din SUA specializată în produse IT precum iPod, iPad, Mac etc.

Soluţie:

Mai jos este randamentul lunar al stocurilor Apple și Nasdaq pentru ultimul an:

Să introducem acum valorile -

Coeficient de corelație = ∑ (x (i) - medie (x)). (Y (i) -mediu (y)) / √ ∑ (x (i) -mediu (x)) 2 ∑ (y (i) - medie (y)) 2

Corelația dintre Apple și Nasdaq = 0,039 / (√0,0039)

Coeficient = 0,62

Deoarece corelația dintre Apple și Nasdaq este pozitivă, prin urmare Apple este corelată pozitiv cu Nasdaq.

Exemplul nr. 3

Să analizăm acum corelația dintre indicele Walmart și indicele Nasdaq pe baza performanței bursiere a ultimului an. Walmart este o companie din SUA care are un lanț de supermarketuri cu amănuntul.

Soluţie:

Mai jos este performanța lunară între Walmart și Nasdaq pentru ultimul an -

Să introducem acum valorile din formulă -

Coeficient de corelație = ∑ (x (i) - medie (x)). (Y (i) -mediu (y)) / √ ∑ (x (i) -mediu (x)) 2 ∑ (y (i) - medie (y)) 2

Prin urmare, calculul este după cum urmează,

Corelația dintre Walmart și Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Coeficient = 0,12

Putem vedea că Walmart și Nasdaq sunt, de asemenea, corelate pozitiv, dar nu la fel de mult în comparație cu corelația Apple cu Nasdaq.

Relevanță și utilizare

Un coeficient de corelație este util în stabilirea relației liniare între două variabile. Măsoară modul în care o variabilă se va mișca în comparație cu mișcarea unei alte variabile. Utilizarea practică a acestui coeficient este de a afla relația dintre mișcarea prețului acțiunilor și mișcarea generală a pieței. Baza acestei analize, un analist de acțiuni, va include proporția de acțiuni pentru a crea un portofoliu optim cu un risc minim. De asemenea, este util în știința datelor pentru a afla relația dintre 2 variabile.

De asemenea, coeficientul de corelație este utilizat foarte mult pentru studierea validității constructului datelor în analiza factorilor. Este foarte utilizat în analiza de regresie pentru a prezice valorile variabilelor dependente pe baza relației dintre variabilele dependente și independente. Această ecuație este destul de utilă în analiza cantitativă pentru a obține natura relației dintre diferite variabile. Baza acestei relații, dacă o variabilă nu are legătură cu alte variabile, atunci poate fi eliminată din listă.

Articole interesante...