Coeficientul de corelație Pearson (Formula, exemplu) - Calculați Pearson R

Definiția coeficientului de corelație Pearson

Coeficientul de corelație Pearson, cunoscut și sub numele de test statistic Pearson R, măsoară puterea dintre diferitele variabile și relațiile lor. Ori de câte ori se efectuează un test statistic între cele două variabile, atunci este întotdeauna o idee bună pentru persoana care face analize să calculeze valoarea coeficientului de corelație pentru a ști cât de puternică este relația dintre cele două variabile.

Coeficientul de corelație al lui Pearson returnează o valoare între -1 și 1. Interpretarea coeficientului de corelație este următoarea:

  • Dacă coeficientul de corelație este -1, indică o relație negativă puternică. Implică o relație negativă perfectă între variabile.
  • Dacă coeficientul de corelație este 0, nu indică nicio relație.
  • Dacă coeficientul de corelație este 1, indică o relație pozitivă puternică. Implică o relație pozitivă perfectă între variabile.

O valoare absolută mai mare a coeficientului de corelație indică o relație mai puternică între variabile. Astfel, un coeficient de corelație de 0,78 indică o corelație pozitivă mai puternică în comparație cu o valoare de 0,36. În mod similar, un coeficient de corelație de -0,87 indică o corelație negativă mai puternică în comparație cu un coeficient de corelație de -0,40.

Cu alte cuvinte, dacă valoarea este în intervalul pozitiv, atunci arată că relația dintre variabile este corelată pozitiv și că ambele valori scad sau cresc împreună. Pe de altă parte, dacă valoarea este în intervalul negativ, atunci arată că relația dintre variabile este corelată negativ, iar ambele valori vor merge în direcția opusă.

Formula coeficientului de corelație Pearson

Formula coeficientului de corelație a lui Pearson este următoarea,

Unde,

  • r = Coeficientul Pearson
  • n = numărul perechilor de stoc
  • ∑xy = suma produselor stocurilor asociate
  • ∑x = suma scorurilor x
  • ∑y = suma scorurilor y
  • ∑x 2 = suma scorurilor x pătrate
  • ∑y 2 = suma scorurilor y pătrat

Explicaţie

Pasul 1: Aflați numărul de perechi de variabile, care este notat cu n. Să presupunem că x constă din 3 variabile - 6, 8, 10. Să presupunem că y constă din 3 variabile corespunzătoare 12, 10, 20.

Pasul 2: enumerați variabilele în două coloane.

Pasul 3: Aflați produsul lui x și y în coloana a 3 -a .

Pasul 4: Aflați suma valorilor tuturor variabilelor x și a tuturor variabilelor y. Scrieți rezultatele la partea de jos a 1 st și 2 nd coloana. Scrieți suma lui x * y în 3 rd coloana.

Pasul 5: Aflați x 2 și y 2 în 4 - lea și 5 th coloane și suma lor la baza coloanelor.

Pasul 6: introduceți valorile găsite mai sus în formulă și rezolvați-o.

r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )

= 0,7559

Exemplu de coeficient de corelație Pearson R

Exemplul 1

În acest exemplu, cu ajutorul următoarelor detalii din tabelul celor 6 persoane care au o vârstă diferită și greutăți diferite date mai jos pentru calcularea valorii Pearson R

Sr nr Vârsta (x) Greutate (y)
1 40 78
2 21 70
3 25 60
4 31 55
5 38 80
6 47 66

Soluţie:

Pentru calcularea coeficientului de corelație Pearson, vom calcula mai întâi următoarele valori,

Aici numărul total de persoane este 6 deci, n = 6

Acum calculul Pearson R este după cum urmează,

  • r = (n (Σxy) - (Σx) (Σy)) / (√ (n Σx 2 - (Σx) 2 ) (n Σy 2 - (Σy) 2 )
  • r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (83622- 82618) / (√ (43680 -40804) * (170190- 167281)
  • r = 1004 / (√ (2876) * (2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892.452938
  • r = 0,35

Astfel, valoarea coeficientului de corelație Pearson este 0,35

Exemplul nr. 2

Există 2 stocuri - A și B. Prețurile acțiunilor lor în anumite zile sunt următoarele:

Stoc A (x) Stcok B (y)
45 9
50 8
53 8
58 7
60 5

Aflați coeficientul de corelație Pearson din datele de mai sus.

Soluţie:

În primul rând, vom calcula următoarele valori.

Calculul coeficientului Pearson este după cum urmează,

  • r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
  • = -0.9088

Prin urmare, coeficientul de corelație Pearson dintre cele două stocuri este -0.9088.

Avantaje

  • Ajută la cunoașterea cât de puternică este relația dintre cele două variabile. Nu numai prezența sau absența corelației dintre cele două variabile este indicată utilizând coeficientul de corelație Pearson, dar determină, de asemenea, măsura exactă în care aceste variabile sunt corelate.
  • Folosind această metodă, se poate stabili direcția corelației, adică dacă corelația dintre două variabile este negativă sau pozitivă.

Dezavantaje

  • Coeficientul de corelație Pearson R nu este suficient pentru a face diferența dintre variabilele dependente și variabilele independente, deoarece coeficientul de corelație dintre variabile este simetric. De exemplu, dacă o persoană încearcă să cunoască corelația dintre stresul ridicat și tensiunea arterială, atunci s-ar putea găsi valoarea mare a corelației, ceea ce arată că stresul ridicat provoacă tensiunea arterială. Acum, dacă variabila este schimbată, atunci rezultatul, în acest caz, va fi, de asemenea, același, ceea ce arată că stresul este cauzat de tensiunea arterială, ceea ce nu are sens. Astfel, cercetătorul ar trebui să fie conștient de datele pe care le folosește pentru efectuarea analizei.
  • Folosind această metodă, nu se pot obține informații despre panta liniei, deoarece se afirmă doar dacă există sau nu vreo relație între cele două variabile.
  • Este probabil ca coeficientul de corelație Pearson să fie interpretat greșit, mai ales în cazul datelor omogene.
  • În comparație cu celelalte metode de calcul, această metodă necesită mult timp pentru a ajunge la rezultate.

Puncte importante

  • Valorile pot varia de la valoarea +1 la valoarea -1, unde +1 indică relația pozitivă perfectă între variabilele luate în considerare, -1 indică relația negativă perfectă între variabilele luate în considerare, iar o valoare 0 indică faptul că nu există o relație există între variabilele luate în considerare.
  • Este independent de unitatea de măsură a variabilelor. De exemplu, dacă unitatea de măsură a unei variabile este în ani, în timp ce unitatea de măsură a celei de-a doua variabile este în kilograme, chiar și atunci, valoarea acestui coeficient nu se modifică.
  • Coeficientul de corelație dintre variabile este simetric, ceea ce înseamnă că valoarea coeficientului de corelație dintre Y și X sau X și Y va rămâne aceeași.

Concluzie

Coeficientul de corelație Pearson este tipul de coeficient de corelație care reprezintă relația dintre cele două variabile, care sunt măsurate pe același interval sau pe aceeași scală de raport. Măsoară puterea relației dintre cele două variabile continue.

Nu numai că afirmă prezența sau absența corelației dintre cele două variabile, ci determină, de asemenea, măsura exactă în care aceste variabile sunt corelate. Este independent de unitatea de măsură a variabilelor unde valorile coeficientului de corelație pot varia de la valoarea +1 la valoarea -1. Cu toate acestea, nu este suficient să se facă diferența dintre variabilele dependente și variabilele independente.

Articole interesante...