R pătrat (R ^ 2) - Definiție, Formula, calculați R pătrat

Ce este R pătrat (R2) în regresie?

R-pătrat (R 2 ) este o măsură statistică importantă, care este un model de regresie care reprezintă proporția diferenței sau varianței în termeni statistici pentru o variabilă dependentă care poate fi explicată printr-o variabilă sau variabile independente. Pe scurt, determină cât de bine se vor potrivi datele cu modelul de regresie.

R Formula pătrată

Pentru calcularea lui R pătrat, trebuie să determinați coeficientul de corelație și apoi trebuie să păstrați rezultatul.

R Formula pătrată = r 2

Unde r coeficientul de corelație poate fi calculat pentru mai jos:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Unde,

  • r = Coeficientul de corelație
  • n = numărul din setul de date dat
  • x = prima variabilă din context
  • y = a doua variabilă

Explicaţie

Dacă există vreo relație sau corelație care poate fi liniară sau neliniară între aceste două variabile, atunci va indica dacă există o modificare a variabilei independente în valoare, atunci cealaltă variabilă dependentă se va schimba probabil în valoare, să spunem liniar sau neliniar.

Partea numeratorului formulei efectuează un test dacă se deplasează împreună și își îndepărtează mișcările individuale și puterea relativă a amândurora care se deplasează împreună, iar partea numitorului formulei scala numeratorul luând rădăcina pătrată a produsului diferențelor de variabilele din variabilele lor pătrate. Și când ați pătrat acest rezultat, obținem R pătrat, care nu este altceva decât coeficientul de determinare.

Exemple

Exemplul nr. 1

Luați în considerare următoarele două variabile x și y, vi se cere să calculați R pătrat în regresie.

Soluţie:

Folosind formula menționată mai sus, trebuie mai întâi să calculăm coeficientul de corelație.

Avem toate valorile din tabelul de mai sus cu n = 4.

Să introducem acum valorile din formulă pentru a ajunge la cifră.

r = (4 * 26.046,25) - (265,18 * 326,89) / √ ((4 * 21,274,94) - (326,89) 2 ) * ((4 * 31,901,89) - (326,89) 2 )

r = 17.501,06 / 17.512,88

Coeficientul de corelație va fi

r = 0,99932480

Deci, calculul va fi după cum urmează,

r 2 = (0,99932480) 2

R Formula pătrată în regresie

r 2 = 0,998650052

Exemplul nr. 2

India, o țară în curs de dezvoltare, dorește să efectueze o analiză independentă dacă modificările prețurilor la țiței au afectat valoarea rupiei sale. Următoarea este istoria prețului țițeiului Brent și a evaluării Rupiei ambelor față de dolarii care au prevalat în medie pentru acei ani pentru mai jos.

RBI, banca centrală a Indiei, s-a adresat dvs. pentru a vă prezenta o prezentare în cadrul următoarei întâlniri. Stabiliți dacă mișcările de țiței afectează mișcările în Rupie pe dolar?

Soluţie:

Folosind formula pentru corelația de mai sus, putem calcula mai întâi coeficientul de corelație. Tratarea prețului mediu al țițeiului ca o variabilă, să zicem x, și tratarea rupiei pe dolar ca o altă variabilă ca y.

Avem toate valorile din tabelul de mai sus cu n = 6.

Să introducem acum valorile din formulă pentru a ajunge la cifră.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1.715,95

Coeficientul de corelație va fi

r = -0,3614

Deci, calculul va fi după cum urmează,

r 2 = (-0,3614) 2

R Formula pătrată în regresie

r 2 = 0.1306

Analiză: Se pare că există o relație minoră între modificările prețurilor la țiței și variațiile prețului rupiei indiene. Pe măsură ce prețul țițeiului crește, modificările din rupia indiană afectează, de asemenea. Dar, din moment ce R pătrat este de numai 13%, atunci modificările prețului țițeiului explică foarte puțin despre modificările din rupia indiană, iar rupia indiană este supusă și schimbărilor în alte variabile, care trebuie luate în considerare.

Exemplul nr. 3

Laboratorul XYZ efectuează cercetări privind înălțimea și greutatea și este interesat să știe dacă există vreun fel de relație între aceste variabile. După ce a adunat un eșantion de 5000 de persoane pentru fiecare categorie și a venit cu o greutate medie și o înălțime medie în grupul respectiv.

Mai jos sunt detaliile pe care le-au adunat.

Vi se cere să calculați R pătrat și să concluzionați dacă acest model explică că variațiile în înălțime afectează variațiile în greutate.

Soluţie:

Folosind formula pentru corelația de mai sus, putem calcula mai întâi coeficientul de corelație. Tratarea înălțimii ca o variabilă, să spunem x și tratarea greutății ca o altă variabilă ca y.

Avem toate valorile din tabelul de mai sus cu n = 6.

Să introducem acum valorile din formulă pentru a ajunge la cifră.

r = (7 * 74,058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6.581,05 / 7.075,77

Coeficientul de corelație va fi

Coeficient de corelație (r) = 0,9301

Deci, calculul va fi după cum urmează,

r 2 = 0,8651

Analiză: Corelația este pozitivă și se pare că există o anumită relație între înălțime și greutate. Pe măsură ce înălțimea crește, greutatea persoanei pare, de asemenea, să crească. În timp ce R2 sugerează că 86% din modificările înălțimii se atribuie schimbărilor în greutate, iar 14% sunt inexplicabile.

Relevanță și utilizări

Relevanța lui R pătrat în regresie este capacitatea sa de a găsi probabilitatea apariției evenimentelor viitoare în cadrul rezultatelor prezise date sau al rezultatelor. Dacă se adaugă mai multe eșantioane la model, atunci coeficientul ar arăta probabilitatea sau probabilitatea ca un punct nou sau noul set de date să cadă pe linie. Chiar dacă ambele variabile au o legătură puternică, determinarea nu dovedește cauzalitatea.

Unele dintre spațiile în care R pătrat este utilizat în cea mai mare parte este pentru urmărirea performanței fondurilor mutuale, pentru urmărirea riscului în fondurile speculative, pentru a determina cât de bine se mișcă stocul pe piață, unde R2 ar sugera cât de mult din mișcările stocului pot fi explicate de mișcările din piață.

Articole interesante...