Testul Chi Square în Excel - Cum se face testul Chi Square cu Exemplu

Test Chi-Square cu Excel

Testul Chi-Square în excel este cel mai frecvent utilizat test non-parametric folosit pentru a compara două sau mai multe variabile pentru datele selectate aleatoriu. Este un tip de test care este folosit pentru a afla relația dintre două sau mai multe variabile, acesta este utilizat în statistici, cunoscută și sub numele de Chi-Square P-value, în Excel nu avem o funcție încorporată, dar putem folosi formule pentru efectuarea testului chi-pătrat în excel folosind formula matematică pentru testul Chi-pătrat.

Tipuri

  1. Test Chi-Square pentru bunătatea potrivirii
  2. Testul Chi-Square pentru independența a două variabile.

# 1 - Test Chi-Square pentru bunătatea potrivirii

Este folosit pentru a percepe proximitatea unui eșantion care se potrivește unei populații. Simbolul testului Chi-Square este (2). Este suma tuturor ( Număr observat - Număr așteptat) 2 / Număr așteptat.

  • Unde k-1 grade de libertate sau DF.
  • Unde Oi este frecvența observată, k este categoria, iar Ei este frecvența așteptată.

Notă: - Calitatea potrivirii unui model statistic se referă la înțelegerea cât de bine se potrivește datele eșantionului unui set de observații.

Utilizări

  • Bonitatea debitorilor pe baza grupelor de vârstă și a împrumuturilor personale
  • Relația dintre performanța vânzătorilor și instruirea primită
  • Rentabilitate pe un singur stoc și pe stocurile unui sector precum farmaceutic sau bancar
  • Categoria de telespectatori și impactul unei campanii TV.

# 2 - Test Chi-Square pentru independența a două variabile

Este folosit pentru a verifica dacă variabilele sunt sau nu autonome. Cu (r-1) (c-1) grade de libertate

Unde Oi este frecvența observată, r este numărul de rânduri, c este numărul de coloane și Ei este frecvența așteptată

Notă: - Două variabile aleatoare sunt numite independente dacă distribuția probabilității unei variabile nu este afectată de cealaltă.

Utilizări

Testul de independență este potrivit pentru următoarele situații:

  • Există o variabilă categorică.
  • Există două variabile categorice și va trebui să determinați relația dintre ele.
  • Există tabele încrucișate, iar relația dintre două variabile categorice trebuie găsită.
  • Există variabile necuantificabile (De exemplu, răspunsurile la întrebări precum, angajații din diferite grupe de vârstă aleg diferite tipuri de planuri de sănătate?)

Cum se face testul Chi-Square în Excel? (cu exemplu)

Managerul unui restaurant dorește să găsească relația dintre satisfacția clienților și salariile persoanelor care așteaptă mese. În acest sens, vom stabili ipoteza pentru a testa Chi-Square

  • Ea ia un eșantion aleatoriu de 100 de clienți care întreabă dacă serviciul a fost excelent, bun sau slab.
  • Apoi, ea clasifică salariile persoanelor care așteaptă ca fiind mici, medii și mari.
  • Să presupunem că nivelul de semnificație este 0,05. Aici, H0 și H1 denotă independența și dependența calității serviciilor de salariile meselor de așteptare ale oamenilor.
  • H 0 - calitatea serviciilor nu depinde de salariile persoanelor care așteaptă mesele.
  • H 1 - calitatea serviciilor depinde de salariile persoanelor care așteaptă mesele.
  • Descoperirile sale sunt prezentate în tabelul de mai jos:

În acest sens, avem 9 puncte de date, avem 3 grupuri, fiecare dintre ele primind un mesaj diferit despre salariu, iar rezultatul este dat în cele de mai jos.

Acum vom număra suma tuturor rândurilor și coloanelor. Vom face acest lucru cu ajutorul formulei, adică SUMĂ. Pentru a totaliza excelentul în coloana totală, am scris = SUM (B4: D4) și apoi apăsați tasta Enter.

Acest lucru ne va da 26 . Vom efectua la fel cu toate rândurile și coloanele.

Pentru a calcula gradul de libertate (DF), folosim (r-1) (c-1)

DF = (3-1) (3-1) = 2 * 2 = 4

  • Există 3 categorii de servicii și 3 categorii de salariu.
  • Avem 27 de respondenți cu un salariu mediu (rândul de jos, mijloc)
  • Avem 51 de respondenți cu un serviciu bun (ultima coloană, mijloc)

Acum trebuie să calculăm frecvențele așteptate: -

Frecvențele așteptate pot fi calculate utilizând o formulă: -

  • Pentru a calcula pentru Excelent, vom folosi înmulțirea totalului Minim cu totalul Excelent împărțit la N.

Să presupunem că trebuie să calculăm pentru primul rând și prima coloană (= B7 * E4 / B9 ) . Acest lucru va da numărul scontat de clienți care au votat Serviciu excelent pentru salariile persoanelor care așteaptă la fel de scăzut, adică 8,32 .

  • E 11 = - (32 * 26) / 100 = 8,32 , E 12 = 7,02 , E 13 = 10,66
  • E 21 = 16,32 , E 22 = 13,77 , E 23 = 20,91
  • E 31 = 7,36 , E 32 = 6,21 , E 33 = 9,41

În mod similar, pentru toți, trebuie să facem același lucru, iar formula este aplicată în diagrama de mai jos.

Obținem tabelul de frecvență preconizat așa cum este prezentat mai jos: -

Notă: - Să presupunem că nivelul de semnificație este 0,05. Aici, H0 și H1 denotă independența și dependența calității serviciilor de salariile meselor de așteptare ale oamenilor.

După calcularea frecvenței așteptate, vom calcula punctele de date chi-pătrat folosind o formulă.

Puncte Chi-Square = (Observat-Așteptat) 2 / Așteptat

Pentru a calcula primul punct, scriem = (B4-B14) 2 / B14.

Vom copia și lipi formula în alte celule pentru a completa valoarea automat.

După aceasta, vom calcula valoarea chi (valoare calculată) adăugând toate valorile date deasupra tabelului.

Am obținut valoarea Chi ca 18.65823 .

Pentru a calcula valoarea critică pentru aceasta, folosim un tabel de valori critice chi-pătrat din care putem folosi formula dată mai jos.

Această formulă conține 2 parametri CHISQ.INV.RT (probabilitate, grad de libertate).

Probabilitatea este de 0,05 și este o valoare semnificativă care ne va ajuta să stabilim dacă acceptăm ipoteza nulă (H 0 ) sau nu.

Valoarea critică a chi-pătratului este 9,487729037.

Acum vom găsi valoarea chi-pătratului sau (valoarea P) = CHITEST (gama_actuală, gama_așteptată)

Gama de la = CHITEST (B4: D6, B14: D16) .

După cum am văzut, valoarea chi-testului sau a valorii P este = 0,00091723.

Am calculat toate valorile. Valorile chi-pătrat (valoarea calculată) sunt semnificative numai atunci când valoarea sa este aceeași sau mai mare decât valoarea critică 9,48, adică, valoarea critică (valoarea tabelată) trebuie să fie mai mare decât 18,65 pentru a accepta ipoteza nulă (H 0 ) .

Dar aici Valoare calculată > Valoare tabelată

X 2 (calculat)> X 2 (tabelat)

18,65> 9,48

În acest caz, vom respinge ipoteza nulă (H 0 ), iar alternativa (H 1 ) va fi acceptată.

  • Putem folosi, de asemenea, valoarea P pentru a prezice același lucru, adică, dacă valoarea P <= α (valoare semnificativă 0,05), ipoteza nulă va fi respinsă.
  • Dacă valoarea P> α , nu respingeți ipoteza nulă .

Aici valoare P (0.0009172) < α (0,05), respinge H 0 , accepta H 1

Din exemplul de mai sus, concluzionăm că calitatea serviciilor depinde de salariile persoanelor care așteaptă.

Lucruri de amintit

  • Consideră pătratul unei variabile normale standard.
  • Evaluează dacă frecvențele observate în diferite categorii variază semnificativ față de frecvențele așteptate în cadrul unui set specificat de ipoteze.
  • Determină cât de bine se potrivește o distribuție presupusă cu datele.
  • Folosește tabele de contingență (în studiile de piață, aceste tabele se numesc taburi încrucișate).
  • Suportă măsurători la nivel nominal.

Articole interesante...