T-Test (Definiție, tipuri) - Exemple de calcul pas cu pas

Ce este T-Test?

Un T-Test este o metodă utilizată pentru a obține o inferență în statistici, care are scopul de a afla dacă există vreo diferență majoră între două mijloace în care cele două grupuri considerate pot fi legate între ele.

Explicaţie

  • Se urmărește testarea ipotezelor, care este practic utilizată pentru a testa o ipoteză referitoare la o anumită populație. Un test T ia în considerare statisticile T, valorile distribuției T și gradele de libertate, care sunt utilizate pentru a determina probabilitatea diferenței dintre două seturi de date.
  • Lucrarea de bază din spatele T-Test este că ia în considerare un eșantion din fiecare dintre cele două seturi și construiește o afirmație de problemă considerând o ipoteză nulă în care ambele mijloace sunt declarate egale.
  • Pe baza formulelor echivalate, valorile sunt trasate și comparate cu valorile standard, ceea ce duce în continuare la acceptarea sau respingerea ipotezei nule. Respingerea ipotezei nule indică faptul că setul de date este destul de precis și nu întâmplător.

Tipuri de T-Test

Există în principal patru tipuri de teste t, care sunt după cum urmează:

# 1 - 1-eșantion T-Test

Se urmărește testarea dacă media valorii vizate este egală cu media unei singure populații, de exemplu, Testarea dacă greutatea medie a elevilor clasei 5 este mai mare de 45 kg

# 2 - 2-eșantion T-Test

Se urmărește testarea dacă media valorii vizate este egală cu media a două populații independente, de exemplu, Testarea dacă greutatea medie a elevilor băieți din clasa 5 este diferită de elevele din clasa 5.

# 3 - Test T asociat

Se urmărește testarea dacă media valorii vizate este egală cu media diferențelor dintre observațiile dependente. de exemplu, compararea notelor studenților înainte și după efectuarea cursurilor pentru fiecare disciplină ne ajută să identificăm dacă luarea cursurilor este suficient de semnificativă pentru a îmbunătăți notele studenților.

# 4 - T-Test în ieșirea de regresie

Se ia în considerare coeficientul din ecuația de regresie și testează în ce măsură diferă de valoarea zero. de exemplu, dacă scorul examenului de admitere este un factor semnificativ pentru a determina dacă un student va obține un scor final bun.

Ipoteze ale testului T

  • Prima ipoteză pentru un test t este legată de scara de măsurare. Acest lucru este legat de faptul dacă scala urmează o scală continuă sau ordinală
  • A doua ipoteză se poate referi la natura aleatorie a eșantionului. Aceasta înseamnă că datele colectate ar trebui să fie de natură pură aleatorie.
  • A treia presupunere poate fi că, atunci când trasăm datele legate de distribuția testului t, acesta ar trebui să urmeze o distribuție normală și să aducă un grafic curbat în clopot.
  • A patra presupunere poate fi că pentru distribuția t și în mod specific pentru a obține o formă a curbei clopotului, trebuie să avem o dimensiune mai mare a eșantionului.
  • Presupunerea finală poate fi aceea pentru testul t. Varianța ar trebui să aibă o natură omogenă. e. abaterile standard sunt aproape egale.

Cum se calculează?

Funcționează în două scenarii diferite, adică unul pentru eșantionul independent și altul pentru eșantionul dependent.

# 1 - Scenariu independent de probă

  • Trebuie să calculăm suma, dimensiunea eșantionului, care este determinată de „N” și valoarea scorului pentru media pentru fiecare dintre eșantioanele independente. După aceasta, gradul de libertate trebuie calculat pentru fiecare eșantion independent.
  • Aceasta este reprezentată prin scăderea eșantionului cu unul, pe care îl denumim „n-1”. După aceasta, trebuie calculate varianța și deviația standard.
  • Gradele de libertate ale eșantioanelor sunt adăugate, iar acest lucru este denumit „df-total”. Apoi, trebuie să înmulțim gradul de libertate al fiecărui eșantion cu varianța fiecăruia. Trebuie să adăugăm rezultatele și apoi să împărțim totalul la „df-total”. Rezultatul obținut se numește varianță cumulată.
  • Varianța cumulată este apoi împărțită la n din eșantioane. Se adaugă apoi rezultatul obținut pentru toate probele. Rădăcina pătrată este luată, iar aceasta este denumită eroarea standard a diferenței.
  • În cele din urmă, trebuie să scădem media inferioară a eșantionului din media mai mare a eșantionului. Diferența obținută este apoi împărțită la eroarea standard a diferenței, iar rezultatele obținute se numesc valoarea T.

# 2 - Scenariu eșantion dependent

  • Se notează scorurile obținute din fiecare dintre perechile de seturi de date și trebuie să o scădem. Diferențele obținute sunt adăugate și denumite „D.” Diferențele fiecărei probe sunt pătrate și adăugate pentru a obține un rezultat numit „D-pătrat”. După aceasta, trebuie să înmulțim „N” sau numărul de scoruri asociate cu „D-pătrat”.
  • Rezultatul obținut se scade din pătratul totalului „D.” Acest rezultat este împărțit în continuare cu „N-1”. Rădăcina pătrată a rezultatului este obținută și se numește divizor. În cele din urmă, trebuie să împărțim „D” total la divizor, ceea ce ne dă valoarea finală t.

Exemple de teste T

Să luăm în considerare că avem punctaje pentru fiecare subiect la examenul desfășurat pentru două mandate.

Pasul 1: scade Faza 1 din Faza 2

Pasul 2: Adăugați toată diferența, adică -55

Pasul 3: Pătrundeți diferențele

Pasul 4: Adunați toate pătratele diferenței, adică 983

Pasul 5: Utilizarea formulei pentru a calcula valoarea T.

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9.16 / √ (983 - (- 55) cu 2 /6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • Valoarea T = -2,29

Valoarea T obținută este apoi comparată cu valoarea T obținută din tabel folosind valoarea p și gradul de libertate. Dacă valoarea t calculată este mai mare decât valoarea tabelului la un anumit nivel alfa predefinit, putem respinge ipoteza nulă spunând că există o diferență între medii.

Când este folosit?

Aceasta este utilizată pentru a compara două mijloace sau proporții. De asemenea, folosim un test t atunci când parametrii populației sunt necunoscuți de utilizator. În general, există trei cazuri de utilizare a scenariului de testare t, care sunt după cum urmează:

  • Se utilizează un e-test eșantion independent atunci când vrem să comparăm media a două grupuri.
  • Se utilizează un eșantion t-test asociat când vrem să comparăm media aceluiași grup, dar în momente diferite de timp.
  • Un e-test eșantion este utilizat atunci când avem nevoie de verificarea mediei unui grup individual față de o medie necunoscută.

Utilizare T-Test în Excel

  • În Excel, primul și cel mai important lucru de care avem nevoie este instalarea unui supliment numit Analiza datelor. După aceasta, trebuie să mergem la „Date” din fila meniu și să facem clic pe ea. Opțiunea „Analiza datelor” va fi vizibilă acolo.
  • Pentru a efectua un test T, trebuie să avem datele noastre într-un format coloană. Dacă faceți clic pe „Analiza datelor”, vom obține o serie de teste statistice pe care le putem efectua și, din listă, trebuie să alegem un test t și să facem clic pe „Ok”.
  • Apare o casetă de dialog în care trebuie să introducem datele pentru traseul 1 în caseta cu interval variabil 1 și, de asemenea, datele de încercare 2 în caseta cu interval variabil 2. În mod implicit, valoarea alfa rămâne la 0,05, dar aceasta poate fi modificată în funcție de preferința noastră. Când totul este în regulă, faceți clic pe „OK”.
  • Acum putem vedea rezultatul testului nostru T pe foaia Excel. Cea mai importantă valoare de remarcat aici este valoarea P. Pe ceea ce am selectat valoarea noastră alfa, dacă valoarea noastră P în excel este mai mică decât valoarea alfa, putem concluziona că există o diferență statistică semnificativă între media celor două seturi de valori ale noastre.

Concluzie

Testul T are ca scop testarea ipotezelor, care este practic utilizat pentru a testa o ipoteză referitoare la o anumită populație. Ne spune nivelul de semnificație al diferenței dintre grupuri, care sunt în general măsurate pe baza mediei. Aici aflăm practic diferența dintre mijloacele populației și o valoare ipotezată.

Articole interesante...