Formula Outlier - Calcul pas cu pas al valorii anterioare (cu exemplu)

Formula Outlier oferă un instrument grafic pentru a calcula datele care se află în afara setului dat de distribuție, care poate fi partea interioară sau exterioară, în funcție de variabile.

Ce este Formula Outlier?

O valoare anterioară este punctul de date al eșantionului dat sau al observației date sau într-o distribuție care trebuie să se afle în afara modelului general. O regulă utilizată în mod obișnuit care spune că un punct de date va fi considerat ca fiind un valor outlier dacă are mai mult de 1,5 IQR sub prima quartilă sau peste a treia quartilă.

Spus diferit, valorile aberante scăzute vor fi sub Q1-1,5 IQR, iar valorile aberante vor fi situate sub Q3 + 1,5IQR

Trebuie să calculați mediana, quartile, inclusiv IQR, Q1 și Q3.

Formula outlier este reprezentată după cum urmează,

Formula pentru Q1 = ¼ (n + 1) th termen  Formula pentru Q3 = ¾ (n + 1) th Termenul  Formula pentru Q2 = Q3 - Q1

Calculul pas cu pas al valorii anterioare

Pașii de mai jos trebuie urmați pentru a calcula Valoarea Outlier.

  • Pasul 1: Calculați mai întâi quartile, adică Q1, Q2 și interquartile
  • Pasul 2: Calculați acum valoarea Q2 * 1,5
  • Pasul 3: scade acum valoarea Q1 din valoarea calculată la pasul 2
  • Pasul 4: Aici adăugați Q3 cu valoarea calculată la pasul 2
  • Pasul 5: Creați intervalul valorilor calculate la Pasul 3 și Pasul 4
  • Pasul 6: aranjați datele în ordine crescătoare
  • Pasul 7: Verificați dacă există valori care se situează sub sau mai mult decât intervalul creat în Pasul 5.

Exemplu

Luați în considerare un set de date din următoarele numere: 10, 2, 4, 7, 8, 5, 11, 3, 12. Vi se cere să calculați toate valorile aberante.

Soluţie:

În primul rând, trebuie să aranjăm datele în ordine crescătoare pentru a găsi mediana, care va fi Q2 pentru noi.

2, 3, 4, 5, 7, 8, 10, 11, 12

Acum, deoarece numărul de observații este impar, care este 9, mediana ar sta pe poziția a 5- a , care este 7, și același lucru va fi Q2 pentru acest exemplu.

Prin urmare, calculul Q1 este după cum urmează -

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 va fi -

Q1 = 2,5 termen

Aceasta înseamnă că Q1 este media poziției a 2 -a și a 3 - a a observațiilor, care este 3 și 4 aici, iar o medie a acestora este (3 + 4) / 2 = 3,5

Prin urmare, calculul Q3 este după cum urmează -

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 va fi -

Q3 = 7,5 termen

Aceasta înseamnă că Q3 este media poziției a 7- a și a 8- a a observațiilor, care este 10 și 11 aici, iar o medie a aceleiași este (10 + 11) / 2 = 10,5

Acum, valorile aberante scăzute se situează sub Q1-1.5IQR, iar valorile aberante ridicate se situează sub Q3 + 1.5IQR

Deci, valorile sunt 3,5 - (1,5 * 7) = -7 și intervalul mai mare este 10,5 + (1,5 * 7) = 110,25.

Deoarece nu există observații care să fie mai mari sau mai mici de 110,25 și -7, nu avem nicio valoare anormală în acest eșantion.

Exemplu de formulă Outlier în Excel (cu șablon Excel)

Cursurile de coaching creativ iau în considerare recompensarea studenților care se află în primii 25%. Cu toate acestea, vor să evite orice valori atipice. Datele sunt pentru cei 25 de studenți. Folosiți ecuația Outlier pentru a determina dacă există un outlier?

Soluţie:

Mai jos sunt date pentru a calcula valorile anexe.

Numărul de observații aici este 25, iar primul nostru pas ar fi conversia datelor brute de mai sus în ordine crescătoare.

Mediana va fi -

Valoarea mediană = ½ (n + 1)

= ½ = ½ (26)

= Al 13- lea termen

Q2 sau mediana este de 68,00

Care este 50% din populație.

Q1 va fi -

Q1 = ¼ (n + 1) al treilea termen

= ¼ (25 + 1)

= ¼ (26)

= 6,5 lea termen, ceea ce este echivalent cu 7 - lea termen

Q1 este 56,00, ceea ce este de 25%

Q3 va fi -

În cele din urmă, Q3 = ¾ (n + 1) al treilea termen

= ¾ (26)

= 19,50 termen

Aici trebuie luată media, care este a 19- a și a 20- a perioadă, care sunt 77 și 77, iar media acestora este (77 + 77) / 2 = 77,00

Q3 este 77, care este primul 25%

Gamă redusă

Acum, valorile aberante scăzute se situează sub Q1-1.5IQR, iar valorile aberante ridicate se situează sub Q3 + 1.5IQR

Gama mare -

Deci, valorile sunt 56 - (1,5 * 68) = -46 și intervalul mai mare este 77 + (1,5 * 68) = 179.

Nu există valori aberante.

Relevanță și utilizări

Formula outliers este foarte importantă de știut, deoarece ar putea exista date care ar fi distorsionate de o astfel de valoare. Luați un exemplu de observații 2, 4, 6, 101, iar acum, dacă cineva ia o medie a acestor valori, va fi 28,25, dar 75% din observații se află sub 7 și, prin urmare, ar fi o decizie incorectă cu privire la observațiile acest eșantion.

Se poate observa aici că 101 pare să contureze în mod clar și, dacă acest lucru este eliminat, atunci media ar fi 4, ceea ce spune despre valorile sau observațiile că acestea se încadrează în intervalul 4. Prin urmare, este foarte important să efectuați acest lucru calcul pentru a evita orice utilizare abuzivă care să conducă la informații. Acestea sunt utilizate pe scară largă de către statisticienii din întreaga lume ori de câte ori efectuează orice cercetare.

Articole interesante...