Media vs Median - Diferențele între utilizarea metodelor în statistici

Diferența dintre medie și medie

Media și media sunt doi termeni folosiți în mod obișnuit în matematică, media este ca media unui număr dat și rezumă numerele și le împarte cu numărul de numere, ceea ce ne dă media, în timp ce mediana, pe de altă parte, returnează numărul mediu set de date și dacă setul de date este chiar atunci mediană adaugă cele două numere de mijloc și îl împarte la 2 oferindu-ne mediana.

Ele sunt măsura tendinței centrale și sunt adesea utilizate în măsurarea unor seturi mari de date în care analiza trebuie trasată și rezultatele sunt interpretate. Media, mediana și modul sunt trei măsurători ale mediilor care indică faptul că datele sunt dispersate din medie sau medie. Aceste metode sunt utilizate pe scară largă în statistici, în timp ce valoarea medie a datelor este cea mai utilizată metodă dintre cele trei.

Ce inseamna?

Media este o sumă simplă a numărului de observații dintr-o matrice, care este împărțită la numărul de observații. De exemplu, dacă vorbim despre înălțimea medie sau înălțimea medie a unui grup format din 5 persoane. Înălțimea medie ar fi calculată prin însumarea înălțimii a 5 persoane împărțită la numărul de persoane, adică 5.

Formulă

Formula medie = (Suma tuturor observațiilor / numărul de observații)

Ce este mediana?

Mediană, pe de altă parte, este numărul de mijloc din setul matricei de date, care separă setul superior de date de cel inferior. Datele trebuie aranjate mai întâi în ordine crescătoare pentru a calcula mediana datelor. Când setul de date are cardinalitate, trebuie luată media celor două numere din mijloc în setul de date. Cu toate acestea, aceste două metode sunt adesea folosite interschimbabil.

Formulă

Formula medie = (n + 1) / 2

când n este un număr impar

Mediană = ((n / 2) + ((n / 2) +1)) / 2

când n este un număr par

Infografie medie vs medie

Să vedem diferențele de top dintre medie vs mediană.

Diferențe cheie medii vs medii

  • Mean este simplu de utilizat și de aplicat și poate fi aplicat oricărui set de matrice de date, indiferent dacă este par sau impar. Mediana, pe de altă parte, este ușor de utilizat, iar setul de date trebuie să fie aranjat în ordine crescătoare sau descendentă mai întâi înainte de calcul.
  • Media este utilizată în mod normal pentru distribuții normale, în timp ce mediana este utilizată pentru setul de date de distribuții înclinate.
  • Media este simplă, dar nu este robustă deoarece poate conține valori anormale în distribuții și uneori nu poate oferi utilizatorului rezultatele corecte pentru interpretare. Pe de altă parte, metoda mediană este robustă și este mai potrivită pentru a fi utilizată, deoarece a fost utilizată pentru distribuții înclinate pentru a obține tendința centrală a datei stabilite și va oferi utilizatorului multe rezultate exacte în comparație cu media
  • Există o singură formulă de medie care este suma tuturor observațiilor împărțite la numărul de observații. În timp ce, mediana are două formule, una dintre ciudatele în care doar numerele din mijloc din setul de date devin mediană. Dar când avem un set de date uniform, mijlocul celor două valori sunt selectate și sunt împărțite la 2, ceea ce ne oferă apoi mediana setului de date uniforme.

Tabel comparativ mediu vs mediu

Rău Median
Media se calculează prin adunarea tuturor valorilor din matricea de date, care este apoi împărțită la numărul de observații. Mediana este valoarea medie exactă a setului de date. Poate fi calculat prin aranjarea setului de date în ordine crescătoare și apoi găsirea sau alegerea valorii medii din setul de date.
Este mai utilizat pe scară largă în industrie datorită unui calcul ușor al mediei și ne oferă un număr rapid. Nu este folosit des în industrie, dar este mai complet și mai precis decât mediu, ceea ce reprezintă doar o simplă sumă de numere.
Este utilizat în general pentru setul de date în mod normal înclinat, adică distribuția normală. Este deosebit de util să descriem setul de date cu o asimetrie semnificativă în date sau când datele au o coadă lungă. Este utilizat pe scară largă în cazul în care conturatorii au o pondere semnificativă în date, ceea ce înseamnă că nu este o metodă bună de calcul.
Nu este un instrument robust pentru a calcula tendința centrală. Este un instrument mult mai robust, deoarece determină greutatea datelor, care este, în general, greutate mare la cozile mai lungi.
Este foarte sensibil la valori aberante. Este mult mai puțin afectat de valorile aberante.
Este simplu de utilizat Este de natură complexă.
Nu poate fi calculat pentru date categorice, deoarece valorile nu pot fi însumate. Nu poate fi identificat pentru date nominale clasificate, deoarece nu poate fi ordonat logic.

Concluzie

În afară de medie și mediană, mai există o metodă care este adesea utilizată pentru măsurarea tendinței centrale care este modul. Un mod este o valoare care apare cel mai frecvent în setul de date; modul are un avantaj față de medie și mediană că poate fi găsit atât pentru seturile de date numerice, cât și pentru cele clasificate.

În ciuda existenței modului și medianei superioritatea rezultatelor și analizei mai bune față de medie, media este în continuare cea mai potrivită măsură a tendinței centrale, mai ales dacă setul de date este o distribuție normală, iar datele sunt în mod normal înclinate.

Ca un bun analist, tendința centrală ar trebui să fie măsurată cu toate cele trei metode de date, iar varianța în analiză ar trebui meditată și analizată cu atenție pentru a produce rezultate mai bune și mai precise în setul de date.

Articole interesante...