Distribuție normală în statistici - definiție, exemplu, interpretare

Ce este distribuția normală în statistici?

Distribuția normală este o curbă de distribuție a frecvenței în formă de clopot care ajută la descrierea tuturor valorilor posibile pe care o variabilă aleatorie le poate lua într-un interval dat, cea mai mare parte a ariei de distribuție fiind în mijloc și puține sunt în cozi, la extreme. Această distribuție are doi parametri cheie: media (µ) și abaterea standard (σ) care joacă un rol cheie în calculul rentabilității activelor și în strategia de gestionare a riscurilor.

Cum se interpretează distribuția normală

Figura de mai sus arată că distribuția statistică normală este o curbă în formă de clopot. Gama posibilelor rezultate ale acestei distribuții este numărul real întreg între -∞ și + ∞. Cozile curbei clopotului se extind pe ambele părți ale graficului (+/-) fără limite.

  • Aproximativ 68% din toate observațiile se încadrează în +/- o abatere standard (σ)
  • Aproximativ 95% din toate observațiile se încadrează în +/- două abateri standard (σ)
  • Aproximativ 99% din toate observațiile se încadrează în +/- trei abateri standard (σ)

Are o asimetrie zero (simetria unei distribuții). Dacă distribuția datelor este asimetrică, atunci distribuția este inegală dacă setul de date are o asimetrie mai mare decât zero sau o asimetrie pozitivă. Apoi, coada dreaptă a distribuției este mai prelungită decât stânga, iar pentru o asimetrie negativă (mai mică de zero) coada stângă va fi mai lungă decât coada dreaptă.

Are o kurtoză de 3 (măsoară vârful unei distribuții), ceea ce indică că distribuția nu este nici prea mare, nici prea subțire. Dacă curtoza este mai mare de trei decât distribuția este mai mare cu cozile mai grase și dacă curtoza este mai mică de trei, atunci are cozi subțiri, iar punctul de vârf este mai mic decât distribuția normală.

Caracteristici

  • Ele reprezintă o familie de distribuție în care media și deviația determină forma distribuției.
  • Media, mediana și modul acestei distribuții sunt toate egale.
  • Jumătate din valori sunt la stânga centrului și cealaltă jumătate la dreapta.
  • Valoarea totală sub curba standard va fi întotdeauna una.
  • Cel mai probabil, distribuția este în centru și mai puține valori se află în capătul cozii.

Transformare (Z)

Funcția densității probabilității (PDF) a unei variabile aleatorii (X) după următoarea distribuție este dată de:

unde -∞ <x <∞; -∞ <µ 0

Unde,

  • F (x) = Funcție de probabilitate normală
  • x = Variabilă aleatorie
  • µ = Media distribuției
  • σ = Abaterea standard a distribuției
  • π = 3,14159
  • e = 2,71828

Formula de transformare

Unde,

  • X = Variabilă aleatorie

Exemple de distribuție normală în statistici

Să discutăm următoarele exemple.

Exemplul nr. 1

Să presupunem că o companie are 10000 de angajați și structură de salarii multiple, în funcție de rolul în care lucrează angajatul. Salariile sunt, în general, distribuite cu media populației µ = 60.000 $, iar abaterea standard a populației σ = 15.000 $. Care va fi probabilitatea ca angajatul selectat aleator să aibă un salariu mai mic de 45000 USD anual.

Soluţie

După cum se arată în figura de mai sus, pentru a răspunde la această întrebare, trebuie să aflăm zona de sub curba normală de la 45 la coada laterală stângă. De asemenea, trebuie să folosim valoarea tabelului Z pentru a obține răspunsul corect.

În primul rând, trebuie să convertim media și deviația standard date într-o distribuție normală standard cu medie (µ) = 0 și deviație standard (σ) = 1 folosind formula de transformare.

După conversie, trebuie să căutăm tabelul Z pentru a afla valoarea corespunzătoare, care ne va oferi răspunsul corect.

Dat,

  • Media (µ) = 60.000 USD
  • Abaterea standard (σ) = 15000 USD
  • Variabilă aleatorie (x) = 45000 USD

Transformare (z) = (45000 - 60000/15000)

Transformarea (z) = -1

Acum, valoarea care este echivalentă cu -1 în tabelul Z este 0,1587, care reprezintă aria de sub curbă de la 45 la drumul spre stânga. A indicat faptul că atunci când selectăm aleatoriu un angajat, probabilitatea de a câștiga mai puțin de 45000 USD pe an este de 15,87%.

Exemplul nr. 2

Acum, păstrând același scenariu ca mai sus, aflați probabilitatea ca angajatul selectat aleator să câștige mai mult de 80.000 USD pe an folosind distribuția normală.

Soluţie

Deci, în această întrebare, trebuie să aflăm zona umbrită de la 80 la coada dreaptă folosind aceeași formulă.

Dat,

  • Media (µ) = 60.000 USD
  • Abaterea standard (σ) = 15000 USD
  • Variabilă aleatorie (X) = 80.000 USD

Transformare (z) = (80000 - 60000/15000)

Transformarea (z) = 1,33

Conform tabelului Z, valoarea echivalentă a 1.33 este 0.9082 sau 90.82%, ceea ce arată că probabilitatea de a selecta aleatoriu angajații care câștigă mai puțin de 80.000 USD anual este de 90.82%.

Dar, conform întrebării, trebuie să determinăm probabilitatea ca angajații aleatori să câștige mai mult de 80.000 USD pe an, deci trebuie să scăzem valoarea din 100.

  • Variabilă aleatorie (X) = 100% - 90,82%
  • Variabila aleatorie (X) = 9,18%

Deci, probabilitatea ca angajații să câștige mai mult de 80.000 de dolari pe an este de 9,18%.

Utilizări

  • Graficul tehnic al pieței bursiere este adesea o curbă de clopot, permițând analiștilor și investitorilor să facă inferențe statistice despre rentabilitatea așteptată și riscul stocurilor.
  • Este utilizat în lumea reală, ca pentru a determina cel mai probabil cel mai bun timp pe care îl au companiile de pizza pentru a livra pizza și multe alte aplicații reale.
  • Se folosește la compararea înălțimilor unei populații date, în care majoritatea oamenilor vor avea o dimensiune medie, cu foarte puțini oameni cu înălțimea peste medie sau sub medie.
  • Acestea sunt utilizate pentru a determina performanța academică medie a studenților, ceea ce ajută la compararea rangului studenților.

Concluzie

Distribuția normală găsește aplicații în știința datelor și analiza datelor. Tehnologiile avansate precum inteligența artificială și învățarea automată utilizate împreună cu această distribuție pot oferi o calitate mai bună a datelor, ceea ce va ajuta persoanele și companiile să ia decizii eficiente.

Articole interesante...