Regula empirică - Definiție, Formula, Cum se utilizează în statistici?

Care este regula empirică din statistici?

Regula empirică din statistici afirmă că aproape toate (95%) observațiile dintr-o distribuție normală se încadrează în 3 abateri standard de la medie. Aceasta este o regulă foarte importantă și ajută la prognoză.

Formulă

Formula arată procentul prezis de observații care se vor afla în cadrul fiecărei abateri standard de la medie.

Regula spune că:

  • 68% din observații se vor încadra în +/- 1 Deviație standard de la medie
  • 95% din observații se vor încadra în +/- 2 abateri standard de la medie
  • 7% din observații se vor încadra în +/- 3 abateri standard de la medie

Cum se folosește?

Aceasta este utilizată în tendința de prognoză a unui set de date. Când setul de date este extins și devine dificil să studiezi întreaga populație, atunci Regula empirică poate fi aplicată eșantionului pentru a obține o estimare a modului în care vor reacționa datele din populație dacă ți se cere să găsești salariul mediu al tuturor contabilii din SUA. Atunci aceasta este o sarcină dificilă de îndeplinit, deoarece populația este enormă. Deci, în acest caz, puteți selecta, să zicem, 90 de observații aleatoriu din întreaga populație.

Deci, acum veți avea 90 de salarii. Trebuie să găsiți abaterea medie și standard a observațiilor. Dacă observația urmează o distribuție normală, atunci aceasta poate fi aplicată și se poate face o estimare a salariului tuturor contabililor din SUA.

Spuneți că salariul mediu al eșantionului se ridică la 90.000 de dolari. Și abaterea standard este de 5.000 USD. Deci, din întreaga populație, 68% dintre contabili obțin un salariu cuprins între +/- 1 Abateri standard de la medie. Deoarece media este de 90.000 de dolari și deviația standard este de 5.000 de dolari. Deci, 68% din toți contabilii din SUA sunt plătiți în intervalul de 90.000 $ +/- (1 * 5.000 $). Adică între 85.000 și 95.000 de dolari

Dacă răspândim ceva mai mult, atunci 95% din toți contabilii din SUA sunt plătiți în intervalul de media +/- 2 abateri standard. 90.000 $ +/- (2 * 5000). Deci, intervalul este de la 80.000 la 100.000 de dolari.

Într-o gamă mai largă, 99,7% din toți contabilii obțin salarii variind de la Media +/- 3 Abateri standard. Adică 90.000 +/- (3 * 5000). Gama este cuprinsă între 75.000 și 105.000 de dolari

Puteți vedea clar că, fără a studia întreaga populație, s-ar putea face estimări cu privire la populație. Dacă cineva intenționează să lucreze ca contabil în SUA, atunci se poate aștepta cu ușurință că salariul său va varia de la 75.000 dolari la 105.000 dolari.

Acest tip de estimare ajută la ușurarea muncii și la realizarea de previziuni cu privire la viitor.

Exemple de reguli empirice

Domnul X încearcă să găsească numărul mediu de ani în care o persoană supraviețuiește după pensionare, considerând că vârsta de pensionare este de 60 de ani. Dacă anii medii de supraviețuire a 50 de observații aleatorii sunt de 20 de ani și SD este de 3, atunci aflați probabilitatea ca o persoana va atrage o pensie pentru mai mult de 23 de ani

Soluţie

Regula empirică afirmă că 68% din observații se vor încadra într-o abatere standard de la medie. Aici media observațiilor este de 20.

68% din observații vor fi cuprinse în 20 +/- 1 (deviație standard), care este 20 +/- 3. Deci intervalul este de la 17 la 23.

Există șanse de 68% ca anii minimi să supraviețuiască după pensionare să se situeze între 17 și 23. Acum procentul care se află în afara acestui interval este (100 - 68) = 32%. 32 este distribuit în mod egal de ambele părți, ceea ce înseamnă o șansă de 16% ca anii minimi să fie sub 17 și o șansă de 16% ca anii minimi să fie mai mari de 23.

Deci, probabilitatea ca persoana respectivă să atragă mai mult de 23 de ani de pensie este de 16%.

Regula empirică vs. Teorema lui Chebyshev

Regula empirică se aplică seturilor de date care urmează o distribuție normală care înseamnă în formă de clopot. Într-o distribuție normală, ambele părți ale distribuției au fiecare 50% probabilitate.

Dacă setul de date nu este distribuit în mod normal, atunci există o altă aproximare sau regulă care se aplică tuturor tipurilor de seturi de date, care este teorema lui Chebyshev. Spune trei lucruri:

  • Cel puțin 3/4 mii de toate observațiile vor să se situeze în 2Standard Abateri de la medie. Este o aproximare puternică. Aceasta înseamnă că, dacă există 100 de observații, apoi 3/4 mii de observațiile care sunt de 75 de observații se vor afla în intervalul de +/- 2 deviații standard de la medie.
  • Cel puțin 8/9 - lea toate observațiile se va afla în termen de 3Standard Abateri de la medie.
  • Cel puțin 1 - 1 / k 2 din toate observațiile se încadrează în K Deviații standard de la medie. Aici K este denumit orice număr întreg.

Când se folosește?

Datele sunt ca aurul în lumea modernă. Există date imense care curg din diferite surse și sunt utilizate pentru aproximări sau prognoze diferite. Dacă un set de date urmează o distribuție normală, acesta arată o curbă în formă de clopot; atunci se poate folosi Regula empirică. Se aplică observațiilor pentru a crea o aproximare pentru populație.

Odată ce se observă că observațiile arată o structură de distribuție normală, atunci se urmărește Regula empirică pentru a găsi mai multe probabilități ale observațiilor. Regula este extrem de utilă pentru multe prognoze statistice.

Concluzie

Regula empirică este un concept statistic care ajută la descrierea probabilității observațiilor și este foarte util atunci când se găsește o aproximare a unei populații uriașe. Trebuie întotdeauna remarcat faptul că acestea sunt aproximări. Există întotdeauna șanse de valori aberante care nu intră în distribuție. Deci, constatările nu sunt exacte și ar trebui luate măsuri de precauție atunci când se acționează conform previziunilor.

Articole interesante...