Excel Box Plot
Un grafic cutie în Excel este o reprezentare picturală sau o diagramă care este utilizată pentru a reprezenta distribuția numerelor într-un set de date. Acesta indică modul în care sunt răspândite valorile din setul de date. Într-o casetă, datele numerice sunt afișate folosind cinci numere ca rezumat: Minim, Maxim, Primul Quartile, Al doilea Quartile (Median), Al treilea Quartile.
Între primul și al treilea quartile, este desenată o cutie împreună cu o linie suplimentară care este trasată de-a lungul celui de-al doilea quartile pentru a marca mediana. Liniile extinse sunt trasate în afara primului și al treilea quartile pentru a descrie minimul și maximul. Aceste linii extinse sunt numite mustăți în boxplot.
Caseta graficului boxului arată mai întâi până la al treilea quartile cu o linie la al doilea quartile, adică mediană. Capetele mustăților ilustrează minimul și maximul.
Cele cinci numere reprezentate de boxplot:
- Minim: cea mai mică / cea mai mică valoare a setului de date.
- Prima quartilă: valoarea medie a minimului și medianei.
- Al doilea sfert / mediană: valoarea medie a setului de date.
- Al treilea sfert: Valoarea medie a medianei și maximului.
- Maxim: Cea mai mare valoare a setului de date.

Cum să faci o diagramă de cutie în Excel? (cu un exemplu)
Să presupunem că avem un set de date al unei clase care conține notele totale ale studenților săi la toate subiectele (din 500, punctaje maxime: 100 pentru fiecare subiect) și dorim să creăm o diagramă în Excel pentru aceeași.
Avem următoarele date despre notele elevilor într-o foaie Excel:

Acum, pașii următori pot fi folosiți pentru a crea un grafic de casetă pentru datele de mai sus (practic în Excel 2013):
Este foarte simplu să creați un grafic de cutie cu Excel 2016, deoarece are în mod implicit o diagramă „Cutie și mustață” sub diagramele statistice din secțiunea diagrame. Cu toate acestea, Excel 2013 nu are în mod implicit un șablon de diagramă pentru graficul de casetă; astfel, trebuie să-l creăm urmând pașii de mai jos:
Calculați cele cinci statistici din setul de date care sunt necesare pentru graficul casetei: Minim, Three Quartiles și Maximum, utilizând următoarele funcții:

Acum calculați statisticile minime din setul de date.

Acum calculați statisticile quantile1 din setul de date.

Calculul a cinci statistici pentru graficul cutiei va fi -

Vom crea acum un tabel final (să spunem tabelul diferențelor) pe care îl vom folosi pentru a crea graficul cutiei în excel. În acest tabel final, vom copia valoarea minimă și aceasta va fi prima intrare a tabelului nostru final. Restul intrărilor din acest tabel final ar fi diferențele dintre fiecare statistică după cum urmează:

Acum vom crea o diagramă de coloane stivuite cu acest tabel final și o vom transforma într-un grafic de cutie.
Deci, haideți să creăm mai întâi o diagramă de coloane stivuite în Excel:
Selectați Diferențe și valoare, apoi faceți clic pe „Inserați” -> Toate diagramele -> Diagramele cu coloane stivuite:

În acest sens, obținem o diagramă stivuită după cum urmează:

Putem vedea că acest lucru nu este similar cu un grafic de casetă, deoarece, cu această diagramă stivuită, Excel atrage în mod implicit coloane stivuite din orizontală și nu dintr-un set de date vertical. Deci va trebui să inversăm axele graficului.
Pentru a face acest lucru, faceți clic dreapta pe diagramă și faceți clic pe „Selectare date”.

Acum faceți clic pe Comutare rând / coloană '.

Obținem o diagramă stivuită după cum urmează:

Acum vom converti acest tip de diagramă stivuită în grafic de casetă după cum urmează:
Selectați partea de jos a coloanei (zona albastră) și faceți clic pe „Formatează seria de date”.

În panoul „Formatează seria de date”, extindeți opțiunea „Umpleți” și selectați butonul „Fără umplere”, iar din meniul derulant „margine”, extindeți-l și selectați butonul „Fără linie”:

Obținem următoarea diagramă a graficului de casetă după cum urmează:

Următorul pas este de a crea mustăți prin înlocuirea segmentelor superioare și secundare din partea inferioară, adică a regiunilor roșii și portocalii (așa cum am șters partea inferioară) cu linii / mustăți.
Pentru a desena mustața de sus, selectăm regiunea / segmentul de sus (roșu) și extindem fila „Umplere”.

Și selectați butonul „Fără umplere”.

Acum faceți clic pe „Proiectare” -> „Adăugați elemente ale diagramei” -> „Bare de erori” -> „Deviație standard”:

Acum facem clic pe butonul Plus din partea dreaptă sus a diagramei și selectăm și extindem „Barele de erori în excel”, apoi selectăm „Mai multe opțiuni”.

Aceasta va deschide panoul „Format Error Bars” și va seta următoarele:
Setați: direcția la „Plus”
Încheiați stilul „Cap”
Procentaj până la „100%”.

Deci, acum vom avea un mustaș de top desenat ca mai jos:

În mod similar, pentru a desena mustața inferioară, selectăm al doilea din regiunea inferioară (portocaliu, care este acum vizibil ca ultimul) și repetăm aceiași pași ca mai sus. Singura modificare ar fi că „direcția” din barele de erori ”va fi setată la„ minus ”.

Deci, acum vom avea un mustaș inferior desenat după cum urmează:

Deci, putem vedea în captura de ecran de mai sus că graficul de coloane stivuite seamănă acum cu un grafic de cutie. Parcele de cutii sunt, în general, de aceeași culoare peste tot, deci putem folosi o culoare de umplere pentru aceasta cu o ușoară margine.

Acum, să vedem cum este interpretat sau vizualizat un grafic de cutie:
Putem vedea în captura de ecran de mai sus că:
- Punctele finale ale mustății mai mici la 300, care descrie valoarea minimă.
- Punctele finale ale mustății superioare sunt undeva sub 500, care este exact 492, care reprezintă maximul.
- Linia superioară a casetei verzi prezintă quartile3, pe care o vedem la 480,5.
- Linia mediană a casetei verzi prezintă mediană / quartile2, pe care o vedem la 450.
- Ultima linie a casetei verzi prezintă quartile1, pe care o vedem la 392.
Deci, graficul casetei pentru setul de date dat este corect desenat cu cele cinci statistici (minim, trei quartile și maxim) calculate ca mai sus.
Lucruri de amintit
- Un grafic cutie este o reprezentare picturală a unui set de date numerice care utilizează un rezumat cu cinci numere pentru a descrie distribuția setului de date.
- Complotul Box este, de asemenea, cunoscut sub numele de complotul cutiei și mustăților.
- Este utilizat în general pentru analiza explicativă a datelor.
- Ele sunt utilizate în general atunci când trebuie să comparăm unele eșantioane și să testăm dacă datele sunt distribuite simetric.
- Graficele de cutie ocupă mai puțin spațiu în comparație cu graficele de densitate sau histograme.
- Este folosit pentru a arăta forma unei distribuții, valoarea centrală și variabilitatea acesteia.
- Nu este necesar ca mediana să fie în mijlocul cutiei.
- Mustățile pot avea diferite lungimi.
- Graficul cutiei poate fi folosit pentru a detecta valori aberante.