Creare e usare un box plot

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

I box plot forniscono un riepilogo visivo rapido della variabilità dei valori in un dataset. Mostrano la mediana, i quartili superiore e inferiore, i valori minimo e massimo ed eventuali outlier nel dataset. Gli outlier possono rilevare errori o occorrenze insolite nei dati. Un box plot viene creato utilizzando un numero o un campo frequenza/rapporto sull'asse y.

I box plot possono rispondere a domande sui dati quali: Come sono distribuiti i dati? Esistono outlier nel dataset? Quali sono le variazioni nella distribuzione di diverse serie nel dataset?

Esempi

Un addetto all'analisi del mercato studia le prestazioni di una catena di negozi. È possibile utilizzare un box plot del reddito annuo di ogni negozio per determinare la distribuzione delle vendite, compresi i valori minimo, massimo e mediano.

Un box plot dei ricavi dei negozi

Il box plot sopra mostra che l'importo medio delle vendite è di $1.111.378 (mostrato passando il mouse sopra il grafico o utilizzando il pulsante Gira scheda Inverti scheda per girare la scheda). La distribuzione sembra abbastanza uniforme, con la mediana che si trova al centro di riquadri e baffi di dimensioni simili. Vi sono anche outlier bassi e alti, che offrono all'analista un'indicazione di quali negozi sono sovraperformanti e sottoperformanti.

Ulteriori informazioni sui componenti di un grafico a scatola

Per approfondire i dati, l'analista decide di creare singoli box plot per ogni regione in cui si trovano i negozi. Questa operazione viene eseguita cambiando il campo Raggruppa per in Regione. Il risultato è costituito da quattro box plot singoli che possono essere confrontati con le informazioni di discernimento su ciascuna regione.

Un box plot dei ricavi dei negozi di ogni regione

In base ai grafici, l'analista può affermare che ci sono poche differenze tra le regioni; le mediane sono coerenti nei quattro box plot, i riquadri hanno dimensioni simili e tutte le regioni presentano outlier sia al minimo che al massimo. Tuttavia, i baffi per le regioni settentrionali e centrali sono leggermente più compatti rispetto alla Bay Area e alle regioni meridionali, il che implica che tali regioni abbiano prestazioni più coerenti rispetto alle altre. Nella Bay Area e nelle regioni meridionali, i baffi sono un po’ più lunghi, il che implica che in quelle regioni ci sono negozi con prestazioni scadenti, nonché negozi con ottime prestazioni. L'analista potrebbe voler concentrare la propria analisi su quelle due regioni per stabilire il motivo per cui vi sia una tale variazione nelle prestazioni.

Creare un box plot

Per creare un box plot, procedere come segue:

  1. Selezionare una delle seguenti combinazioni di dati:
    • Un campo numerico Campo numerico o frequenza/rapporto Campo frequenza/rapporto.
    • Un campo numerico Campo numerico o frequenza/rapporto Campo frequenza/rapporto più un campo stringa Campo stringa.
    Nota:

    È possibile cercare campi utilizzando la barra di ricerca nel riquadro dei dati.

  2. Creare un grafico eseguendo le operazioni seguenti:
    1. Trascinare i campi selezionati su una nuova carta.
    2. Passare con il mouse sull’area di rilascio Grafico.
    3. Trascinare i campi selezionati su Box plot.
Suggerimento:

È anche possibile creare grafici utilizzando il menu Grafico in alto nel riquadro dati o il pulsante Tipo di visualizzazione Tipo di visualizzazione o una scheda già presente. Per il menu Grafico, saranno abilitati unicamente i grafici compatibili con i propri dati. Per il menu Tipo di visualizzazione, saranno mostrati unicamente le visualizzazioni compatibili (compresi mappe, grafici o tabelle).

Nota:

I box plot creati da dataset di database devono contenere almeno cinque record. Box plot con meno di cinque record si verifichino più probabilmente durante il raggruppamento del box plot utilizzando un campo stringa o applicando un filtro al dataset o alla scheda. I dataset dei database sono disponibili attraverso le connessioni ai database in Insights in ArcGIS Enterprise e Insights desktop.

Note sull'utilizzo

Questa visualizzazione crea un dataset di risultati Risultati nel riquadro dei dati, che include i campi utilizzati per creare il grafico. Il dataset risultante può essere utilizzato per creare visualizzazioni aggiuntive, rinominare i campi sugli assi del grafico o nei popup o applicare filtri al grafico.

Una caratteristica principale di un box plot è la determinazione di outlier. Gli outlier sono valori molto più grandi o più piccoli del resto dei dati. I baffi su un box plot rappresentano la soglia oltre la quale i valori sono considerati outlier. In assenza di outlier, i baffi si estenderanno fino ai valori minimo e massimo nel dataset. In Insights, l'intervallo per i valori outlier inferiore e superiore sono indicati sul box plot come cerchi collegati da linee tratteggiate.

Se si utilizza un campo Raggruppa per, vengono creati box plot affiancati, con ciascun box plot che rappresenta la diffusione dei dati in ogni categoria.

Ogni statistica o intervallo nel box plot può essere selezionato facendo clic sul grafico.

Utilizzare il pulsante Opzioni layer Opzioni layer per aprire il riquadro Opzioni layer ed eseguire le seguenti operazioni per aggiornare le opzioni di configurazione:

  • Utilizzare la scheda Legenda Legenda per visualizzare i simboli sul grafico. Il pulsante popup della legenda Legenda pop-out mostra la legenda come una scheda separata nella pagina. È possibile usare la legenda per effettuare selezioni sul grafico (disponibile per simboli univoci).

    Per modificare il colore associato a un valore, fare clic sul simbolo e scegliere un colore dalla tavolozza oppure fornire un valore esadecimale. La modifica del simbolo nella scheda Legenda è disponibile solo per i simboli univoci.
  • La scheda Aspetto Aspetto cambia il colore del simbolo sul grafico (solo simbolo singolo).

Utilizzare il pulsante Filtro scheda Filtro scheda per rimuovere i dati indesiderati dalla scheda. I filtri possono essere applicati a tutti i campi stringa, numerici, di frequenza/rapporto e data/ora. I filtri scheda non influenzano altre schede che impiegano lo stesso dataset.

Utilizzare il pulsante Strumenti di selezione Strumenti di selezione per selezionare feature sul grafico utilizzando lo strumento di selezione singola o per invertire la selezione.

Utilizzare il pulsante Tipo di visualizzazione Tipo di visualizzazione per alternare tra grafico a scatola e altre visualizzazioni, ad esempio una mappa di simboli graduati, una tabella di riepilogo o un istogramma. Se il grafico a scatola include un campo Raggruppa per, è possibile modificare la visualizzazione in grafici, ad esempio un grafico lineare o un grafico a colonne.

Utilizzare il pulsante Massimizza Ingrandisci per ingrandire la scheda. Le altre schede della pagina saranno ridotte a miniature. È possibile far tornare la scheda alla sua dimensione iniziale con il pulsante Ripristina in bassoRipristina in basso.

Utilizzare il pulsante Abilita filtri incrociati Abilita filtri incrociati per consentire di creare filtri sulla scheda usando selezioni effettuate su altre schede. I filtri incrociati possono essere rimossi utilizzando il pulsante Disabilita filtri incrociatiDisabilita filtri incrociati.

Utilizzare il pulsante Gira scheda Inverti scheda per visualizzare il retro della scheda. La scheda Informazioni scheda Informazioni scheda fornisce informazioni riguardo ai dati sulla scheda e la scheda Esporta dati Esportare i dati consente agli utenti di esportare i dati dalla scheda.

Utilizzare il pulsante Opzioni scheda Opzioni scheda per accedere alle seguenti opzioni:

  • Pulsante Aspetto Aspetto: cambiare il colore di sfondo, di primo piano e il bordo della scheda.
  • Pulsante Modifica etichette Modifica etichette: creare etichette personalizzate per gli assi del grafico. Per modificare le etichette, fare clic sul pulsante Modifica etichette, poi fare clic sull'asse per renderla modificabile.
  • Pulsante Ordina Ordina: spostare la scheda in avanti o indietro in relazione alle altre schede sulla pagina.
  • Pulsante Elimina Elimina: consente di rimuove la scheda dalla pagina. Se non si intendeva eliminare la scheda, è possibile recuperarla con il pulsante Annulla Annulla.

Funzionamento dei box plot

Un box plot è costituito dai seguenti componenti:

Un diagramma etichettato di un box plot

EtichettaComponenteDescrizione
1

Baffo

Intervallo di dati inferiore al primo quartile e superiore al terzo quartile. Ogni baffo ha il 25% dei dati. In genere, i baffi non possono essere superiori a 1,5 volte l’IQR, che stabilisce la soglia per i valori anomali.

2

Casella

L'intervallo di dati fra il primo e il terzo quartile. Il 50% dei dati rientra in questo intervallo. L'intervallo tra il primo e il terzo quartile è anche noto come IQR (Inter Quartile Range).

3

Massimo

Il valore maggiore nel dataset o il valore maggiore che non è al di fuori della soglia impostata dai baffi.

4

Terzo quartile

Il valore in cui il 75% dei dati è inferiore al valore e il 25% dei dati è superiore al valore.

5

Mediana

Il numero medio nel dataset. La metà dei numeri è superiore alla mediana e metà è inferiore alla mediana. La mediana può essere denominata anche secondo quartile.

6

Primo quartile

Il valore in cui il 25% dei dati è inferiore al valore e il 75% dei dati è superiore al valore.

7

Minimo

Il valore minore nel dataset o il valore minore che non è al di fuori della soglia impostata dai baffi.

8

Outlier

Valori di dati superiori o inferiori ai limiti impostati dai baffi.

Risorse

Usare le seguenti risorse per ulteriori informazioni sui grafici: