Creare e usare un istogramma

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

Gli istogrammi consentono di aggregare dati numerici in gruppi di intervalli uguali, detti raccoglitori, e visualizzare la frequenza di valori all'interno di ciascun raccoglitore. Un istogramma viene creato utilizzando un campo numerico o frequenza/rapporto singolo.

Gli istogrammi possono rispondere a domande relative ai dati come Qual è la distribuzione di valori numerici e la loro frequenza in un dataset? Sono presenti outlier?

Esempio

Un'organizzazione sanitaria privata sta studiando i tassi di obesità tra gli adolescenti negli Stati Uniti. Un istogramma della frequenza di obesità tra i giovani nei diversi Stati può servire per determinare la distribuzione della patologia, incluse le frequenze più o meno comuni e l'intervallo complessivo.

Istogramma che mostra la distribuzione dei tassi di obesità negli adolescenti all'interno degli Stati Uniti

L'istogramma precedente mostra una distribuzione normale e indica che i tassi più ricorrenti sono compresi nell'intervallo tra il 10 e il 14%.

Aumentare o diminuire il numero di raccoglitori può influire sull'analisi dei dati. Anche se i dati non cambiano, il loro aspetto può cambiare. È importante scegliere un numero appropriato di raccoglitori per i dati in modo da non interpretare erroneamente gli andamenti. Un numero troppo basso di raccoglitori può nascondere degli schemi importanti, mentre un numero eccessivo può far sì che fluttuazioni piccole ma previste nei dati diventino importanti. La figura seguente mostra un esempio di un numero appropriato di raccoglitori per i dati. Ciascun raccoglitore contiene un intervallo di circa 1 percento e i dati possono essere esaminati con una scala più fine per vedere andamenti non visibili quando si utilizzano sei raccoglitori. In questo caso, lo schema che emerge è una distribuzione normale intorno alla media con una distorsione lieve, ma probabilmente non significativa, verso sinistra.

Istogramma con 12 raccoglitori che mostra nuovi schemi

Creare un istogramma

Per creare un istogramma, procedere come segue:

  1. Selezionare un campo numerico Campo numerico o frequenza/rapporto Campo frequenza/rapporto.
    Suggerimento:

    È possibile cercare campi utilizzando la barra di ricerca nel riquadro dei dati.

  2. Creare un istogramma eseguendo le operazioni seguenti:
    1. Trascinare i campi selezionati su una nuova carta.
    2. Passare con il mouse sull’area di rilascio Grafico.
    3. Trascinare i campi selezionati su Istogramma.
Suggerimento:

È anche possibile creare grafici utilizzando il menu Grafico in alto nel riquadro dati o il pulsante Tipo di visualizzazione Tipo di visualizzazione o una scheda già presente. Per il menu Grafico, saranno abilitati unicamente i grafici compatibili con i propri dati. Per il menu Tipo di visualizzazione, saranno mostrati unicamente le visualizzazioni compatibili (compresi mappe, grafici o tabelle).

Gli istogrammi possono essere creati anche usando Visualizza Istogramma, a cui si accede tramite il tasto Azione Azione sotto Trova risposte > Come è distribuito?

Note sull'utilizzo

Gli istogrammi sono rappresentati da valori singoli. Puoi usare il tasto Opzioni layer Legenda per cambiare il colore del simbolo e il colore del contorno, che verranno applicati a tutti i bin.

Quando viene creato un istogramma, Insights calcola automaticamente un numero appropriato di bin per la visualizzazione dei dati. È possibile modificare il numero di raccoglitori utilizzando il cursore lungo l'asse x o facendo clic sul numero di raccoglitori e inserendo un nuovo numero.

Nota:

Se il numero scelto di bins non divide uniformemente l'intervallo di dati, allora i bins saranno calcolati usando valori decimali. Gli istogrammi visualizzano numeri interi arrotondati come etichette dei loro bin, piuttosto che decimali. I numeri interi arrotondati sono solo per la visualizzazione, e i valori decimali sono usati per tutti i calcoli. Nel caso in cui un contenitore includa valori di dati vicini al limite superiore o inferiore e l'etichetta sia arrotondata, i valori iniziali e finali del contenitore possono apparire errati perché le etichette mostrano valori arrotondati piuttosto che decimali.

Utilizzare il pulsante Statistiche del graficoStatistiche del grafico per visualizzare la media, la mediana e la distribuzione normale dei dati. Una curva della distribuzione normale rappresenta la distribuzione prevista di un campione causale di dati continui, in cui la frequenza di valori più alta è centrata attorno alla media e la frequenza dei valori diminuisce quando i valori aumentano o diminuiscono rispetto alla media. Una curva di distribuzione normale è utile per determinare se i dati dispongono di bias (ad esempio, i dati hanno una frequenza più alta di valori bassi) o outlier.

Utilizzare il pulsante Tipo di visualizzazione Tipo di visualizzazione per passare direttamente dall'istogramma a una mappa con simboli graduati o una tabella di riepilogo.

Utilizzare il pulsante Inverti scheda Inverti scheda per visualizzare il retro della scheda. La scheda Informazioni scheda Informazioni scheda fornisce informazioni riguardo ai dati sulla scheda e la scheda Esporta dati Esportare i dati consente agli utenti di esportare i dati dalla scheda.

Il retro di un istogramma visualizza i seguenti valori calcolati: media, mediana, deviazione standard, asimmetria e kurtosis (semplificata). Asimmetria e kurtosis sono descritti nella tabella di seguito:

StatisticaDescrizione

Asimmetria

L'asimmetria determina se la distribuzione dei dati è simmetrica. La misura di asimmetria determina se la maggior parte dei valori di distribuzione giace a sinistra o a destra della media. L'asimmetria della distribuzione normale è zero, mostrando una quantità identica dei dati su entrambi i lati della media.

I valori di asimmetria possono essere zero, negativi o positivi, come segue:

  • Zero: i dati presentano una distribuzione simmetrica.
  • Negativo: i dati sono asimmetrici con una inclinazione verso destra. La frequenza dei valori più alta si trova a destra della media e la coda sinistra è più lunga della coda destra. La mediana è più larga della media.
  • Positivo: i dati sono asimmetrici con una inclinazione verso sinistra. La frequenza di valori più alta si trova a sinistra del centro e la coda destra è più lunga della coda sinistra. La media è più larga della mediana.

Kurtosis

Kurtosis descrive la forma della distribuzione di frequenza e fornisce una misura della probabilità che tale distribuzione produca outlier. Le distribuzioni con code relativamente pesanti sono denominate leptokurtic e il loro kurtosis è maggiore di zero. Le distribuzioni con code relativamente leggere sono denominate platykurtic e il loro kurtosis è minore di zero. Il kurtosis di una distribuzione normale è uguale a tre o quando si utilizza il 'kurtosis semplificato', il kurtosis di una distribuzione normale è zero (ciò viene trovato utilizzando la stessa formula di kurtosis e meno 3).

I valori di kurtosis semplificati possono essere zero, negativi o positivi, come segue:

  • Zero: il modo è identico alla media.
  • Negativo: la distribuzione dei dati ha code più corte e il picco è più piatto.
  • Positivo: le code della curva sono più lunghe e il picco è più alto.