La classificazione dei dati è un processo in cui valori numerici graduati vengono raggruppati in intervalli e ogni intervallo di classificazione è rappresentato da una sfumatura o un colore in una mappa. La classificazione è disponibile per clock di dati e grafici a cuore.
Il metodo di classificazione utilizzato dipende dai dati adoperati e dalle informazioni che si desidera trasmettere nel grafico.
Interruzioni naturali
La classificazione di interruzioni naturali crea classi in base a raggruppamenti naturali intrinseci dei dati. Questa è la classificazione predefinita.
Utilizzare la classificazione di interruzioni naturali quando si desidera enfatizzare i raggruppamenti naturali inerenti ai dati. Ad esempio, usare le interruzioni naturali per confrontare il numero di crimini nei quartieri di una città nei mesi e negli anni tramite un clock di dati. I tassi di criminalità vengono raggruppati in modo che i mesi e gli anni con tassi di criminalità simili vengano simboleggiati con lo stesso colore.
Non utilizzare le interruzioni naturali per confrontare grafici creati con dati diversi.
Stesso intervallo
La classificazione con intervallo uguale suddivide l'intervallo di valori di attributo in intervalli secondari di dimensioni uguali.
La classificazione a intervalli uguali enfatizza la quantità di un attributo rispetto ad altri valori. Utilizzare l'intervallo uguale per i dati con intervalli familiari. Ad esempio, utilizzare intervalli uguali per confrontare la percentuale di differenti specie di alberi con coleotteri invasivi nei parchi di una contea tramite un grafico termico. Le percentuali vanno da 0 a 100. Se si utilizzano quattro bin, le classi saranno basate su intervalli del 25%.
Quantile
La classificazione quantile suddivide gli attributi in bin con lo stesso numero di feature.
La classificazione quantile può distorcere l'aspetto di un grafico posizionando valori simili in classi diverse. Usare la classificazione quantile per dati relativamente uniformi. È inoltre possibile utilizzare la classificazione quantile per la visualizzazione in classifica. Ad esempio, utilizzare intervalli quantili per confrontare i tassi di disoccupazione tra gli stati degli Stati Uniti tramite un grafico termico. Se si applicano cinque bin per i 50 stati e il Distretto di Columbia, vi saranno circa 10 stati per bin. I risultati possono essere utilizzati per vedere i tassi di disoccupazione classificati in gruppi di 10.
Manuale
La classificazione manuale aggiunge interruzioni di classe personalizzate appropriate agli specifici dati.
La classificazione manuale può essere utilizzata per creare nuove interruzioni di classe o modificare le interruzioni create con un diverso metodo di classificazione. Ad esempio, è possibile classificare i dati utilizzando intervalli uguali, quindi utilizzare la classificazione manuale per modificare le interruzioni per arrotondare i numeri.
Utilizzare la classificazione manuale quando esistono intervalli noti che devono essere applicati ai dati, ad esempio quando si creano più grafici con gli stessi bin. Ad esempio, utilizzare la classificazione manuale per confrontare il costo medio dei fitti degli alloggi per diversi quartieri tramite un clock di dati. È possibile applicare gli stessi bin a tutti i grafici in modo da poter creare modelli e confronti senza falsi presupposti dovuti a differenze nella classificazione.
Risorse
Usare le seguenti risorse per saperne di più: