La classification des données est un processus dans lequel les valeurs numériques graduées sont regroupées par plages, et chaque plage de classification est représentée par une nuance ou une couleur sur un dégradé de couleurs. La classification est disponible pour les data clocks et les diagrammes de densité.
La méthode de classification que vous appliquez dépend des données que vous utilisez et des informations que vous voulez transmettre sur le diagramme.
Seuils naturels
La classification par seuils naturels crée des classes basées sur les regroupements naturels inhérents aux données. Il s’agit de la classification par défaut.
Utilisez la classification par seuils naturels quand vous voulez mettre en valeur les regroupements naturels des données. Par exemple, utilisez les seuils naturels pour comparer les taux de criminalité d’une ville au fil des mois et des ans dans un data clock. Les taux de criminalité seront regroupés afin que les mois et les années dont le taux de criminalité est équivalent soient symbolisés par la même couleur.
N’utilisez pas les seuils naturels pour comparer des diagrammes créés avec d’autres données.
Intervalle égal
La classification par intervalles égaux divise la plage de valeurs attributaires en sous-plages de même taille.
La classification par intervalles égaux met en évidence la quantité d’un attribut par rapport à d’autres valeurs. Utilisez la méthode Intervalle égal pour les données dont les plages sont familières. Par exemple, utilisez des intervalles égaux pour comparer le pourcentage de différentes espèces d’arbres avec des coléoptères invasifs dans les parcs d’un même comté à l’aide d’un diagramme de densité. Un pourcentage est compris entre 0 et 100. Si vous utilisez quatre groupes, les catégories seront basées sur des intervalles de 25 pour cent.
Quantile
La classification par quantile divise les attributs en groupes avec des nombres égaux d’entités.
La classification des quantiles peut déformer l’apparence de votre diagramme en plaçant des valeurs similaires dans des classes différentes. Utilisez la classification par quantile pour des données assez uniformes. Vous pouvez aussi utiliser la classification par quantile pour un classement visuel. Par exemple, utilisez les intervalles de quantiles pour comparer les taux annuels de chômage dans les différents États des États-Unis à l’aide d’un diagramme de densité. Si vous utilisez cinq groupes pour les 50 États et le District of Columbia, il y aura environ 10 États par groupe. Les résultats peuvent servir à voir les taux de chômage classés par groupes de 10.
Manuelle
La classification manuelle ajoute des seuils de classe personnalisés correspondant à vos données.
La classification manuelle permet de créer des seuils de classe ou de modifier des seuils créés à l’aide d’une autre méthode de classification. Par exemple, vous pouvez classer les données à l’aide d’intervalles égaux et utiliser ensuite la classification manuelle pour modifier les seuils par des nombres arrondis.
Utilisez la classification manuelle quand des plages connues doivent être appliquées aux données, par exemple si vous créez plusieurs diagrammes avec les mêmes groupes. Par exemple, utilisez la classification manuelle pour comparer le coût moyen d’une location par mois et par an dans des quartiers à l’aide d’un data clock. Vous pouvez appliquer les mêmes groupes à tous les diagrammes afin que les modèles et les comparaisons puissent être établis sans émettre de fausses hypothèses en raison des différences de classification.
Ressources
Référez-vous aux ressources suivantes pour en savoir plus :
Vous avez un commentaire à formuler concernant cette rubrique ?