Créez et utilisez un histogramme

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

Les histogrammes agrègent les données numériques en groupes d'intervalles égaux (bin) et affichent la fréquence des valeurs dans chaque bin. Un histogramme est créé avec un champ numérique ou de taux/ratio unique.

Les histogrammes permettent de répondre à des questions sur vos données, par exemple : Comment les valeurs numériques sont-elles réparties et quelle est leur fréquence dans un jeu de données ? Existe-t-il des points aberrants ?

Exemple

Une organisation non gouvernementale pour la santé étudie les taux d’obésité parmi les adolescents aux États-Unis d’Amérique. Un histogramme de la fréquence de l’obésité parmi les jeunes dans chaque État peut servir à déterminer la répartition des taux d’obésité, y compris la fréquence des valeurs les plus et les moins courantes et leur échelle globale.

Histogramme présentant la répartition des taux d’obésité chez les adolescents aux États-Unis

L'histogramme ci-dessus montre une distribution normale et indique que les taux les plus fréquents apparaissent dans la plage de 10 à 14 %.

L’augmentation ou la réduction du nombre de groupes peut avoir un effet sur la façon dont vous analysez vos données. Bien que les données ne changent pas, leur apparence peut changer. C’est important de choisir un nombre approprié de corbeilles pour vos données afin que les modèles de données ne soient pas mal interprétés. Un nombre trop faible de groupes risque de masquer les motifs importants. Un nombre trop élevé de groupes risque de faire apparaître comme importantes des fluctuations de données faibles, mais attendues. Le schéma suivant est un exemple où le nombre de groupes est approprié pour les données concernées. Chaque groupe contient une plage d'environ 1 % et les données peuvent être examinées à une échelle plus fine afin de visualiser les motifs qui ne sont pas visibles avec six groupes. Dans ce cas, le motif qui émerge est une distribution normale autour de la moyenne, avec une légère inclinaison, probablement pas significative, vers la gauche.

Histogramme avec 12 groupes qui montrent de nouveaux motifs

Créer un histogramme

Pour créer un histogramme, procédez comme suit :

  1. Sélectionnez un champ numérique Champ numérique ou de taux/ratio Champ de taux/ratio.
    Conseil :

    Vous pouvez utiliser la barre de recherche de la fenêtre de données pour rechercher des champs.

  2. Créez l’histogramme en procédant comme suit :
    1. Glissez les champs sélectionnés sur une nouvelle carte.
    2. Passez votre souris sur la zone de déplacement du Chart (Diagramme).
    3. Déposez les champs sélectionnés sur le Histogram (Histogramme).
Conseil :

Pour créer des diagrammes, vous pouvez également utiliser le menu Chart (Diagramme) situé au-dessus de la fenêtre de données ou le bouton Visualization type (Type de visualisation) Type de visualisation d’une fiche existante. Dans le menu Chart (Diagramme), seuls les diagrammes compatibles avec votre sélection de données sont activés. Dans le menu Visualization type (Type de visualisation), seules les visualisations compatibles (y compris les cartes, les diagrammes ou les tables) sont affichées.

Les histogrammes peuvent aussi être créés avec View Histogram (Afficher l’histogramme), accessible par le bouton Action Opération au-dessous de Find answers (Trouver des réponses) > How is it distributed? (Quel est le type de distribution ?)

Remarques sur l'utilisation

Les histogrammes sont symbolisés par des valeurs uniques. Vous pouvez utiliser le bouton Layer options (Options de couche) Légende pour changer la couleur des symboles et la couleur des contours, qui seront appliquées à tous les groupes.

Au moment de la création d’un histogramme, Insights calcule automatiquement un nombre adéquat de groupes pour afficher vos données. Vous pouvez changer le nombre de bins grâce au curseur situé sur l’axe des x ou en cliquant sur le nombre de bins et en saisissant un nouveau numéro.

Remarque :

Si le nombre de bins choisi ne se divise pas uniformément dans la plage de données, les bins sont calculés avec des valeurs décimales. Les histogrammes affichent des entiers arrondis en guise d’étiquettes de bins, et non des valeurs décimales. Les entiers arrondis sont utilisés à des fins d’affichage uniquement, alors que les valeurs décimales servent pour tous les calculs. Si un bin contient des valeurs de données proches de la limite supérieure ou inférieure et que l’étiquette est arrondie, les valeurs de début et de fin du bin peuvent sembler incorrectes, car les étiquettes affichent des valeurs arrondies et non des valeurs décimales.

Utilisez le bouton Chart statistics (Statistiques de diagramme) Statistiques du diagramme pour afficher la distribution moyenne, médiane et normale des données. Une courbe de distribution normale représente la répartition attendue d’un échantillon aléatoire de données continues, dans lequel la fréquence des valeurs la plus élevée est centrée autour de la moyenne et la fréquence des valeurs baisse lorsque les valeurs augmentent ou baissent par rapport à la moyenne. Une courbe de distribution normale est utile pour déterminer si vos données sont biaisées (par exemple, les données présentent une fréquence plus élevée de valeurs faibles) ou si elles contiennent des points aberrants.

Utilisez le bouton Visualization type (Type de visualisation) Type de visualisation pour passer directement d’un histogramme à une carte à symboles gradués ou à une table de synthèse.

Cliquez sur le bouton Flip card (Retourner la fiche) Retourner la fichepour visualiser le verso de la fiche. L’onglet Card info (Informations de la fiche) Infos de fiche fournit des informations sur les données de la fiche et l’onglet Export data (Exporter des données)Exporter des données permet aux utilisateurs d’exporter les données à partir de la fiche.

Le dos d’un histogramme affiche les valeurs calculées suivantes : moyenne, médiane, écart type, inclinaison et aplatissement (simplifié). L’inclinaison et l’aplatissement sont décrits dans le tableau suivant :

StatistiqueDescription

Inclinaison

L’inclinaison détermine si la répartition des données est symétrique. La mesure de l’inclinaison détermine si la plupart des valeurs de distribution se situent à gauche ou à droite de la moyenne. L'inclinaison de la distribution normale est égale à zéro, ce qui correspond à une quantité égale de données de part et d’autre de la moyenne.

Les valeurs d’inclinaison peuvent être égales à zéro, négatives ou positives, comme suit :

  • Zéro, la distribution des données est symétrique.
  • Négative, les données sont asymétriques avec une inclinaison vers la droite. Les valeurs de plus haute fréquence se trouvent à droite de la moyenne, et l’extrémité à gauche est plus longue que celle de droite. La médiane est supérieure à la moyenne.
  • Positive, les données sont asymétriques avec une inclinaison à gauche. Les valeurs ayant la plus haute fréquence sont à gauche du centre, et l’extrémité à droite est plus longue que l’extrémité à gauche. La moyenne est supérieure à la médiane.

Kurtosis

L’aplanissement décrit la forme de la distribution des fréquences et donne une idée de la probabilité de trouver des points aberrants. Les distributions dotées d’extrémités relativement importantes sont dites leptocurtiques et leur aplanissement est supérieur à zéro. Les distributions dotées d’extrémités relativement faibles sont dites platicurtiques et leur aplanissement est inférieur à zéro. L’aplanissement d’une distribution normale est égale à trois, ou si l’aplanissement utilisé est simplifié, l’aplanissement d’une distribution normale est zéro (ceci s’obtient par la même formule que l’aplanissement, moins 3).

Les valeurs d’aplanissement simplifiées peuvent être zéro, négatives, ou positives comme suit :

  • Zéro, le mode est le même que la moyenne.
  • Négative, la distribution des données est plus courte que l’extrémité et la crête est plus plate.
  • Positive, les extrémités de la courbe sont plus longues et la crête est plus haute.