Boîte à moustaches

Les boîtes à moustaches permettent de visualiser et de comparer la distribution et la tendance centrale des valeurs numériques via leurs quartiles. Les quartiles sont une méthode pour fractionner les valeurs numériques en quatre groupes égaux en fonction de cinq valeurs clés : minimum, premier quartile, médiane, troisième quartile et maximum.

La partie boîte du diagramme ci-dessous illustre les 50 pour cent centraux des valeurs de données, également connus sous le nom d’écart interquartile (IQR). La médiane des valeurs est représentée sous forme de ligne qui fractionne la boîte en deux. L'IQR illustre la variabilité dans un jeu de valeurs. Un IQR important indique une vaste dispersion des valeurs, tandis qu'un IQR plus petit indique que la plupart des valeurs se trouvent proches du centre. Les boîtes à moustaches illustrent également les valeurs de données minimum et maximum via des moustaches ou des lignes qui partent de la boîte et, parfois, de points aberrants représentés par des points au-delà des moustaches.

Diagramme de type boîte à moustaches

Exemple

La boîte à moustaches ci-dessous présente la distribution de l’espérance de vie par continent selon des incréments de 20 ans de 1800 à 2040.

  • Numeric fields (Champs numériques) :Life expectancy
  • CatégorieYear
  • Split by (Fractionner en) :Continent
  • Show outliers (Afficher les points aberrants) : activé

Boîte à moustaches de l’espérance de vie par continent

La même boîte à moustaches peut également être affichée à l’aide de lignes moyennes.

Espérance de vie par continent avec les lignes moyennes

Données

Les configurations de l’onglet Data (Données) Données comprennent les variables utilisées pour créer la boîte à moustaches.

Variables

Les boîtes à moustaches se composent d'un axe des x et d'un axe des y. L’axe x attribue une boîte à chaque catégorie ou variable numérique. L'axe des y permet de mesurer la valeur minimum, le premier quartile, la médiane, le troisième quartile et la valeur maximum dans un ensemble de nombres.

Vous pouvez utiliser les boîtes à moustaches pour visualiser une ou plusieurs distributions. Pour visualiser une seule distribution, ajoutez une variable Numeric fields (Champs numériques). Cette opération entraîne la création d'un diagramme avec une boîte à moustaches qui permet de visualiser la distribution de l'attribut numérique choisi.

Vous pouvez ajouter d’autres variables Numeric fields (Champs numériques) pour comparer plusieurs distributions de différents champs attributaires dans une table. Par exemple, dans un jeu de données de comtés, les champs Population2010 et Population2015 sont ajoutés en tant que variables Numeric fields (Champs numériques). Le diagramme généré affiche deux boîtes à moustaches : une pour visualiser la distribution de Population2010 et l’autre pour visualiser la distribution de Population2015, pour tous les comtés du jeu de données.

Lorsqu’une boîte à moustaches est créée à partir de plusieurs champs numériques, une normalisation de score z est appliquée par défaut. La standardisation permet de comparer les variables numériques dans différentes unités.

Ainsi, une boîte à moustaches comparant les répartitions de revenus (avec des valeurs en dizaines de milliers) et le taux de chômage (valeurs comprises entre 0 et 1,0) serait difficile à lire sans la standardisation car les valeurs du taux de chômage sont beaucoup plus faibles que celles des revenus.

La standardisation des valeurs attributaires implique une transformation z dans laquelle la moyenne de toutes les valeurs est soustraite de chaque valeur et divisée par l’écart type pour toutes les valeurs. La standardisation de score Z place tous les attributs sur la même échelle, ce qui permet de visualiser plusieurs répartitions sur le même diagramme. Pour visualiser les valeurs brutes à la place, désactivez Standardize values (z-score) (Normaliser les valeurs (score z)).

Si une seule variable Numeric fields (Champs numériques) est ajoutée, vous pouvez ajouter une variable Category (Catégorie) comme méthode de comparaison des distributions dans les catégories. Par exemple, Population2010 est défini comme variable Numeric fields (Champs numériques) et StateName est défini comme variable Category (Catégorie) d’un jeu de données de comtés. Le diagramme généré affiche une boîte à moustaches pour chaque État, qui permet de visualiser la distribution de Population2010 pour tous les comtés appartenant à chaque État.

Série multiple

Vous pouvez utiliser des boîtes à moustaches Série multiple pour comparer des distributions de différents types ou de différentes catégories.

Il est possible de créer plusieurs boîtes à moustaches Multiple series (Série multiple) en spécifiant un champ de catégorie et plusieurs champs numériques ou en spécifiant un champ de catégorie Split by (Fractionner en).

Si une variable Category (Catégorie) est utilisée avec plusieurs variables Numeric fields (Champs numériques), chaque champ numérique ajouté à la table de séries crée une série. Par exemple, dans un jeu de données de comtés, StateName est défini comme variable Category (Catégorie) et Population2010, Population2015 et Population2020 comme variables Numeric fields (Champs numériques). Le diagramme généré comportera des États comme catégories le long de l’axe des X, avec trois séries chacune (Population2010, Population2015 et Population2020).

Vous pouvez également ajouter une variable Split by (Fractionner en) afin de diviser davantage les données et de créer plusieurs séries. Par exemple, Population2010 est défini comme variable Numeric fields (Champs numériques), StateName comme variable Category (Catégorie) et ElectionWinner comme champ Split by (Fractionner par) pour un jeu de données de comtés. Le diagramme généré présente deux boîtes à moustaches côte à côte pour chaque État (100 boîtes à moustaches au total) ; une qui permet de visualiser la distribution de Population2010 pour tous les comtés de chaque État dont la valeur ElectionWinner est définie sur Democrat et une autre pour tous les comtés de chaque État dont la valeur ElectionWinner est définie sur Republican.

Vous pouvez également faire appel aux champs Split by (Fractionner par) lorsque plusieurs variables Numeric fields (Champs numériques) sont utilisées au lieu d’une variable Category (Catégorie). Par exemple, Population2010, Population2015 et Population2020 sont définis comme variables Numeric fields (Champs numériques) et ElectionWinner, comme champ Split by (Fractionner par) pour un jeu de données de comtés. Le diagramme généré présente les trois variables Numeric fields (Champs numériques) le long de l’axe x (Population2010, Population2015 et Population2020), chacune avec deux boîtes à moustaches côte à côte ; une illustrant la distribution pour tous les comtés dont la valeur ElectionWinner est définie sur Democrat et l’autre pour tous les comtés dont la valeur ElectionWinner est définie sur Republican.

Points aberrants

Vous pouvez afficher des points aberrants en tant que points s’étendant au-delà des moustaches en activant Show outliers (Afficher les points aberrants). Si le paramètre Show outliers (Afficher les points aberrants) n’est pas activé, les moustaches s’étendent de façon à englober tous les points de données.

Ordre de tri

Les boîtes à moustaches sont automatiquement triées alphabétiquement par catégorie (X-axis ascending (Croissant sur l’axe X)). Vous pouvez modifier l’ordre de tri à l’aide du paramètre Sort order (Ordre de tri). Les options de tri suivantes sont disponibles pour les boîtes à moustaches :

  • X-axis ascending (Croissant sur l’axe des X) : les catégories sont organisées alphabétiquement de gauche à droite.
  • X-axis descending (Décroissant sur l’axe des X) : les catégories sont organisées dans l’ordre alphabétique inverse.
  • Mean ascending (Moyenne croissante) : les boîtes sont organisées selon la statistique moyenne par ordre croissant.
  • Mean descending (Moyenne décroissante) : les boîtes sont organisées selon la statistique moyenne par ordre décroissant.
  • Median ascending (Médiane croissante) : les boîtes sont organisées selon la statistique médiane par ordre croissant.
  • Median descending (Médiane décroissante) : les boîtes sont organisées selon la statistique médiane par ordre décroissant.
  • Custom sort (Tri personnalisé) : les catégories peuvent être classées manuellement dans la liste Category (Catégorie). Pour modifier l’ordre de tri, appuyez et maintenez enfoncé Reposition (Repositionner) Repositionner et déplacez la catégorie vers une nouvelle position ou sélectionnez la catégorie et cliquez sur la flèche vers le haut Haut ou vers le bas Bas. Par exemple, vous pouvez organiser les jours de la semaine dans leur ordre normal.

Série

Les configurations de l’onglet Series (Séries) Série permettent de modifier la couleur et l’étiquette des boîtes dans la boîte à moustaches.

L’option Display multiple series (Afficher plusieurs séries) est également disponible lorsque vous spécifiez un champ Split by (Fractionner en) pour créer plusieurs séries. Les options d’affichage sont notamment les suivantes :

  • Side-by-side (Côte à côte) : crée des boîtes à moustaches côte à côte, une pour chaque série.
  • Mean lines (Lignes moyennes) : crée une boîte à moustaches pour chaque variable Category (Catégorie) ou Numeric field (Champ numérique) et utilise des lignes pour afficher la moyenne de chaque valeur unique dans le champ Split by (Fractionner en).

Axes

Les configurations de l’onglet Axes Axes sont utilisées pour changer les spécifications de l’axe des X et de l’axe des Y.

Axe x

Par défaut, les étiquettes de catégorie sont tronquées à 11 caractères. Lorsqu’une étiquette est tronquée, il est possible d’afficher le texte intégral en survolant l’étiquette. Pour afficher tout le texte de l’étiquette, augmentez la valeur Label character limit (limite de caractères d’étiquette).

Axe y

Les limites par défaut de l’axe y sont basées sur la plage des valeurs de date représentées sur l’axe des y. Vous pouvez personnaliser ces valeurs en saisissant une valeur Minimum bounds (Limites minimales) ou Maximum bounds (Limites maximales). Définissez une limite de l’axe y pour maintenir l’échelle de votre diagramme constante à des fins de comparaison. Cliquez sur le bouton Reset (Réinitialiser) pour restaurer la limite de l’axe sur la valeur par défaut.

Vous pouvez mettre en forme la manière dont l’axe des y affiche les valeurs numériques en spécifiant le nombre de décimales et en indiquant si le séparateur des milliers doit être inclus.

Repères

Les configurations de l’onglet Guides Repères sont utilisées pour ajouter des guides ou des plages de guides au diagramme.

Les lignes ou plages des guides peuvent être ajoutées aux diagrammes pour servir de référence ou mettre en évidence des valeurs importantes. Cliquez sur le bouton Add guide (Ajouter un repère) pour ajouter des repères à l'axe des y.

Pour créer une ligne de repère, entrez une valeur pour Start (Début) à l’endroit où vous souhaitez que la ligne soit tracée. Pour créer une plage de repères, saisissez une valeur pour Start (Début) et End (Fin). Vous pouvez également modifier l'aspect de la ligne ou plage de repères. Pour les lignes, le style, l'épaisseur et la couleur des lignes peuvent être mis à jour. Pour les plages, la couleur de remplissage peut être mise à jour.

Vous avez la possibilité de modifier le nom du repère à l'aide du paramètre Guide name (Nom du repère) et d'ajouter du texte à votre repère à l'aide du paramètre Guide label (Étiquette du repère) (par exemple, Médiane).

Vous pouvez choisir d’afficher le repère devant ou derrière le diagramme à l’aide des boutons In front (Devant) et In back (Derrière) dans le paramètre Display (Affichage).

Format

Les configurations de l’onglet Format Format sont utilisées pour modifier l’apparence du diagramme en mettant en forme les éléments de texte et de symbole.

Les options de mise en forme du diagramme sont notamment :

  • Text elements (Éléments de texte) : la taille, la couleur et le style de la police utilisés pour le titre du diagramme, le titre de l’axe des x, le titre de l’axe des y, le titre de la légende, le texte de la description, le texte de la légende, les étiquettes des axes et les étiquettes de données. Vous pouvez changer le format de plusieurs éléments en une seule opération en appuyant sur la touche Ctrl tout en cliquant pour sélectionner les éléments.
  • Symbol elements (Éléments de symbole) : couleur, largeur et style (Solid (Uni), Dot (Point) ou Dash (Tiret)) pour les lignes de grille et d’axe et la couleur d’arrière-plan du diagramme.

Généralités

Les configurations de l’onglet General (Général) Généralités sont utilisées pour mettre à jour les titres du diagramme, des axes et de la légende.

Les titres par défaut des diagrammes et des axes s’appuient sur le nom des variables et le type du diagramme. Vous pouvez activer ou désactiver les titres sur l’onglet General (Général). Vous pouvez également fournir un titre dans le paramètre Legend title (Titre de la légende). Le paramètre Legend alignment (Alignement de la légende) peut être défini sur Right (Droite), Left (Gauche), Top (Haut) ou Bottom (Bas). Vous pouvez également ajouter une description du diagramme dans le paramètre Description. Une description est un bloc de texte qui apparaît au bas de la fenêtre du diagramme.

Ressources

Utilisez les ressources suivantes pour en savoir plus sur les diagrammes :