Créer et utiliser un nuage de points

Il est utilisé pour déterminer la solidité d'une relation entre deux variables numériques. L’axe des x représente la variable indépendante et l’axe des y, la variable dépendante.

Les nuages de points permettent de répondre à des questions concernant vos données par exemple, quelle est la relation entre deux variables ? Quel est le type de distribution ? Où se trouvent les points aberrants d'emplacement ?

Exemples

Les exemples ci-dessous illustrent des nuages de points avec deux et trois variables.

Deux variables

Un service de travaux publics a observé une augmentation du nombre de fuites au niveau des canalisations d’eau. Le service souhaite déterminer l’impact qu’a la longueur totale des canalisations sur le nombre de fuites, mais également l’impact des propriétés de ces canalisations, par exemple leur âge ou leur circonférence. Un nuage de points permet de tracer le nombre total de fuites par rapport à la longueur totale des canalisations dans chaque zone.

Nuage de points montrant la longueur totale des canalisations et le nombre total de fuites

Le service de travaux publics souhaite également savoir s'il existe une différence entre les canalisations sondées à différents moments de l'année. L’option Color by (Couleur par) permet au service de styliser les points avec des couleurs uniques pour chaque valeur unique dans le champ spécifié.

Nuage de points classé selon le mois de la date de l’étude

Le nuage de points montre que les révisions de canalisations ont, pour la plupart, eu lieu en avril.

Un nuage de points peut utiliser une analyse de régression pour estimer la solidité et l'orientation de la relation entre la variable dépendante et la variable indépendante. Les modèles statistiques sont illustrés par une ligne droite ou courbe, selon les statistiques de diagramme que vous sélectionnez. La valeur R2 peut être ajoutée afin de mesurer l'impact de la longueur des canalisations sur le nombre de fuites.

Nuage de points avec classement par mois et montrant une ligne de meilleur ajustement

Ajouter une troisième variable

Un service de travaux publics a observé une augmentation du nombre de fuites au niveau des canalisations d’eau. Le service souhaite déterminer l'impact de la longueur totale des canalisations sur le nombre de fuites, mais également l'impact des propriétés de ces canalisations, par exemple leur âge ou leur circonférence. Le département souhaite également savoir s’il existe un lien entre le nombre de fuites ou la longueur des canalisations et le coût par jour (en incluant la construction, la maintenance et les réparations, ainsi que les ressources perdues à cause des fuites). Un nuage de points avec des symboles proportionnels permet de tracer le nombre total de fuites par rapport à la longueur totale des canalisations dans chaque zone, la taille des points représentant le coût par jour.

Nuage de points avec coordonnées cartésiennes montrant l'impact de la longueur des canalisations sur le nombre de fuites

Astuce :

Drag-N Drop Faites glisser un champ numérique sur votre page et déposez-le sur votre nuage de points pour donner à votre diagramme des symboles gradués.

Le service de travaux publics souhaite également savoir s'il existe une différence entre les canalisations sondées à différents moments de l'année. L’option Color by (Couleur par) permet de styliser les points avec des couleurs uniques pour chaque valeur unique dans le champ spécifié.

Nuage de points avec coordonnées cartésiennes pour la longueur des canalisations et le nombre de fuites, et des symboles proportionnels représentant le coût

Le nuage de points montre que les révisions de canalisations ont, pour la plupart, eu lieu en avril.

Créer un nuage de points

Pour créer un nuage de points, procédez comme suit :

  1. Sélectionnez deux champ numériques Champ de numérotation ou de taux/ratio Champ de taux/ratio.
    Astuce :

    Vous pouvez utiliser la barre de recherche de la fenêtre de données pour rechercher des champs.

  2. Créez le nuage de points en procédant comme suit :
    1. Glissez les champs sélectionnés sur une nouvelle carte.
    2. Passez votre souris sur la zone de déplacement du Chart (Diagramme).
    3. Déposez les champs sélectionnés sur la Box Plot (Boîte à moustaches).
Astuce :

Pour créer des diagrammes, vous pouvez également utiliser le menu Chart (Diagramme) situé au-dessus de la fenêtre de données ou le bouton Visualization type (Type de visualisation) Type de visualisation d’une fiche existante. Dans le menu Chart (Diagramme), seuls les diagrammes compatibles avec votre sélection de données sont activés. Dans le menu Visualization type (Type de visualisation), seules les visualisations compatibles (y compris les cartes, les diagrammes ou les tables) sont affichées.

Les nuages de points peuvent aussi être créés à partir de View Scatter Plot (Afficher le nuage de points), accessible en cliquant sur le bouton Action Action au-dessous de Find answers (Trouver des réponses) > Comment est-il lié.

Remarques sur l'utilisation

Le bouton Legend (Légende) Légende donne accès à la fenêtre Layer options (Options de la couche). La fenêtre Layer options (Options de la couche) comporte les fonctions suivantes :

  • Le bouton Legend (Légende) Légende permet d’afficher les symboles et valeurs du diagramme. Pour changer la couleur associée à une valeur, cliquez sur le symbole, puis sélectionnez une couleur dans la palette ou saisissez une valeur hexadécimale (uniquement si une valeur Color by (Couleur par) est appliquée). Le bouton Pop out legend (Légende contextuelle) Légende contextuelle permet d’afficher la légende sous forme de fiche séparée sur la page. La légende permet de faire des sélections sur le diagramme.
  • L’onglet Style Style permet de changer la taille de symbole, la couleur de symbole (symbole uniquement seulement), l’épaisseur de contour et la couleur de contour sur le diagramme.

Vous pouvez ajouter une ligne de compromis au nuage de points en cliquant sur le bouton Chart Statistics (Statistiques du diagramme) Statistiques du diagramme. Cette ligne de compromis peut être Linear ( linéaire), Exponential (exponentielle) ou Polynomial (polynomiale). L’équation de la ligne de compromis et la valeur R2 sont également affichées sur le diagramme.

StatistiqueDescription

Linéaire

La régression linéaire tente de fixer une ligne droite dans un ensemble de valeurs de sorte que la distance entre les valeurs et la ligne soit aussi petite que possible. Une ligne inclinée positivement (du coin inférieur gauche vers le coin supérieur droit du diagramme) indique une relation linéaire positive. Une relation positive signifie que les valeurs augmentent ensemble. Une ligne inclinée négativement indique une relation linéaire négative. Une relation négative signifie que, lorsqu'une valeur diminue, une autre augmente. Des mesures de précision d'ajustement, telles que R2, peuvent être utilisées pour quantifier la relation. Plus la valeur est proche de 1, plus la relation est solide.

Exponentielle

Calcule une courbe exponentielle (orientée vers le haut) de meilleur ajustement pour modéliser une relation non linéaire dans vos données (R2 pour la régression linéaire à 0 ou proche de 0).

Polynomiale

Calcule une courbe de meilleur ajustement pour une relation non linéaire dans vos données (R2 pour la régression linéaire à 0 ou proche de 0). Une équation polynomiale de deuxième degré est utilisée par défaut pour le calcul. Vous pouvez remplacer l'équation par une équation polynomiale de troisième ou quatrième degré.

Vous pouvez ajouter une troisième variable numérique ou de taux/ratio à votre nuage de points en sélectionnant un champ dans la fenêtre de données et en le faisant glisser vers la fiche de nuage de points existant. Le résultat est un nuage de points avec des symboles proportionnels dans lequel la taille des points représente l’ampleur des données à partir de la troisième variable.

Cliquez sur le bouton Flip Fields (Inverser les champs) Inverser pour permuter les variables sur les axes des x et y.

Cliquez sur le bouton Visualization type (type de visualisation) Type de visualisation pour basculer directement entre un nuage de points et une summary table (table de synthèse).

Cliquez sur l’axe des x ou des y pour changer l’échelle Linear (Linéaire) en Log (Journal).