Skip To Content

Créer et utiliser un nuage de points

Il est utilisé pour déterminer la solidité d'une relation entre deux variables numériques. L’axe des x représente la variable indépendante et l’axe des y, la variable dépendante.

Les nuages de points permettent de répondre à des questions concernant vos données, par exemple : Quelle est la relation entre deux variables ? Quel est le type de distribution ? Où se trouvent les points aberrants d'emplacement ?

Exemples

Deux variables

Un service de travaux publics a observé une augmentation du nombre de fuites au niveau des canalisations d’eau. Le service souhaite déterminer l'impact de la longueur totale des canalisations sur le nombre de fuites, mais également l'impact des propriétés de ces canalisations, par exemple leur âge ou leur circonférence. Un nuage de points permet de tracer le nombre total de fuites par rapport à la longueur totale des canalisations dans chaque zone.

Nuage de points montrant la longueur totale des canalisations et le nombre total de fuites

Le service de travaux publics souhaite également savoir s'il existe une différence entre les canalisations sondées à différents moments de l'année. L’option Color by (Couleur par) permet de styliser les points avec des couleurs uniques pour chaque valeur unique dans le champ spécifié.

Nuage de points classé selon le mois de la date de l’étude

Le nuage de points ci-dessus montre que les révisions de canalisations ont, pour la plupart, eu lieu en avril.

Un nuage de points peut utiliser une analyse de régression pour estimer la solidité et l'orientation de la relation entre la variable dépendante et la variable indépendante. Les modèles statistiques sont illustrés par une ligne droite ou courbe, selon les statistiques de diagramme que vous sélectionnez. La valeur R2 peut être ajoutée afin de mesurer l'impact de la longueur des canalisations sur le nombre de fuites.

Nuage de points avec classement par mois et montrant une ligne de meilleur ajustement

Ajouter une troisième variable

Un service de travaux publics a observé une augmentation du nombre de fuites au niveau des canalisations d’eau. Le service souhaite déterminer l'impact de la longueur totale des canalisations sur le nombre de fuites, mais également l'impact des propriétés de ces canalisations, par exemple leur âge ou leur circonférence. Le département souhaite également savoir s’il existe un lien entre le nombre de fuites ou la longueur des canalisations et le coût par jour (en incluant la construction, la maintenance et les réparations, ainsi que les ressources perdues à cause des fuites). Un nuage de points avec des symboles proportionnels permet de tracer le nombre total de fuites par rapport à la longueur totale des canalisations dans chaque zone, la taille des points représentant le coût par jour.

Nuage de points avec coordonnées cartésiennes montrant l'impact de la longueur des canalisations sur le nombre de fuites

Astuce:

Drag-N Drop Faites glisser un champ numérique sur votre page et déposez-le sur votre nuage de points pour donner à votre diagramme des symboles gradués.

Le service de travaux publics souhaite également savoir s'il existe une différence entre les canalisations sondées à différents moments de l'année. L’option Color by (Couleur par) permet de styliser les points avec des couleurs uniques pour chaque valeur unique dans le champ spécifié.

Nuage de points avec coordonnées cartésiennes pour la longueur des canalisations et le nombre de fuites, et des symboles proportionnels représentant le coût

Le nuage de points ci-dessus montre que les révisions de canalisations ont, pour la plupart, eu lieu en avril.

Créer un nuage de points

Pour créer un nuage de points, procédez comme suit :

  1. Sélectionnez deux champ numériques Champ de numérotation ou de taux/ratio Champ de taux/ratio.
  2. Créez le nuage de points en procédant comme suit :
    1. Glissez les champs sélectionnés sur une nouvelle carte.
    2. Passez votre souris sur la zone de déplacement du Chart (Diagramme).
    3. Déposez les champs sélectionnés sur la Box Plot (Boîte à moustaches).
Astuce:

Pour créer des diagrammes, vous pouvez également utiliser le menu Chart (Diagramme) situé au-dessus de la fenêtre de données ou le bouton Visualization type (Type de visualisation) Type de visualisation d’une fiche existante. Dans le menu Chart (Diagramme), seuls les diagrammes compatibles avec votre sélection de données sont activés. Dans le menu Visualization type (Type de visualisation), seules les visualisations compatibles (y compris les cartes, les diagrammes ou les tables) sont affichées.

Les nuages de points peuvent aussi être créés à partir de View Scatter Plot (Afficher le nuage de points), accessible par le bouton Action Action au-dessous de Find answers (Trouver des réponses) > Comment est-il lié ?

Remarques sur l'utilisation

Par défaut, les nuages de points sont symbolisés par des symboles uniques. Vous pouvez modifier la Chart Color (Couleur du diagramme) avec le bouton Legend (Légende) Légende. Vous pouvez ajouter un champ de chaîne à la variable Color by (Couleur par) sur l’axe des x pour changer le nuage de points en Unique symbols (Symboles uniques). Si vous utilisez des symboles uniques, vous pouvez recourir à la Légende pour sélectionner des données sur le nuage de points. Pour modifier la couleur associée à une catégorie, cliquez sur le symbole et sélectionnez une couleur dans la palette ou entrez une valeur hexadécimale.

Vous pouvez ajouter une ligne de compromis au nuage de points en cliquant sur le bouton Chart Statistics (Statistiques du diagramme) Statistiques du diagramme. Cette ligne de compromis peut être Linear ( linéaire), Exponential (exponentielle) ou Polynomial (polynomiale). L’équation de la ligne de compromis et la valeur R2 sont également affichées sur le diagramme.

StatistiqueDescription

Linéaire

La régression linéaire tente de fixer une ligne droite dans un ensemble de valeurs de sorte que la distance entre les valeurs et la ligne soit aussi petite que possible. Une ligne inclinée positivement (du coin inférieur gauche vers le coin supérieur droit du diagramme) indique une relation linéaire positive. Une relation positive signifie que les valeurs augmentent ensemble. Une ligne inclinée négativement indique une relation linéaire négative. Une relation négative signifie que, lorsqu'une valeur diminue, une autre augmente. Des mesures de précision d'ajustement, telles que R2, peuvent être utilisées pour quantifier la relation. Plus la valeur est proche de 1, plus la relation est solide.

Exponentielle

Calcule une courbe exponentielle (orientée vers le haut) de compromis pour modéliser une relation non linéaire dans vos données (R2 à 0 ou proche de 0).

Polynomiale

Calcule une courbe de compromis pour une relation non linéaire dans vos données (R2 à 0 ou proche de 0). Une équation polynomiale de deuxième degré est utilisée par défaut pour le calcul. Vous pouvez remplacer l'équation par une équation polynomiale de troisième ou quatrième degré.

Vous pouvez ajouter une troisième variable numérique ou de taux/ratio à votre nuage de points en sélectionnant un champ dans la fenêtre de données et en le faisant glisser vers la fiche de nuage de points existant. Le résultat est un nuage de points avec des symboles proportionnels dans lequel la taille des points représente l’ampleur des données à partir de la troisième variable.

Cliquez sur le bouton Flip Fields (Inverser les champs) Inverser pour permuter les variables sur les axes des x et y.

Cliquez sur le bouton Visualization type (type de visualisation) Type de visualisation pour basculer directement entre un nuage de points et une summary table (table de synthèse).

Cliquez sur l’axe des x ou des y pour changer l’échelle de Linéaire en Journal.