Créer et utiliser un nuage de points—ArcGIS Insights

Il est utilisé pour déterminer la solidité d'une relation entre deux variables numériques. L’axe des x représente la variable indépendante et l’axe des y, la variable dépendante.

Les nuages de points permettent de répondre à des questions concernant vos données par exemple, quelle est la relation entre deux variables ? Comment les données sont-elles distribuées ? Où se trouvent les points aberrants d'emplacement ?

Exemples

Les exemples ci-dessous illustrent des nuages de points avec deux variables, trois variables et des groupes.

Deux variables

Un service de travaux publics a observé une augmentation du nombre de fuites au niveau des canalisations d’eau. Le service souhaite déterminer l’impact qu’a la longueur totale des canalisations sur le nombre de fuites, mais également l’impact des propriétés de ces canalisations, par exemple leur âge ou leur circonférence. Un nuage de points permet de tracer le nombre total de fuites par rapport à la longueur totale des canalisations dans chaque zone.

Nuage de points montrant la longueur totale des canalisations et le nombre total de fuites

Le service de travaux publics désire également savoir s’il existe une différence entre les canalisations sondées à différents moments de l’année. L’option Color by (Couleur par) permet au service de styliser les points avec des couleurs uniques pour chaque valeur unique dans le champ spécifié.

Nuage de points classé selon le mois de la date de l’étude

Le nuage de points montre que les révisions de canalisations ont, pour la plupart, eu lieu en avril.

Un nuage de points peut utiliser une analyse de régression pour estimer la solidité et l'orientation de la relation entre la variable dépendante et la variable indépendante. Les modèles statistiques sont illustrés par une ligne droite ou courbe, selon les statistiques de diagramme que vous sélectionnez. La valeur R² peut être ajoutée afin de mesurer l'impact de la longueur des canalisations sur le nombre de fuites.

Nuage de points avec classement par mois et montrant une ligne de meilleur ajustement

Ajouter une troisième variable

Un service de travaux publics a observé une augmentation du nombre de fuites au niveau des canalisations d’eau. Le service souhaite déterminer l'impact de la longueur totale des canalisations sur le nombre de fuites, mais également l'impact des propriétés de ces canalisations, par exemple leur âge ou leur circonférence. Le service souhaite également savoir s’il existe un lien entre le nombre de fuites ou la longueur des canalisations et le coût par jour (en incluant la construction, la maintenance et les réparations, ainsi que les ressources perdues à cause des fuites). Un nuage de points avec des symboles proportionnels permet de tracer le nombre total de fuites par rapport à la longueur totale des canalisations dans chaque zone, la taille des points représentant le coût par jour.

Nuage de points avec coordonnées cartésiennes montrant l'impact de la longueur des canalisations sur le nombre de fuites

Conseil :

Drag-N Drop Faites glisser un champ numérique sur votre page et déposez-le sur votre nuage de points pour enrichir votre diagramme de symboles gradués.

Le service de travaux publics désire également savoir s’il existe une différence entre les canalisations sondées à différents moments de l’année. L’option Color by (Couleur par) permet de styliser les points avec des couleurs uniques pour chaque valeur unique dans le champ spécifié.

Nuage de points avec coordonnées cartésiennes pour la longueur des canalisations et le nombre de fuites, et des symboles proportionnels représentant le coût

Le nuage de points montre que les révisions de canalisations ont, pour la plupart, eu lieu en avril.

Visualiser par des groupes

Un analyste SIG d’un consortium d’établissements d’enseignement supérieur souhaite savoir quels États disposent de bonnes universités. L’analyste commence son analyse en créant un nuage de points affichant les frais de scolarité et les revenus moyens des jeunes diplômés. Le nuage de points affiche une relation positive, mais la distribution des points est trop dense pour percevoir un quelconque schéma.

Nuage de points comparant les frais de scolarité et les revenus des jeunes diplômés aux États-Unis

L’analyste peut changer le style du diagramme et sélectionner Bins (Groupes) pour voir la distribution des points dans le nuage de points. Le modèle montre une forte concentration d’établissements dont le coût avoisine les 20 000 dollars pour des revenus inférieurs à 50 000 dollars.

Nuage de points comparant les frais de scolarité et les revenus des jeunes diplômés, stylisé par groupes

Créer un nuage de points

Pour créer un nuage de points, procédez comme suit :

Sélectionnez deux champ numériques ou de taux/ratio .
Remarque :
Vous pouvez utiliser la barre de recherche de la fenêtre de données pour rechercher des champs.
Créez le diagramme comme suit :
1. Glissez les champs sélectionnés sur une nouvelle carte.
2. Passez votre souris sur la zone de déplacement du Chart (Diagramme).
3. Déposez les champs sélectionnés sur la Box Plot (Boîte à moustaches).

Conseil :

Pour créer des diagrammes, vous pouvez également utiliser le menu Chart (Diagramme) situé au-dessus de la fenêtre de données ou le bouton Visualization type (Type de visualisation) d’une fiche existante. Dans le menu Chart (Diagramme), seuls les diagrammes compatibles avec votre sélection de données sont activés. Dans le menu Visualization type (Type de visualisation), seules les visualisations compatibles (y compris les cartes, les diagrammes ou les tables) sont affichées.

Les nuages de points peuvent aussi être créés à partir de View Scatter Plot (Afficher le nuage de points), accessible en cliquant sur le bouton Action Opération au-dessous de Find answers (Trouver des réponses) > Comment est-il lié.

Vous pouvez ajouter une troisième variable numérique ou de taux/ratio à votre nuage de points en sélectionnant un champ dans la fenêtre de données et en le faisant glisser vers la fiche de nuage de points existant (non disponible sur un nuage de points avec des symboles de type groupe). Le résultat est un nuage de points avec des symboles proportionnels dans lequel la taille des points représente l’ampleur des données à partir de la troisième variable.

Remarques sur l’utilisation

Cliquez sur le bouton Switch axes (Changer d’axe) Permuter les axes pour permuter les variables sur les axes x et y.

Cliquez sur l’axe des x ou des y pour changer l’échelle Linear (Linéaire) en Log (Journal).

Utilisez le bouton Layer options (Options de couche) pour ouvrir la fenêtre Layer options (Options de couche) et mettre à jour les options de configuration suivantes :

Utilisez l’onglet Legend (Légende) pour afficher les symboles dans le diagramme. Le bouton de légende contextuelle permet d’afficher la légende sous forme de fiche séparée sur la page. Vous pouvez utiliser la légende pour faire des sélections sur le diagramme.
Pour changer la couleur ou le motif associé à une valeur, cliquez sur le symbole, puis sélectionnez une couleur dans la palette, saisissez une valeur hexadécimale ou sélectionnez un motif. La modification du symbole dans l’onglet Legend (Légende) est uniquement possible pour les symboles uniques.
Utilisez l’onglet Symbology (Symbologie) pour modifier les paramètres Color by (Couleur par) et Symbol type (Type de symbole). Le champ Color by (Couleur par) permet de styliser le diagramme à l’aide de valeurs uniques et doit être un champ de type chaîne. Le paramètre Symbol type (Type de symbole) permet de changer de style de diagramme en affichant les points ou les groupes. Si le type de symbole est défini sur Bins (Groupes), les configurations supplémentaires sont disponibles :
- Resolution (Résolution) : définit la taille des groupes. La valeur par défaut du champ Resolution (Résolution) est calculée pour votre jeu de données à l’aide de la règle de Sturges.
- Transition value (Valeur de transition) : si le nombre d’entités ponctuelles dans l’étendue du diagramme est inférieur à la valeur de transition, le diagramme affiche les entités ponctuelles. Si le nombre de points dans l’étendue du diagramme est supérieur ou égal à la valeur de transition, le diagramme est stylisé à l’aide de groupes. Transition value (Valeur de transition) a pour valeur par défaut 2 000.
- Show pop-up (Afficher la fenêtre contextuelle) : détermine si des fenêtres contextuelles apparaissent lorsque vous survolez un groupe, ainsi que les informations qu’elles contiennent.
Utilisez l’onglet Appearance (Apparence) pour réaliser les opérations suivantes :
- En cas d’affichage des points, vous pouvez changer la taille du symbole, la couleur du symbole (symbole unique seulement), l’épaisseur et la couleur du contour, ainsi que la transparence de la couche.
- En cas d’affichage des groupes, vous pouvez changer la palette de couleurs, l’épaisseur et la couleur du contour du groupe, ainsi que la transparence de la couche.

Utilisez le bouton Chart statistics (Statistiques du diagramme) pour ajouter une ligne de meilleur ajustement au nuage de points. Cette ligne de meilleur ajustement peut être linéaire, exponentielle ou polynomiale. L’équation de la ligne de compromis et la valeur R² sont également affichées sur le diagramme. Le tableau suivant décrit les options de la ligne de meilleur ajustement :


Statistique	Description
Linéaire	Tente d’ajuster une ligne droite dans un ensemble de valeurs de sorte que la distance entre les valeurs et la ligne ajustée soit aussi petite que possible. Une ligne inclinée positivement (du coin inférieur gauche vers le coin supérieur droit du diagramme) indique une relation linéaire positive. Une relation positive signifie que les valeurs augmentent ensemble. Une ligne inclinée négativement indique une relation linéaire négative. Une relation négative signifie que, lorsqu'une valeur diminue, une autre augmente. Des mesures de précision d'ajustement, telles que R², peuvent être utilisées pour quantifier la relation. Plus la valeur est proche de 1, plus la relation est solide.
Exponentiel	Calcule une courbe exponentielle (orientée vers le haut) de meilleur ajustement pour modéliser une relation non linéaire dans vos données (R² pour une régression linéaire à 0 ou proche de 0).
Polynomiale	Calcule une courbe de meilleur ajustement pour une relation non linéaire dans vos données (R² pour une régression linéaire à 0 ou proche de 0). Une équation polynomiale de deuxième degré est utilisée par défaut pour le calcul. Vous pouvez remplacer l'équation par une équation polynomiale de troisième ou quatrième degré.

Utilisez le bouton Card filter (Filtre des fiches) pour supprimer les données indésirables de votre diagramme. Les filtres peuvent être appliqués à tous les champs chaîne, numérique, taux/ratio et date/heure. Un filtre de fiche n'affecte pas les autres fiches utilisant le même jeu de données.

Utilisez le bouton Selection tools (Outils de sélection) pour sélectionner des entités dans le diagramme à l’aide des outils Sélection unique, Sélectionner le cadre ou Inverser la sélection.

Utilisez le bouton Zoom tools (Outils de zoom) pour appliquer un zoom avant ou arrière au diagramme.

Utilisez le bouton Visualization type (Type de visualisation) pour passer directement d’un nuage de points à d’autres visualisations, notamment une fiche KPI ou une table de synthèse.

Utilisez le bouton Maximize (Agrandir) pour agrandir la fiche. Les autres fiches sur la page sont réduites à la taille de miniatures. Vous pouvez rétablir la taille précédente de la fiche à l’aide du bouton Restore down (Restaurer) .

Utilisez le bouton Enable cross filters (Activer les filtres croisés) pour autoriser la création de filtres sur la fiche en effectuant des sélections sur d’autres fiches. Les filtres croisés peuvent être supprimés à l’aide du bouton Disable cross filters (Désactiver les filtres croisés) .

Cliquez sur le bouton Flip card (Retourner la fiche) pour visualiser le verso de la fiche. L’onglet Card info (Informations de la fiche) Infos de fiche fournit des informations sur les données de la fiche et l’onglet Export data (Exporter des données) permet aux utilisateurs d’exporter les données à partir de la fiche.

Utilisez le bouton Card options (Options de la fiche) pour accéder aux options de menu suivantes :

Bouton Appearance (Apparence) : changez la couleur d’arrière-plan, la couleur de premier plan et la bordure de la fiche.
Bouton Edit labels (Modifier les étiquettes) : créez des étiquettes personnalisées pour les axes du diagramme. Pour modifier les étiquettes, cliquez sur le bouton Edit labels (Modifier les étiquettes), puis cliquez sur l’axe pour le rendre modifiable.
Bouton Order (Ordre) : déplacez la fiche vers l’avant ou placez-la derrière d’autres fiches sur la page.
Bouton Delete (Supprimer) : supprime la fiche de la page. Si vous n’aviez pas l’intention de supprimer la fiche, vous pouvez la récupérer en cliquant sur le bouton Undo (Annuler) .

Limitations

Les nuages de points groupés ne sont pas disponibles pour certaines couches d’entités distantes. Si votre couche d’entités distante ne prend pas en charge les nuages de points groupés, vous pouvez copier la couche dans votre classeur et créer un nuage de points groupé à l’aide de la copie.

Export data (Exporter les données) n’est pas disponible pour les nuages de points groupés. Vous devez définir le type de symbole (Symbol type) sur Single symbol (Symbole unique) pour activer l’exportation des données à partir de l’arrière d’un nuage de points.

Les outils de zoom et de sélection ne sont pas disponibles dans les rapports publiés pour les nuages de points groupés comportant plus de 100 000 entités.

La navigation sera verrouillée dans les rapports pour certains nuages de points groupés comportant trop d’entités à afficher. Vous pouvez activer la navigation en activant des filtres croisés sur la fiche ou en ajoutant un filtre prédéfini ou temporel pour le jeu de données qui a servi à créer la fiche.

Vous avez un commentaire à formuler concernant cette rubrique ?

Exemples

Deux variables

Ajouter une troisième variable

Conseil :

Visualiser par des groupes

Créer un nuage de points

Remarque :

Conseil :

Remarques sur l’utilisation

Limitations

Dans cette rubrique