Rechercher des agrégats de points

L’outil Find Point Clusters (Rechercher des agrégats de points) identifie les agrégats d’entités ponctuelles dans le bruit environnant en fonction de leur distribution spatiale.

Exemples

Voici des exemples d'utilisation de cet outil :

  • Une organisation spécialiste d’une maladie parasitaire particulière souhaite identifier où, dans sa zone d’étude, commencer le traitement et l’extermination des parasites. Un analyste dispose d’un jeu de données représentant les ménages infestés et non infestés dans la zone d’étude. Il utilise l’outil Find Point Clusters (Rechercher des agrégats de points) pour identifier le plus gros agrégat de ménages infestés.
  • Une organisation menant des interventions d’urgence doit déterminer où déployer ses ressources de sauvetage et d’évacuation suite à une catastrophe naturelle. Un analyste utilise l’outil Find Point Clusters (Rechercher des agrégats de points) pour identifier des agrégats de tweets géolocalisés mentionnant l’événement. À partir de la taille et de la localisation des agrégats, l’organisation va cartographier la zone touchée et informer ses équipes de secours.

Remarques sur l’utilisation

L’outil Rechercher des agrégats de points inclut des configurations pour les entités en entrée, les paramètres d’agrégation et la couche de résultat.

Entités en entrée

Le groupe Input features (Entités en entrée) inclut le paramètre Input layer (Couche en entrée), qui représente la couche contenant les entités ponctuelles qui vont être regroupées en agrégats en fonction de leur distribution spatiale.

Pour les entités en entrée, le nombre d’entités est affiché sous le nom de la couche. Ce nombre inclut toutes les entités de la couche, à l’exception des entités supprimées à l’aide d’un filtre. Les paramètres d’environnement, comme Processing extent (Étendue de traitement), ne sont pas comptabilisés dans le nombre d’entités.

Remarque :

La projection Web Mercator ne convient pas pour l’analyse spatiale. Si le système de référence spatiale de la couche en entrée est WGS 1984 Web Mercator (Sphère auxiliaire), les données sont converties en système de coordonnées géographiques pour utiliser les distances de corde dans l’analyse.

Paramètres d’agrégation

Le groupe Cluster settings (Paramètres d’agrégation) comprend les paramètres suivants :

  • Clustering method (Méthode d’agrégation) indique la méthode utilisée pour identifier les agrégats.
    • Defined distance (DBSCAN) (Distance définie (DBSCAN)) : identifie les agrégats en recherchant dans une distance de recherche spécifique. Cette méthode est appropriée lorsque tous les agrégats significatifs ont des densités similaires.
    • Self-adjusting (HDBSCAN) [Ajustement automatique] — utilise une plage de distances pour séparer les agrégats de diverses densités du bruit plus clairsemé. Cette méthode est la méthode d’agrégation la plus axée sur les données et ne nécessite de ce fait pas de distance de recherche.
    • Multi-scale (OPTICS) (Multi-échelle (OPTICS)) : identifie les agrégats à l’aide de la distance entre les voisins et d’un diagramme d’accès. La méthode détermine d’abord la distance d’accès minimale pour tous les points. La distance d’accès minimale est la distance entre un point et son voisin le plus proche qui n’a pas encore été visité par la recherche. Une fois que la distance d’accès minimale pour tous les points est déterminée, l’outil construit un diagramme d’accès. Le diagramme d’accès trace l’ordre d’accès de chaque point et sa distance d’accès en révélant la structure d’agrégation des points. Cette méthode utilise ensuite la valeur Cluster sensitivity (Sensibilité d’agrégation) pour identifier les agrégats. Tout comme la méthode HDBSCAN, la méthode OPTICS peut identifier les agrégats de diverses densités.
  • Minimum points per cluster (Nombre minimal de points par agrégat) représente le nombre minimal de points qui sera utilisé pour considérer qu’un regroupement de points constitue un agrégat. En général, plus la valeur est faible, plus le nombre d’agrégats détectés sera élevé. Cette valeur doit être inférieure ou égale au nombre de points inclus dans la couche. La valeur minimale prise en charge est 2.
  • Search distance (Distance de recherche) spécifie la distance maximale autour de chaque point à prendre en compte. Si la valeur Clustering method (Méthode d’agrégation) est Defined distance (DBSCAN) (Distance définie (DBSCAN)), la valeur Search distance (Distance de recherche) est la distance maximale autour de chaque entité ponctuelle dans l’agrégat jusqu’à laquelle les points pouvant être inclus dans l’agrégat doivent être recherchés. Si le nombre minimal de points est trouvé dans la distance de recherche d’un point donné, ce point est considéré comme point principal. Si le nombre minimal de points n’est pas trouvé dans la distance de recherche d’un point donné, mais que ce point se trouve dans la distance de recherche du point principal, le point est considéré comme point de bordure. Les agrégats seront composés à la fois de points principaux et de points de bordure. Si la valeur Clustering method (Méthode d’agrégation) est Multi-scale (OPTICS) (Multi-échelle (OPTICS)), la valeur Search distance (Distance de recherche) est la distance maximale autour de chaque point jusqu’à laquelle les points doivent être recherchés pour affecter une distance d’accès. La distance d’accès est la distance entre un point et son voisin le plus proche qui n’a pas encore été visité par la recherche. La distance principale est affectée comme distance d’accès aux points situés dans la distance principale d’un point. La distance principale d’un point est une mesure de la distance requise pour se rendre de chaque point jusqu’au nombre minimal d’entités défini.
  • Search distance unit (Unité de distance de recherche) indique les unités pour la valeur Search distance (Distance de recherche).
  • Le champ Time field (Champ temporel) est le champ de la couche en entrée qui contient un horodatage pour chaque entité. Ce paramètre est disponible si la valeur de Clustering method (Méthode d’agrégation) est Defined distance (DBSCAN) (Distance définie [DBSCAN]) ou Multi-scale (Optics) (Multi-échelle [OPTICS]). Si une valeur est spécifiée pour Time field (Champ temporel), vous devez également spécifier une valeur pour Search distance (Distance de recherche) et pour Search distance unit (Unité de distance de recherche).
  • Search time interval (Intervalle temporel de la recherche) correspond à l’intervalle temporel qui sera utilisé pour déterminer si les entités forment un agrégat spatio-temporel. L’intervalle temporel de recherche s’étend avant et après l’horodatage de chaque entité. Par exemple, un intervalle temporel de recherche de 3 jours autour d’une entité inclut toutes les entités dont le début se situe 3 jours avant et la fin 3 jours après l’horodatage de l’entité.
  • Search time unit (Unité de temps de la recherche) correspond aux unités pour les valeurs du champ Search time interval (Intervalle temporel de recherche).
  • Cluster Sensitivity (Sensibilité d’agrégation) indique de quelle manière la forme (à la fois la pente et la hauteur) des pics dans le diagramme d’accès sera utilisée pour séparer les agrégats. Le diagramme d’accès trace l’ordre d’accès des points et leur distance d’accès. Une valeur Cluster Sensitivity (Sensibilité d’agrégation) très élevée (proche de 100) traitera même les plus petits pics dans le diagramme d’accès en tant que séparation entre les agrégats. Une valeur Cluster Sensitivity (Sensibilité d’agrégation) très faible (proche de 0) traitera uniquement les pics les plus abrupts et élevés dans le diagramme d’accès en tant que séparation entre les agrégats. Si elle n’est pas indiquée, l’outil trouvera une valeur de sensibilité à l’aide de la divergence de Kullback-Leibler.

Couche de résultat

Le groupe Result layer (Couche de résultat) comprend les paramètres suivants :

  • Le paramètre Output name (Nom en sortie) spécifie le nom de la couche qui a été créée et est affichée. Le nom doit être unique. Si une couche du même nom existe déjà dans votre organisation, l’outil échoue et vous êtes invité à utiliser un autre nom.
  • Le paramètre Save in folder (Enregistrer dans un dossier) indique le nom d’un dossier de My content (Mon contenu) dans lequel est enregistré le résultat.

Environnements

Les paramètres d’environnement d’analyse sont des paramètres supplémentaires qui affectent les résultats d’un outil. Vous pouvez accéder aux paramètres d’environnement d’analyse de l'outil à partir du groupe de paramètres Environment settings (Paramètres d'environnement).

Cet outil respecte les environnements d'analyse suivants :

  • Système de coordonnées en sortie
  • Etendue de traitement
    Remarque :

    L’étendue de traitement par défaut correspond à l’étendue Full extent (Vue générale). Ce paramètre par défaut diffère de Map Viewer Classic, où Use current map extent (Utiliser l’étendue courante de la carte) est activé par défaut.

Crédits

Cet outil consomme des crédits.

Utilisez le paramètre Estimate credits (Estimer les crédits) pour calculer le nombre de crédits requis pour exécuter l’outil. Pour plus d’informations, reportez-vous à la rubrique Comprendre les crédits pour l’analyse spatiale.

Sorties

L’outil génère une couche ponctuelle en sortie. Si la valeur du paramètre Clustering Method (Méthode d’agrégation) est Self-adjusting (HDBSCAN) (Ajustement automatique [HDBSCAN]) ou Multi-scale (OPTICS) (Multi-échelle [OPTICS]), l’outil génère également un diagramme. La couche en sortie de toutes les options Clustering method (Méthode d’agrégation) inclura les champs Cluster ID, Source ID et Color ID. Le champ Cluster ID identifie l’agrégat auquel chaque point appartient. Les points de bruit ont la valeur -1. La valeur du champ Source ID est un identifiant unique. La valeur du champ Color ID représente la couleur attribuée à un point et son agrégat. Si la couche en sortie comporte plus de neuf agrégats, chaque couleur est attribuée à plusieurs agrégats. Néanmoins, des couleurs différentes sont attribuées aux agrégats voisins pour continuer de les distinguer visuellement. Si la valeur du paramètre Clustering method (Méthode d’agrégation) est Self-adjusting (HDBSCAN) (Ajustement automatique (HDBSCAN)), la couche ponctuelle en sortie contiendra les champs supplémentaires suivants :

  • Probability Est une valeur entre 0 et 1 qui indique la probabilité qu’un point appartienne à son agrégat attribué. Les points de bruit ont la valeur 0.
  • Outlier Est une valeur entre 0 et 1 qui indique si un point est susceptible d’être un point aberrant au sein de son propre agrégat. Les points de bruit sont considérés comme un seul agrégat. Une valeur élevée indique que le point est plus susceptible d’être un point aberrant.
  • Exemplar Est une valeur entre 0 et 1 qui indique si un point est particulièrement représentatif de son agrégat.
  • Stability Est une valeur qui reflète la persistance de chaque agrégat dans une plage d’échelles. Une valeur supérieure indique qu’un agrégat persiste sur une plage plus vaste d’échelles de distance.

Si la valeur du paramètre Clustering method (Méthode d’agrégation) est Multi-scale (OPTICS) (Multi-échelle (OPTICS)), la couche en sortie contiendra les champs supplémentaires suivants :

  • Reachability order est la façon dont les entités en entrée ont été triées pour l’analyse
  • Reachability distance est la distance entre chaque point et son voisin le plus proche qui n’a pas encore été visité.

Si la valeur du paramètre Clustering Method (Méthode d’agrégation) est Self-adjusting (HDBSCAN) (Ajustement automatique [HDBSCAN]) ou Multi-scale (OPTICS) (Multi-échelle [OPTICS]), l’outil génère un diagramme. Multi-scale (OPTICS) (Multi-échelle [OPTICS]) génère un diagramme d’accès qui peut servir à évaluer la densité de chaque agrégat. Self-adjusting (HDBSCAN) (Ajustement automatique [HDBSCAN]) génère une distribution du diagramme de probabilité d’appartenance, qui affiche la distribution de la probabilité qu’une entité appartienne à son agrégat attribué. Pour afficher le diagramme, cliquez sur Charts (Diagrammes) dans la barre d’outils Contents (Contenu).

Si une valeur est spécifiée pour Time field (Champ temporel), la sortie inclut un diagramme Time Span per Cluster (Période par agrégat) affichant la période de chaque agrégat spatio-temporel. Pour afficher le diagramme, cliquez sur Charts (Diagrammes) dans la barre d’outils Contents (Contenu). La couche en sortie inclut également les champs suivants qui synthétisent la période de l’agrégat auquel chaque point appartient :

  • Le champ Start Time (Date et heure de début) indique la date et l’heure de début de l’agrégat auquel appartient l’entité.
  • Le champ End Time (Date et heure de fin) indique la date et l’heure de fin de l’agrégat auquel appartient l’entité.
  • Le champ Mean Time (Temps moyen) indique le temps moyen de l’agrégat auquel appartient l’entité.
  • Exagération temporelle

Vous pouvez utiliser ces champs pour visualiser les agrégats spatio-temporels dans le temps en activant les propriétés temporelles sur la couche, puis en utilisant le curseur temporel.

Pour activer les propriétés temporelles sur la couche dans Map Viewer, cliquez sur Layers (Couches) dans la barre d’outils Contents (Contenu). Cliquez sur la couche. Dans la barre d’outils Settings (Paramètres), cliquez sur Properties (Propriétés). Développez le menu déroulant Information (Informations). Cliquez sur la couche sous Source Layer (Couche source). La page des éléments de la couche s’ouvre. Dans l’onglet Overview (Vue d’ensemble), cliquez sur Edit (Mettre à jour) sous Time Settings (Paramètres de temps). La fenêtre Time Settings (Paramètres de temps) s’ouvre. Cochez la case Activer le temps. Sélectionnez specific events in time (événements spécifiques dans le temps), puis sélectionnez Mean Time (Temps moyen) pour Time field (Champ temporel).

Pour activer les propriétés temporelles dans Scene Viewer, cliquez sur Layer Manager (Gestionnaire de couches) dans la barre d’outils Designer (Concepteur). Cliquez sur Options Outil Paramètres de la couche, puis cliquez sur Layer properties (Propriétés de la couche). Sous Time (Temps), activez le bouton d’activation/de désactivation Layer visibility period (Période de visibilité de la couche) pour étendre la période. Sous Start (Début), indiquez une date et une heure de début pour la visibilité de la couche. Sous End (Fin), indiquez une date et une heure de fin pour la visibilité de la couche.

Pour afficher plus de détails sur l’analyse, ouvrez le volet History (Historique) et recherchez l’exécution d’outil ayant abouti, puis cliquez dessus. Les détails de l’analyse apparaissent dans l’onglet Results (Résultats). L’onglet Results (Résultats) inclut davantage de détails sur l’analyse. Vous pouvez également consulter les détails supplémentaires sur la page des éléments de la couche. Cliquez sur le bouton d’options en regard de la couche en sortie, puis cliquez sur View details (Afficher les détails).

Remarque :

Dans ModelBuilder, vous pouvez uniquement afficher des détails supplémentaires sur l’analyse dans la page des éléments de la couche en sortie.

Licences requises

Cet outil requiert le type d’utilisateur et les configurations suivants :

  • Type d’utilisateur Creator, Professional ou Professional Plus
  • Rôle d’éditeur, de facilitateur ou d’administrateur, ou rôle personnalisé équivalent

Ressources

Référez-vous aux ressources suivantes pour en savoir plus :