Trouver des points aberrants

L’outil Find Outliers (Rechercher des points aberrants) identifie des points chauds, des points froids et des points aberrants spatiaux statistiquement significatifs à l’aide de l’outil statistique Anselin Local Morans.

Exemple

Un commissariat de police souhaite identifier les zones de sa circonscription dans lesquelles le taux de cambriolage est régulièrement particulièrement élevé. Il utilise l’outil Find Outliers (Rechercher des points aberrants) pour identifier les rues qui sont des points chauds et les points aberrants présentant des valeurs élevées. Les policiers utilisent les résultats pour élaborer des stratégies de prévention, allouer les ressources déjà rares et lancer des programmes de surveillance des quartiers concernés.

Remarques sur l’utilisation

L’outil Rechercher des points aberrants inclut des configurations pour les entités en entrée, les paramètres des points aberrants et la couche de résultat.

Entités en entrée

Le groupe Input features (Entités en entrée) inclut le paramètre Input layer (Couche en entrée), qui représente la couche ponctuelle ou surfacique sur laquelle une analyse d’agrégats et de valeurs aberrantes sera effectuée.

Pour les entités en entrée, le nombre d’entités est affiché sous le nom de la couche. Ce nombre inclut toutes les entités de la couche, à l’exception des entités supprimées à l’aide d’un filtre. Les paramètres d’environnement, comme Processing extent (Étendue de traitement), ne sont pas comptabilisés dans le nombre d’entités.

Remarque :

La projection Web Mercator ne convient pas pour l’analyse spatiale. Si le système de référence spatiale de la couche en entrée est WGS 1984 Web Mercator (Sphère auxiliaire), les données sont converties en système de coordonnées géographiques pour utiliser les distances de corde dans l’analyse.

Paramètres des points aberrants

Le groupe Outlier settings (Paramètres des points aberrants) comprend les paramètres suivants :

  • Le paramètre Variable type (Type de variable) détermine si l’analyse est effectuée sur les valeurs ou sur les nombres d’entités. Les options sont les suivantes :
    • Field (Champ) : l’analyse est appliquée aux valeurs du champ spécifié par le paramètre Analysis field (Champ d’analyse).
    • Point counts (Nombre de points) : les entités ponctuelles sont agrégées en polygones ou en cellules et comptées. L’analyse est ensuite appliquée aux nombres de points agrégés. Cette option est disponible si la couche en entrée est une couche d’entités ponctuelles.
    Remarque :

    Variable type (Type de variable) n’est pas disponible dans ModelBuilder.

  • Aggregation shape type (Type de forme d’agrégation) spécifie la forme des cellules au sein des entités ponctuelles qui sont agrégées. Ce paramètre est disponible lorsque l’option Point counts (Nombre de points) est spécifiée pour le paramètre Variable type (Type de variable). Les options de forme disponibles sont les suivantes :
    • Fishnet cells (Cellules de quadrillage) : les entités ponctuelles sont agrégées en cellules (carrées) de quadrillage.
    • Hexagon cells (Cellules hexagonales) : les entités ponctuelles sont agrégées en cellules hexagonales.
    • Polygon layer (Couche surfacique) : les entités ponctuelles sont agrégées en entités surfaciques spécifiées par le paramètre Aggregation polygon layer (Couche surfacique d’agrégation).
  • L’option Aggregation polygon layer (Couche surfacique d’agrégation) désigne la couche qui contient les entités surfaciques dans lesquelles les points vont être agrégés. Ce paramètre est disponible lorsque l’option Polygon layer (Couche surfacique) est spécifiée pour le paramètre Aggregation shape type (Type de forme d’agrégation).
  • Le paramètre Define where points are possible (Définir où des points sont possibles) spécifie la couche qui va définir l’étendue de l’analyse. Vous pouvez choisir une couche à l’aide du bouton Layer (Couche) ou utiliser le bouton Draw input features (Dessiner des entités en entrée) pour créer une couche de dessin à utiliser comme entrée. Les points tombant en dehors des limites de la couche ne sont pas inclus dans l’analyse. Ce paramètre est disponible lorsque l’option Fishnet cells (Cellules de quadrillage) ou Hexagon cells (Cellules d’hexagone) est spécifiée pour le paramètre Aggregation shape type (Type de forme d’agrégation).
    Remarque :

    Draw input features (Dessiner des entités en entrée) n’est pas disponible dans ModelBuilder.

  • Analysis field (Champ d’analyse) correspond au champ qui va être analysé dans le but de déterminer les points aberrants. Ce paramètre est disponible lorsque l’option Field (Champ) est spécifiée pour le paramètre Variable type (Type de variable).
  • Le paramètre Divide by (Diviser par) indique la façon dont les valeurs sont divisées dans le champ d’analyse ou les nombres de points agrégés. Les options sont les suivantes :
    • Field (Champ) : champ de la couche en entrée ou de la couche surfacique d’agrégation (le cas échéant) qui sera utilisé pour diviser les valeurs du champ d’analyse ou le nombre de points.
    • Enrichment data (Données d’enrichissement) : les entités ou la forme d’agrégation sont enrichies avec des données démographiques Esri, puis les valeurs du champ d’analyse ou les nombres de points agrégés sont divisés par la population, si le paramètre Esri Population (Population Esri) est indiqué. La source des données démographiques Esri est Esri Demographics Global Coverage. Cette option utilise ArcGIS GeoEnrichment Service et consomme des crédits supplémentaires.
      Remarque :

      Enrichment data (Enrichissement des données) n’est pas disponible dans ModelBuilder.

  • Optimization option (Option d’optimisation) indique si le nombre de permutations sélectionné va servir à optimiser les performances de l’outil (Speed (Vitesse)), la précision de la pseudo valeur p (Precision (Précision)) ou les deux (Balance (Équilibre)). Les entités voisines d’une entité cible seront permutées pour évaluer la valeur Local Morans I et déterminer la probabilité de découvrir la distribution spatiale observée autour d’une entité cible. La permutation réorganise les entités voisines d’une entité cible de manière aléatoire, puis calcule une valeur Local Morans I. Plusieurs permutations résultent en une distribution des valeurs Local Morans I pour une entité cible. La pseudo valeur p est ensuite calculée en comparant la valeur Local Morans I à la distribution des valeurs Local Morans I. Les options d’optimisation disponibles sont les suivantes :
    • Speed (Vitesse) : exécute 199 permutations pour optimiser la vitesse d’exécution de l’outil. La plus petite pseudo valeur p possible est 0,005.
    • Balance (Équilibre) : exécute 499 permutations pour optimiser à la fois la vitesse et la précision. La plus petite pseudo valeur p possible est 0,002.
    • Precision (Précision) : exécute 999 permutations pour optimiser la précision de la pseudo valeur p. La plus petite pseudo valeur p possible est 0,001.
  • Random number seed (Valeur initiale des nombres aléatoires) est une valeur entière qui lance un générateur de nombres aléatoires. Le générateur de nombres aléatoires sera utilisé pour permuter les entités voisines de chaque entité cible avant le calcul d’une valeur Local Morans I.
    Remarque :

    Random number seed (Valeur initiale des nombres aléatoires) n’est pas disponible dans ModelBuilder. La valeur est sélectionnée de manière aléatoire à chaque exécution de l’outil. Si vous exécutez de nouveau l’outil, les résultats peuvent être sensiblement différents en raison de la valeur initiale des nombres différente.

  • Cell size (Taille de cellule) est une valeur numérique qui définit la longueur d’un côté de chaque cellule.
  • Cell size unit (Unité de taille de cellule) spécifie l’unité qui sera utilisée pour la taille de cellule. Les unités prises en charge sont le pied, le mile, le mètre et le kilomètre.
  • Distance band (Bande de distance) est une valeur numérique qui définit la distance à partir d’une entité cible à inclure dans le voisinage d’une entité cible. Toutes les entités se trouvant dans cette bande de distance sont incluses dans le voisinage de l’entité cible. Tout le voisinage est utilisé pour déterminer si l’entité cible fait partie d’un agrégat avec des valeurs faibles ou élevées et si l’entité est un point aberrant.
  • Distance band unit (Unité de bande de distance) indique l’unité dans laquelle est exprimée la bande de distance. Les unités prises en charge sont le pied, le mile, le mètre et le kilomètre.

Couche de résultat

Le groupe Result layer (Couche de résultat) comprend les paramètres suivants :

  • Le paramètre Output name (Nom en sortie) spécifie le nom de la couche qui a été créée et est affichée. Le nom doit être unique. Si une couche du même nom existe déjà dans votre organisation, l’outil échoue et vous êtes invité à utiliser un autre nom.
  • Le paramètre Save in folder (Enregistrer dans un dossier) indique le nom d’un dossier de My content (Mon contenu) dans lequel est enregistré le résultat.

Limitations

Les limitations suivantes s’appliquent à l'outil :

  • Si le paramètre Variable type (Type de variable) a la valeur Point counts (Nombre de points), les limites suivantes s’appliquent :
    • La couche en entrée doit contenir au moins 60 entités ponctuelles.
    • Au minimum, 30 polygones ou cellules d’agrégation doivent contenir au moins une entité ponctuelle.
    • Les nombres de points contenus dans des polygones ou des cellules d’agrégation ne peuvent pas être identiques. Les nombres de points contenus dans des polygones ou des cellules d’agrégation doivent être différents.
  • Si le paramètre Variable type (Type de variable) a la valeur Analysis field (Champ d’analyse), les limites suivantes s’appliquent :
    • Au minimum, 30 entités doivent contenir des valeurs non nulles dans le champ d’analyse spécifié.
    • Les valeurs du champ d’analyse spécifié ne doivent pas être identiques. Les valeurs doivent être différentes.
  • Au minimum, 30 points doivent se trouver dans la zone délimitante spécifiée par la valeur Define where points are possible (Définir où des points sont possibles).
  • La valeur de la taille de cellule ne peut pas dépasser celle de la bande de distance.
  • La disponibilité des données démographiques Esri dépend de la localisation des entités en entrée.
  • Les données démographiques Esri ne sont pas disponibles pour le paramètre Divide by (Diviser par) si un GeoEnrichment Service personnalisé est configuré dans votre organisation.
  • Le bouton Draw input features (Dessiner des entités en entrée) n’est pas disponible dans Scene Viewer.

Environnements

Les paramètres d’environnement d’analyse sont des paramètres supplémentaires qui affectent les résultats d’un outil. Vous pouvez accéder aux paramètres d’environnement d’analyse de l'outil à partir du groupe de paramètres Environment settings (Paramètres d'environnement).

Cet outil respecte les environnements d'analyse suivants :

  • Système de coordonnées en sortie
  • Etendue de traitement
    Remarque :

    L’étendue de traitement par défaut correspond à l’étendue Full extent (Vue générale). Ce paramètre par défaut diffère de Map Viewer Classic, où Use current map extent (Utiliser l’étendue courante de la carte) est activé par défaut.

Crédits

Cet outil consomme des crédits.

Utilisez le paramètre Estimate credits (Estimer les crédits) pour calculer le nombre de crédits requis pour exécuter l’outil. Pour plus d’informations, reportez-vous à la rubrique Comprendre les crédits pour l’analyse spatiale.

Sorties

L’outil génère une couche avec les résultats de l’analyse des points aberrants et des agrégats. La couche inclut des champs pour le nombre, un type agrégat-point aberrant, une valeur Local Morans I, une valeur p, un score z, le nombre d’entités voisines, la classe de distance spatiale et la transformation z de chaque entité. Le champ de type agrégat-point aberrant fait la distinction entre un agrégat statistiquement significatif de valeurs élevées (HH), un agrégat de valeurs faibles (LL), un point aberrant de valeur élevée entouré de valeurs faibles (HL), un point aberrant de valeur faible entouré de valeurs élevées (LH) et un résultat non significatif (NS). La valeur Local Morans I indique si l’entité et ses voisines ont des valeurs semblables (positives) ou dissemblables (négatives). Les points aberrants présentent un indice Local Morans négatif.

Pour afficher plus de détails sur l’analyse, ouvrez le volet History (Historique) et recherchez l’exécution d’outil ayant abouti, puis cliquez dessus. Les détails de l’analyse apparaissent dans l’onglet Results (Résultats). L’onglet Results (Résultats) inclut davantage de détails sur l’analyse. Vous pouvez également consulter les détails supplémentaires sur la page des éléments de la couche. Cliquez sur le bouton d’options en regard de la couche en sortie, puis cliquez sur View details (Afficher les détails).

Remarque :

Dans ModelBuilder, vous pouvez uniquement afficher des détails supplémentaires sur l’analyse dans la page des éléments de la couche en sortie.

Licences requises

Cet outil requiert le type d’utilisateur et les configurations suivants :

  • Type d’utilisateur Creator, Professional ou Professional Plus
  • Rôle d’éditeur, de facilitateur ou d’administrateur, ou rôle personnalisé équivalent

Le privilège GeoEnrichment est requis pour utiliser les données de population Esri.

Ressources

Référez-vous aux ressources suivantes pour en savoir plus :