Autocorrélation spatiale incrémentielle (Statistiques spatiales)

Synthèse

Permet de mesurer l'autocorrélation spatiale d'une série de distances et, en option, de créer une courbe de ces distances et des scores z correspondants. Les scores z reflètent l'intensité de l'agrégation spatiale. Les scores z maximum statistiquement significatifs indiquent les distances auxquelles les processus spatiaux favorisant l'agrégation sont les plus prononcés. Ces pics de distance sont souvent des valeurs dont l’utilisation est appropriée avec des outils comportant un paramètre Bande de distance ou Rayon de distance.

Illustration

Illustration de l’outil Autocorrélation spatiale incrémentielle
Les scores z maximum représentent des distances où les processus spatiaux qui favorisent l’agrégation sont les plus prononcés.

Utilisation

  • Utilisez cet outil afin de spécifier une valeur appropriée pour le paramètre Seuil de distance ou Rayon des outils qui proposent ces paramètres, tels que Analyse des points chauds ou Densité des points.

  • L'outil Autocorrélation spatiale incrémentielle mesure l'autocorrélation spatiale pour une série d'incréments de distance et indique, pour chacun d'entre eux, l'indice de Moran associé, l'indice attendu, la variance, le score z et la valeur p. Les valeurs apparaissent sous la forme de messages au fur et à mesure de l’exécution de l’outil. Les messages comportent également un diagramme linéaire Autocorrélation spatiale en fonction de la distance qui affiche le score z pour chaque distance.

  • En présence de plusieurs pics statistiquement significatifs, l'agrégation est prononcée à chacune de ces distances. Sélectionnez le pic de distance qui correspond le mieux à l'échelle d'analyse qui vous intéresse (il s'agit souvent du premier pic statistiquement significatif trouvé).

  • La valeur du paramètre Champ en entrée doit contenir différentes valeurs. Les formules mathématiques de cette statistique requièrent que la variable analysée fluctue quelque peu ; elle ne peut pas aboutir si toutes les valeurs en entrée sont égales à 1, par exemple. Pour utiliser cet outil afin d’analyser le modèle spatial de données d’incident, pensez à agréger les données d’incident.

  • Lorsque la valeur du paramètre Classe d’entités en entrée n’est pas projetée (c’est-à-dire, lorsque les coordonnées sont exprimées en degrés, minutes et secondes) ou que le système de coordonnées en sortie est un système de coordonnées géographiques, les distances sont calculées à l’aide des mesures à la corde. Les mesures de distance de corde sont utilisées, car elles sont rapides à calculer et produisent des évaluations fiables des distances géodésiques réelles, du moins pour les points se trouvant à environ 30 degrés les uns des autres. Les distances de corde reposent sur un sphéroïde aplati. Si l’on prend deux points sur la surface de la Terre, la distance de corde qui les sépare est la longueur d’une ligne qui traverse la Terre en trois dimensions pour relier ces deux points. Les distances à la corde sont exprimées en mètres.

    Attention :

    Veillez à projeter les données si la zone d’étude s’étend au-delà de 30 degrés. Les distances à la corde ne constituent pas une bonne estimation des distance géodésiques au-delà de 30 degrés.

  • Lorsque vous utilisez des distances de corde dans l’analyse, les valeurs des paramètres Distance de départ et Incrément de distance doivent être exprimées en mètres le cas échéant.

  • Pour les entités linéaires et surfaciques, les centroïdes d'entité sont utilisés dans les calculs de distance. Pour les multi-points, les polylignes ou les polygones comprenant plusieurs parties, le centroïde est calculé à l'aide du centre moyen pondéré de toutes les parties d'entité. La pondération pour les entités ponctuelles est de 1 ; pour les entités linéaires, elle correspond à la longueur et pour les entités surfaciques, à la superficie.

  • Les couches peuvent permettre de définir la classe d'entités en entrée. Lorsque vous utilisez une couche avec une sélection, seules les entités sélectionnées sont comprises dans l'analyse.

  • Dans le cas des entités surfaciques, il est recommandé de presque toujours spécifier la valeur Ligne pour le paramètre Standardisation par lignes. La standardisation par lignes limite les représentations incorrectes lorsque le nombre de voisins que chaque entité possède est une fonction du schéma d’agrégation ou du processus d’échantillonnage, au lieu de refléter la répartition spatiale réelle de la variable que vous analysez.

  • Si aucune valeur n’est spécifiée pour le paramètre Distance de départ, la valeur par défaut est la distance minimale requise pour que chaque entité du jeu de données ait au moins un voisin (distance maximale par rapport au voisin le plus proche parmi toutes les entités). Si le jeu de données inclut des points aberrants de localisation, il ne s’agit peut-être pas de la distance de départ la plus appropriée.

  • Si aucune valeur n’est indiquée pour le paramètre Incrément de distance, la plus petite des 2 valeurs suivantes est utilisée : la distance moyenne par rapport au voisin le plus proche ou (Td - B) / I, où Td est une distance de seuil maximale, B est la valeur du paramètre Distance de départ et I correspond à la valeur du paramètre Nombre de bandes de distance. Grâce à cet algorithme, les calculs sont toujours effectués pour la valeur spécifiée du paramètre Nombre de bandes de distance. Ainsi, les bandes de distance les plus larges ne sont jamais assez larges pour que certaines entités aient toutes ou presque toutes les autres entités comme voisins.

  • Si la valeur spécifiée pour le paramètre Distance de départ ou Incrément de distance produit une bande de distance plus large que la distance de seuil maximale, la valeur du paramètre Incrément de distance est automatiquement réduite. Pour éviter cet ajustement, vous pouvez diminuer la valeur spécifiée pour Incrément de distance ou pour Nombre de bandes de distance.

  • Vous risquez de manquer de mémoire lors de l’exécution de cet outil. Cela survient généralement lorsque les entités ont des milliers de voisins en raison de la valeur spécifiée pour le paramètre Distance de départ ou Incrément de distance. Il n’est pas recommandé de créer des relations spatiales lorsque les entités ont des milliers de voisins. Utilisez une valeur plus petite pour le paramètre Incrément de distance et supprimez temporairement les points aberrants de localisation pour pouvoir commencer avec une valeur de Distance de départ inférieure.

  • Même si l’outil calcule les valeurs des paramètres Distance de départ et Incrément de distance, le temps de traitement peut être long pour les jeux de données volumineux. Vous pouvez améliorer les performances en procédant comme suit :

    • Supprimez temporairement les points aberrants de localisation (comme indiqué ci-dessus).
    • Exécutez l’analyse sur les entités sélectionnées d’une portion représentative de la zone d’étude plutôt que sur toutes les entités.
    • Choisissez un échantillon aléatoire d’entités du jeu de données et exécutez l’analyse sur ces entités.

  • Les distances sont toujours basées sur le paramètre d'environnement Système de coordonnées en sortie. L’option par défaut du paramètre d’environnement Système de coordonnées en sortie est Identique à l’entrée. Les entités en entrée sont projetées sur le système de coordonnées en sortie avant l’exécution de l’analyse.

  • La valeur du paramètre facultatif Table en sortie indique la valeur de distance à chaque itération, la valeur de l’Indice de Moran, la valeur attendue de l’Indice de Moran, la variance, le score z et la valeur p. Un pic représente une augmentation de la valeur du score z suivie d'une diminution de cette même valeur. Par exemple, si l’outil trouve les scores z 2,95, 3,68 et 3,12 pour des distances de 50, 100 et 150 mètres, le pic correspond à 100 mètres. La table en sortie comporte également un diagramme linéaire Autocorrélation spatiale en fonction de la distance qui affiche le score z pour chaque distance que vous pouvez utiliser afin d’identifier les pics.

  • Lorsque vous utilisez cet outil depuis Python, l’objet de résultat renvoyé après l’exécution de l’outil comporte les sorties suivantes :

    PositionDescriptionType de données

    0

    Premier pic

    Double

    1

    Pic maximal

    Double

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Classe d'entités pour laquelle l'autocorrélation spatiale est mesurée sur une série de distances.

Feature Layer
Champ en entrée

Champ numérique utilisé pour évaluer l’autocorrélation spatiale.

Field
Nombre de bandes de distance

Nombre d’incrémentations de la taille du voisinage et d’analyses d’autocorrélation spatiale du jeu de données. Le point de départ et la taille de l’incrément sont respectivement spécifiés par les paramètres Distance de départ et Incrément de distance.

Long
Distance de départ
(Facultatif)

Distance à laquelle doit commencer l’analyse d’autocorrélation spatiale et distance à partir de laquelle commencer l’incrémentation. La valeur de ce paramètre doit être exprimée dans les mêmes unités que celles du paramètre d’environnement Système de coordonnées en sortie.

Double
Incrément de distance
(Facultatif)

Augmentation à appliquer à la distance après chaque itération. La distance utilisée dans l’analyse commence à la valeur spécifiée pour Distance de départ et augmente selon la valeur du paramètre Incrément de distance. La valeur de ce paramètre doit être exprimée dans les mêmes unités que celles du paramètre d’environnement Système de coordonnées en sortie.

Double
Méthode de distance
(Facultatif)

Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.

  • EuclidienLes distances sont calculées en ligne droite entre deux points (distance à vol d’oiseau). Il s’agit de l’option par défaut.
  • ManhattanLes distances sont calculées selon la distance entre deux points mesurée le long des axes à angle droit (îlot urbain), calculée en totalisant la différence (absolue) entre les coordonnées x et y.
String
Standardisation par lignes
(Facultatif)

Indique si les pondérations spatiales sont standardisées. La standardisation par lignes est recommandée chaque fois que la distribution des entités est potentiellement influencée par la conception de l’échantillonnage ou par une structure d’agrégation imposée.

  • Activé – Les pondérations spatiales sont standardisées. Chaque pondération est divisée par la somme des lignes (la somme des pondérations de toutes les entités voisines). Il s’agit de l’option par défaut.
  • Désactivé – Les pondérations spatiales ne sont pas standardisées.
Boolean
Table en sortie
(Facultatif)

Table créée avec chaque bande de distance et le résultat de score z associé.

Table
Fichier de rapport en sortie
(Facultatif)

Fichier .pdf créé, contenant un diagramme linéaire qui résume les résultats.

File

Sortie obtenue

ÉtiquetteExplicationType de données
Premier pic

Premier score z de pic.

Double
Pic maximal

Le score z de pic maximal.

Double

arcpy.stats.IncrementalSpatialAutocorrelation(Input_Features, Input_Field, Number_of_Distance_Bands, {Beginning_Distance}, {Distance_Increment}, {Distance_Method}, {Row_Standardization}, {Output_Table}, {Output_Report_File})
NomExplicationType de données
Input_Features

Classe d'entités pour laquelle l'autocorrélation spatiale est mesurée sur une série de distances.

Feature Layer
Input_Field

Champ numérique utilisé pour évaluer l’autocorrélation spatiale.

Field
Number_of_Distance_Bands

Nombre d’incrémentations de la taille du voisinage et d’analyses d’autocorrélation spatiale du jeu de données. Le point de départ et la taille de l’incrément sont respectivement spécifiés par les paramètres Beginning_Distance et Distance_Increment.

Long
Beginning_Distance
(Facultatif)

Distance à laquelle doit commencer l’analyse d’autocorrélation spatiale et distance à partir de laquelle commencer l’incrémentation. La valeur de ce paramètre doit être exprimée dans les mêmes unités que celles du paramètre d’environnement Système de coordonnées en sortie.

Double
Distance_Increment
(Facultatif)

Augmentation à appliquer à la distance après chaque itération. La distance utilisée dans l’analyse commence à la valeur spécifiée pour Beginning_Distance et augmente selon la valeur du paramètre Distance_Increment. La valeur de ce paramètre doit être exprimée dans les mêmes unités que celles du paramètre d’environnement Système de coordonnées en sortie.

Double
Distance_Method
(Facultatif)

Spécifie le mode de calcul des distances de chaque entité avec les entités voisines.

  • EUCLIDEANLes distances sont calculées en ligne droite entre deux points (distance à vol d’oiseau). Il s’agit de l’option par défaut.
  • MANHATTANLes distances sont calculées selon la distance entre deux points mesurée le long des axes à angle droit (îlot urbain), calculée en totalisant la différence (absolue) entre les coordonnées x et y.
String
Row_Standardization
(Facultatif)

Indique si les pondérations spatiales sont standardisées. La standardisation par lignes est recommandée chaque fois que la distribution des entités est potentiellement influencée par la conception de l’échantillonnage ou par une structure d’agrégation imposée.

  • ROW_STANDARDIZATIONLes pondérations spatiales sont standardisées. Chaque pondération est divisée par la somme des lignes (la somme des pondérations de toutes les entités voisines). Il s’agit de l’option par défaut.
  • NO_STANDARDIZATIONLes pondérations spatiales ne sont pas standardisées.
Boolean
Output_Table
(Facultatif)

Table créée avec chaque bande de distance et le résultat de score z associé.

Table
Output_Report_File
(Facultatif)

Fichier .pdf créé, contenant un diagramme linéaire qui résume les résultats.

File

Sortie obtenue

NomExplicationType de données
First_Peak

Premier score z de pic.

Double
Max_Peak

Le score z de pic maximal.

Double

Exemple de code

Exemple 1 d’utilisation de l’outil IncrementalSpatialAutocorrelation (fenêtre Python)

Le script ci-dessous pour la fenêtre Python illustre l’utilisation de la fonction IncrementalSpatialAutocorrelation.

import arcpy
arcpy.env.workspace = r"C:\ISA"
arcpy.stats.IncrementalSpatialAutocorrelation("911CallsCount.shp", "ICOUNT", 
                                              "20", "", "", "EUCLIDEAN",
                                              "ROW_STANDARDIZATION", 
                                              "outTable.dbf")
Exemple 2 d’utilisation de l’outil IncrementalSpatialAutocorrelation (script autonome)

Le script autonome Python ci-dessous illustre l’utilisation de la fonction IncrementalSpatialAutocorrelation.

# Hot Spot Analysis of 911 calls in a metropolitan area
# using the Incremental Spatial Autocorrelation and Hot Spot Analysis Tools

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables
workspace = r"C:\ISA"

try:
    # Set the current workspace (to avoid having to specify the full path to 
    # the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap together at 
    # 30 feet
    # Process: Copy Features and Integrate
    cf = arcpy.management.CopyFeatures("911Calls.shp", "911Copied.shp")
    integrate = arcpy.management.Integrate("911Copied.shp #", "30 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.stats.CollectEvents("911Copied.shp", "911Count.shp")

    # Use Incremental Spatial Autocorrelation to get the peak distance
    # Process: Incremental Spatial Autocorrelation
    isa = arcpy.stats.IncrementalSpatialAutocorrelation(ce, "ICOUNT", "20", "", 
                     "", "EUCLIDEAN", "ROW_STANDARDIZATION", "outTable.dbf", 
                     "outReport.pdf")

    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    distance = isa.getOutput(2)
    hs = arcpy.stats.HotSpots(ce, "ICOUNT", "911HotSpots.shp", "Fixed Distance Band",
                     "Euclidean Distance", "None",  distance, "", "")

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Environnements

Cas particuliers

Système de coordonnées en sortie

La géométrie de l'entité est projetée au système de coordonnées en sortie avant l'analyse. Tous les calculs mathématiques sont basés sur la référence spatiale du système de coordonnées en sortie. Lorsque le système de coordonnées en sortie est exprimé en degrés, minutes et secondes, les distances géodésiques sont estimées à l’aide de distances à la corde.