Comparer les conceptualisations de voisinage (Statistiques spatiales)

Synthèse

Sélectionne la matrice de pondérations spatiales (SWM) parmi un ensemble de matrices candidates représentant le mieux les modèles spatiaux (comme les tendances ou les agrégats) d’un ou plusieurs champs numériques.

Le fichier de matrice de pondérations spatiales en sortie peut alors être utilisé dans les outils qui acceptent les fichiers .swm comme valeurs des paramètres Type de voisinage ou Conceptualisation des relations spatiales, tels que les outils Association spatiale bivariée (statistique L de Lee), Analyse de points chauds (Getis-Ord Gi*) et Analyse des valeurs aberrantes et des agrégats (indice local de Moran Anselin).

L’outil sélectionne la matrice de pondérations spatiales en créant des composantes spatiales (appelées vecteurs propres de Moran) à partir de chaque matrice de pondérations spatiales candidate et en testant la manière dont les composantes représentent efficacement les modèles spatiaux des champs en entrée.

En savoir plus sur les vecteurs propres de Moran

Illustration

Illustration de l’outil Comparer les conceptualisations de voisinage

Utilisation

  • L’outil a pour finalité de suggérer un type de voisinage et une structure de pondération (parfois désignés sous le nom de conceptualisation des relations spatiales) qui représentent le plus fidèlement les modèles spatiaux des champs en entrée. Pour y parvenir, il teste la pondération spatiale qui produit les composantes spatiales permettant de prévoir le plus précisément les valeurs des champs en entrée. Le principe qui régit cette règle est que chaque composante spatiale possède un modèle spatial et que les composantes susceptibles de prédire avec la plus grande précision les champs en entrée sont ceux qui sont dotés de modèles les plus similaires par rapport aux champs en entrée. Toutefois, la matrice de pondérations spatiales suggérée ne saurait remplacer les connaissances personnelles ni l’expertise en matière de données et de processus. Il convient de considérer un grand nombre de points lors de la sélection d’une matrice de pondérations spatiales dans le cadre d’une analyse et cet outil n’utilise que la capacité des composantes spatiales à prévoir les champs en entrée afin de déterminer la matrice de pondérations spatiales suggérée. Dans certains cas, comme avec l’outil Analyse de points chauds (Getis-Ord Gi*), vous disposez d’autres méthodologies pour sélectionner la matrice de pondérations spatiales, telles que la bande de distance qui maximise l’autocorrélation spatiale des données (il s’agit de la façon dont l’outil Analyse de points chauds optimisée détermine les voisins et les pondérations). Il est recommandé d’essayer d’autres méthodologies pour choisir les voisinages et les pondérations spatiales et d’utiliser la méthode la plus conforme aux objectifs de l’analyse.

  • Indiquez tous les champs dans le paramètre Champs en entrée que vous prévoyez d’utiliser dans une analyse ultérieure à l’aide du fichier .swm en sortie. Par example, l’outil Analyse de points chauds (Getis-Ord Gi*) ne requiert qu’un seul champ alors que l’outil Association spatiale bivariée (statistique L de Lee) en a besoin de deux. Vous pouvez indiquer le fichier .swm en sortie dans le paramètre Fichier de matrice de pondérations après avoir spécifié l’option Extraire les pondérations spatiales à partir du fichier pour le paramètre Type de voisinage ou Conceptualisation des relations spatiales des outils d’analyse suivants.

  • Les messages de géotraitement incluent la table Historique de recherche de voisinage qui donne des détails sur chaque matrice de pondérations spatiales testée (tels que le nombre de voisins et la structure de pondération) ainsi que la valeur R-carré ajusté de la matrice lorsqu’elle est utilisée pour prévoir les champs en entrée. La matrice de pondérations spatiales suggérée par l’outil correspond à celle qui compte la plus grande valeur R-carré ajusté. Elle est signalée par du texte en gras et un astérisque dans la table.

  • Afin de sélectionner la matrice de pondérations spatiales, l’outil génère une liste de matrices de pondérations spatiales candidates et effectue des tests pour identifier celle qui crée les composantes spatiales représentant le mieux les modèles spatiaux dans les champs en entrée. Si aucune matrice de pondérations spatiales n’est fournie dans le paramètre Fichiers de matrice de pondérations spatiales en entrée, 28 matrices de pondérations spatiales sont créées et incluses dans la liste des candidats (reportez-vous à la rubrique Comprendre les vecteurs propres de Moran pour une description de chaque matrice de pondérations spatiales). Si des matrices de pondérations spatiales en entrée sont fournies, vous pouvez utiliser le paramètre Comparer uniquement les matrices de pondérations spatiales en entrée pour choisir si la liste des candidats inclut uniquement les matrices de pondérations spatiales fournies ou si la liste des candidats inclut les matrices de pondérations spatiales fournies et les 28 matrices de pondérations spatiales créées par l’outil. Par exemple, pour utiliser une seule matrice de pondérations spatiales spécifiée, indiquez la matrice de pondérations spatiales dans le paramètre Fichiers de matrice de pondérations spatiales en entrée et laissez le paramètre Comparer uniquement les matrices de pondérations spatiales en entrée activé.

  • L’outil détermine la matrice suggérée à l’aide de la procédure suivante :

    1. Pour chaque matrice de pondérations spatiales, les vecteurs propres de Moran avec les valeurs propres les plus élevées (dont l’auto-corrélation est la plus forte) sont générés. Le nombre de vecteurs propres est égal à 25 pour cent du nombre d’entités et peut aller jusqu’à un maximum de 100.
    2. Tout vecteur propre détenant des valeurs d’indice de Moran négatives (c’est-à-dire dont l’autocorrélation est négative) est expurgé.
    3. Chaque champ en entrée est prévu de manière individuelle grâce aux vecteurs propres en tant que variables explicatives dans un modèle de régression Moindres carrés ordinaires.
    4. La somme totale des carrés et la somme résiduelle des carrés de tous les champs sont agrégées ; une valeur R-carré ajusté combinée est calculée.
    5. La matrice de pondérations spatiales avec la plus grande valeur R carré ajusté est renvoyée.

    Une description complète de cette procédure est disponible dans la référence suivante :

    • Bauman, David, Thomas Drouet, Marie-Josée Fortin et Stéphane Dray. 2018. "Optimizing the choice of a spatial weighting matrix in eigenvector-based methods." Ecology 99, no. 10: 2159-2166. https://doi.org/10.1002/ecy.2469.

Paramètres

ÉtiquetteExplicationType de données
Entités en entrée

Entités en entrée contenant les champs permettant de sélectionner le fichier SWM.

Feature Layer
Champs en entrée

Champs en entrée permettant de sélectionner le fichier SWM.

Field
Matrice de pondérations spatiales en sortie

Fichier .swm en sortie des voisins et pondérations sélectionnés par l’outil.

File
Champ d’ID unique

Champ d’ID unique du fichier .swm en sortie. Le champ doit être un entier et comporter une valeur unique pour chaque entité en entrée.

Field
Fichiers de matrice de pondérations spatiales en entrée
(Facultatif)

Fichiers .swm en entrée qui seront utilisés en tant que candidats pour la matrice de pondérations spatiales représentant le mieux les modèles spatiaux (comme les tendances ou les agrégats) d’un ou de plusieurs champs numériques. Si aucun fichier n’est indiqué, l’outil teste les 28 voisinages différents.

File
Comparer uniquement les matrices de pondérations spatiales en entrée
(Facultatif)

Indique si seuls les fichiers .swm fournis dans le paramètre Fichiers de matrice de pondérations spatiales en entrée doivent être testés ou s’il convient également de tester les 28 voisinages supplémentaires. L’outil utilise la matrice de pondérations spatiales qui crée les composantes spatiales représentant le mieux les modèles spatiaux (comme les tendances ou les agrégats) d’un ou de plusieurs champs numériques. Ce paramètre s’applique uniquement si au moins un fichier .swm en entrée est fourni.

  • Activé : seuls les fichiers .swm en entrée fournis dans le paramètre Fichiers de matrice de pondérations spatiales en entrée seront testés. Il s’agit de l’option par défaut.
  • Désactivé : les fichiers .swm en entrée fournis dans le paramètre Fichiers de matrice de pondérations spatiales et les 28 voisinages supplémentaires seront testés.
Boolean

arcpy.stats.CompareNeighborhoodConceptualizations(in_features, input_fields, out_swm, id_field, {in_swm}, {compare_only_inputs})
NomExplicationType de données
in_features

Entités en entrée contenant les champs permettant de sélectionner le fichier SWM.

Feature Layer
input_fields
[input_fields,...]

Champs en entrée permettant de sélectionner le fichier SWM.

Field
out_swm

Fichier .swm en sortie des voisins et pondérations sélectionnés par l’outil.

File
id_field

Champ d’ID unique du fichier .swm en sortie. Le champ doit être un entier et comporter une valeur unique pour chaque entité en entrée.

Field
in_swm
[in_swm,...]
(Facultatif)

Fichiers .swm en entrée qui seront utilisés en tant que candidats pour la matrice de pondérations spatiales représentant le mieux les modèles spatiaux (comme les tendances ou les agrégats) d’un ou de plusieurs champs numériques. Si aucun fichier n’est indiqué, l’outil teste les 28 voisinages différents.

File
compare_only_inputs
(Facultatif)

Indique si seuls les fichiers .swm fournis dans le paramètre in_swm doivent être testés ou s’il convient également de tester les 28 voisinages supplémentaires. L’outil utilise la matrice de pondérations spatiales qui crée les composantes spatiales représentant le mieux les modèles spatiaux (comme les tendances ou les agrégats) d’un ou de plusieurs champs numériques. Ce paramètre s’applique uniquement si au moins un fichier .swm en entrée est fourni.

  • COMPARE_INPUTSSeuls les fichiers .swm en entrée indiqués dans le paramètre in_swm seront testés. Il s’agit de l’option par défaut.
  • COMPARE_ALLLes fichiers .swm en entrée indiqués dans le paramètre in_swm ainsi que les 28 voisinages supplémentaires seront testés.
Boolean

Exemple de code

Exemple 1 d’utilisation de la fonction CompareNeighborhoodConceptualizations (fenêtre Python)

Le script de fenêtre Python ci-dessous illustre l’utilisation de la fonction CompareNeighborhoodConceptualizations :

# Select the spatial weights matrix (SWM) that best describes the 
# spatial patterns of POP_SQMI.

arcpy.env.workspace = r"c:\data\project_data.gdb"

arcpy.stats.CompareNeighborhoodConceptualizations(
    in_features="states",
    input_fields="POP_SQMI",
    out_swm=r"c:\data\states.swm",
    id_field="unique_id_field"
)
Exemple 2 d’utilisation de la fonction CompareNeighborhoodConceptualizations (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction CompareNeighborhoodConceptualizations :

# Select the spatial weights matrix (SWM) that best describes 
# the spatial patterns of two analysis field. 

import arcpy

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb"

# Run the tool.
arcpy.stats.CompareNeighborhoodConceptualizations(
    in_features="myFeatureClass",
    input_fields="myAnalysisField1;myAnalysis Field2",
    out_swm=r"myOutputSWM.swm",
    id_field="myUniqueIDField"
)

# Print the tool messages.
print(arcpy.GetMessages())

Environnements

Cet outil n’utilise pas d’environnement de géotraitement.

Rubriques connexes