Dans le cas de nombreuses analyses de données spatiales, l’échelle de l’analyse est essentielle. Par exemple, la valeur par défaut du paramètre Conceptualisation des relations spatiales de l’outil Analyse des points chauds est une bande de distance fixe. Pour de nombreux outils de densité, vous devez indiquer une valeur de rayon. La distance que vous spécifiez doit être en rapport avec l’échelle du problème que vous tentez de résoudre ou celle de la solution que vous envisagez. Supposons, par exemple, que vous souhaitiez comprendre l’obésité infantile. Quelle est l’échelle d’analyse ? S'effectue-t-elle au niveau de la famille ou du quartier ? Si tel est le cas, la distance que vous utilisez pour définir l’échelle d’analyse est faible, couvrant des habitations situées à un ou deux pâtés de maisons les unes des autres. Et quelle sera l'échelle de la solution ? Le problème implique peut-être de déterminer où développer les activités sportives périscolaires afin de tenter de réduire l’obésité infantile. Dans ce cas, la distance reflète probablement des zones scolaires. Il est parfois facile de déterminer une échelle d’analyse appropriée. Si vous étudiez les déplacements domicile-travail et savez que le trajet moyen jusqu’au lieu de travail est de 12 km, par exemple, une distance de 12 km convient pour l’analyse. Mais il peut aussi être plus difficile de justifier une distance d'analyse spécifique. Dans ce cas, l’outil Autocorrélation spatiale incrémentielle est très utile.
Dès lors que vous remarquez une agrégation spatiale dans le paysage, vous voyez la preuve de l'existence de processus spatiaux sous-jacents. Si vous connaissez l'échelle spatiale utilisée par ces processus sous-jacents, il vous sera plus facile de sélectionner une distance d'analyse appropriée. L’outil Autocorrélation spatiale incrémentielle exécute l’outil Autocorrélation spatiale (Global Moran’s I) pour une série de distances croissantes, mesurant l’intensité de l’agrégation spatiale pour chacune d’elles. L'intensité de l'agrégation est déterminée par le score z obtenu. Au fur et à mesure que la distance augmente, le score z fait de même, indiquant l'intensification de l'agrégation. Cependant, à une certaine distance , le score z atteint généralement un pic. Il existe parfois plusieurs pics.
Les pics représentent des distances où les processus spatiaux qui favorisent l'agrégation sont les plus prononcés. La couleur de chaque point du graphique correspond à la signification statistique des valeurs des scores z.
Une stratégie d’identification de l’échelle d’analyse appropriée consiste à sélectionner la distance associée au pic statistiquement significatif qui reflète le mieux l’échelle du problème. Il s'agit souvent du premier pic statistiquement significatif.
Déterminer les valeurs des paramètres Distance de départ et Incrément de distance
Toutes les mesures de distance sont basées sur des centroïdes d’entités et la valeur par défaut du paramètre Distance de départ est la plus petite distance garantissant que chaque entité possède au moins une entité voisine. C’est en général un bon choix, sauf si le jeu de données inclut des points aberrants de localisation. Déterminez s’il existe ou non des points aberrants de localisation, puis sélectionnez toutes les entités de points aberrants et exécutez l’outil Autocorrélation spatiale incrémentielle uniquement sur les entités sélectionnées. Si vous obtenez un pic de distance pour l’ensemble de sélection, utilisez cette distance pour créer un fichier de matrice de pondérations spatiales basé sur toutes les entités (points aberrants inclus). Lorsque vous créez un fichier de matrice de pondérations spatiales à l’aide de l’outil Générer la matrice de pondérations spatiales, définissez le paramètre Nombre de voisins sur une valeur impliquant que toutes les entités aient au moins le nombre correspondant d’entités voisines.
La valeur par défaut du paramètre Incrément de distance est la distance moyenne entre chaque entité et son entité voisine la plus proche. Si vous avez déterminé une distance de départ appropriée à l'aide des stratégies décrites ci-dessus et si aucun pic de distance n'apparaît, essayez d'utiliser des incréments de distance plus faibles ou plus élevés.
Aucun pic de distance
Dans certains cas, vous pouvez utiliser l’outil Autocorrélation spatiale incrémentielle et obtenir un graphique avec un score z qui continue de croître au fur et à mesure que la distance augmente. Ce graphique ne comporte pas de pic. Cela se produit généralement lorsque des données ont été agrégées et que l’échelle des processus affectant la variable Champ en entrée est inférieure à celle de la structure d’agrégation. Vous pouvez essayer de réduire la valeur du paramètre Incrément de distance pour vérifier si cela permet de capturer des pics plus subtils. Toutefois, aucun pic n’apparaît si plusieurs processus spatiaux sont exécutés chacun à une distance différente dans la zone d’étude. Cela se produit souvent dans le cas de jeux de données ponctuelles volumineux et bruyants (où les valeurs de données ponctuelles que vous analysez ne présentent pas de distribution spatiale claire). Dans ce cas, vous devez justifier l’échelle d’analyse à l’aide d’autres critères.
Interpréter les résultats
Lorsque vous exécutez l’outil Autocorrélation spatiale incrémentielle, les résultats des scores z pour chaque distance apparaissent sous forme de messages. Pour accéder aux messages, passez le curseur de la souris sur la barre d’avancement et cliquez sur le bouton de menu contextuel ou développez la section des messages dans la fenêtre Géotraitement. Vous pouvez également accéder aux messages d’un outil précédemment exécuté via l’historique du géotraitement. Si vous spécifiez un chemin pour le paramètre facultatif Output Table (Table en sortie), une table incluant des champs pour les valeurs Distance, Indice de Moran, Indice attendu, Variance, z_score et p_value est créée.
En examinant le diagramme linéaire Autocorrélation spatiale en fonction de la distance et les valeurs des scores z indiquées dans les messages, vous pouvez identifier la présence de pics de distance. Dans l’image ci-dessous, le diagramme indique deux pics de scores z associés aux distances de 8 100 et 11 500 pieds.
Si vous utilisez le paramètre Table en sortie pour créer une table des valeurs d’autocorrélation, la table inclut le diagramme linéaire Autocorrélation spatiale en fonction de la distance. Il s’agit du même diagramme qui apparaît dans les messages.
Ressources supplémentaires
Pour plus d’informations, consultez les ressources suivantes :
- Vidéos expliquant les pratiques conseillées pour effectuer une analyse de points chauds :
- Le didacticiel Analyse d’un modèle spatial présente l’analyse des données de la dengue à l’aide de l’outil Autocorrélation spatiale incrémentielle.
- Consultez la section Sélection d’une bande de distance fixe dans la rubrique Modélisation de relations spatiales.
- La rubrique Fonctionnement de l’analyse de points chauds (Getis-Ord Gi*) explique comment déterminer une échelle d’analyse appropriée.
- Pour obtenir la liste actualisée de toutes les ressources disponibles relatives aux statistiques spatiales, consultez la page Spatial Statistics Resources.
Vous avez un commentaire à formuler concernant cette rubrique ?