Toutes les comparaisons sont établies par comparaison des catégories de niveau de signification (point chaud à 99 %, 95 % et 90 %, non significatif, point froid à 90 %, 95 % et 99 %) entre les entités correspondantes et leurs voisins dans les deux couches en entrée. La similarité mesure le degré d’alignement spatial des points chauds, des points froids et des zones non significatives des deux résultats de points chauds. L’association (ou la dépendance) mesure la force de la relation statistique sous-jacente entre les variables de point chaud (comparable à la corrélation pour les variables continues) La distinction entre la similarité et l’association est importante. En effet, il est courant que deux résultats de points chauds présentent une très forte similarité (nombreuses entités correspondantes et leurs voisins ayant le même niveau de signification) avec toutefois une faible association ou dépendance. En d’autres termes, malgré la similarité des niveaux de signification, les tentatives d’influence d’une variable (notamment les mesures d’atténuation) n’auront aucun effet sur l’autre variable. Il est fréquent d’obtenir des résultats très similaires, mais dissociés, lorsque les deux résultats de points chauds sont dominés par une seule catégorie (« non significatif », par exemple) ou lorsqu’ils comportent tous les deux des agrégats d’entités importants avec le même niveau de signification.
La similarité entre les résultats de points chauds est mesurée par une valeur de similarité comprise entre 0 et 1. Dans le cas où de nombreuses entités correspondantes des deux résultats ont le même niveau de signification, la valeur est proche de 1. Dans le cas où de nombreuses entités correspondantes n’ont pas les mêmes niveaux de signification, la valeur est proche de 0. L’association est mesurée par une valeur Kappa : les résultats fortement associés ont des valeurs Kappa proches de 1, et les résultats dissociés (indépendants) ont des valeurs Kappa proches de 0 (ou légèrement négatives). La valeur Kappa est une version redimensionnée de la valeur de similarité, qui prend en compte l’agrégation spatiale et les fréquences de catégorie pour isoler l’association statistique entre les résultats de points chauds. Ces deux valeurs utilisent l’appartenance à un ensemble flou pour autoriser les correspondances partielles entre les entités correspondantes, en fonction de la similarité du niveau de signification et des voisinages spatiaux. Par exemple, les points chauds à 99 % peuvent être considérés comme des correspondances parfaites d’autres points chauds à 99 %, des correspondances partielles de points chauds à 95 % et des non-correspondances complètes de points froids à 99 %. Deux entités correspondantes peuvent également être considérées comme des correspondances partielles lorsqu’elles ont un niveau de signification différent mais que leurs entités voisines ont le même niveau de signification.
L’outil calcule une valeur de similarité globale et une valeur Kappa globale pour mesurer l’ensemble de la similarité et de l’association entre les résultats de points chauds, et les versions locales sont également calculées pour chaque paire d’entités correspondantes. Cela vous permet de cartographier les comparaisons pour examiner les zones avec une valeur de similarité ou d’association supérieure ou inférieure aux valeurs globales. Les entités en sortie comportent également des diagrammes et une symbologie personnalisée qui mettent en évidence les zones où les résultats de points chauds sont les plus dissemblables et synthétisent les paires de niveaux de signification de toutes les entités correspondantes.
Les valeurs des paramètres Résultat des points chauds en entrée 1 et Résultat des points chauds en entrée 2 doivent être les entités en sortie des outils Hot Spot Analysis (Getis-Ord Gi*) ou Analyse de points chauds optimisée. Chaque entité de chaque résultat doit être appariée à une seule entité de l’autre résultat pour qu’il soit possible de comparer leurs catégories de niveau de signification. Si les entités des deux résultats de points chauds en entrée ne sont pas alignées spatialement (comme les polygones qui n’ont pas les mêmes bordures), les deux couches d’entités seront intersectées avant l’analyse, et les comparaisons porteront sur les intersections des entités. Faites attention lorsque les deux résultats de points chauds sont des polygones de tailles différentes, car l’intersection va subdiviser les grands polygones en plusieurs polygones plus petits et changer les fréquences des catégories de niveau de signification. Au moins 20 intersections d’entités sont nécessaires pour utiliser l’outil.
Les résultats des comparaisons sont renvoyés par le biais de messages de géotraitement, d’un groupe de couches de la classe d’entités en sortie et de diagrammes.
Les messages affichent des informations sur les comparaisons globales entre les résultats de points chauds. Les messages présentent les informations suivantes :
- Valeur de similarité - Valeur comprise entre 0 et 1 qui mesure la similarité globale entre les couches de résultats de points chauds. Cette valeur peut être interprétée comme une probabilité floue qu’une paire d’entités correspondantes partage la même catégorie de niveau de signification.
- Valeur de similarité attendue - Valeur attendue de la similarité, en partant du principe que les deux couches de résultats de points chauds sont dissociées (indépendantes). Si la valeur de similarité est supérieure à sa valeur attendue, cela suggère une dépendance sous-jacente entre les deux cartes. Il s’agit d’une valeur à caractère essentiellement informationnel, qui est utilisée pour mettre à l’échelle la valeur de similarité lors du calcul de la valeur Kappa. La valeur est calculée par l’appariement de chaque entité avec des entités aléatoires dans l’autre résultat de points chauds et par le calcul de la similarité. En appariant chaque entité à des entités aléatoires (plutôt que son entité correspondante), la valeur attendue est ajustée spatialement pour tenir compte de l’agrégation spatiale et des fréquences de catégorie dans les deux résultats de points chauds. Le paramètre Nombre de permutations indique le nombre d’appariements aléatoires de chaque entité, et la valeur de similarité attendue est la moyenne des valeurs de similarité des permutations.
- Kappa flou spatial - Mesure de l’association entre les variables d’analyse des points chauds qui est calculée par la mise à l’échelle de la valeur de similarité par sa valeur attendue. Les résultats de points chauds qui sont parfaitement associés ont la valeur 1, et les résultats dissociés (indépendants) ont une valeur proche de 0. Les valeurs négatives indiquent une relation négative entre les variables d’analyse des points chauds. Bien qu’il n’existe pas de limite inférieure pour cette valeur, elle est rarement inférieure à -3 en pratique.
- Synthèses des pondérations entre chaque paire de niveaux de signification des points chauds.
- Tables de messages affichant les nombres totaux et les pourcentages de chaque paire de niveaux de signification des points chauds. Dans les tables, les nombres totaux et les pourcentages des niveaux de signification de la seconde couche de résultats de points chauds sont répartis suivant les catégories de la première couche de résultats. Par exemple, parmi les points chauds significatifs à 90 % de la première couche de résultats, vous pouvez voir le nombre total et le pourcentage de points chauds de la seconde couche de résultats qui sont également significatifs à 90 %, ainsi que les nombres totaux et pourcentages pour toutes les autres catégories de niveau de signification. Ce type d’affichage est particulièrement utile lorsque les deux résultats de points chauds représentent la même variable mesurée à différents moments. En l’occurrence, la table vous permet d’observer la transition dans le temps des catégories entre les mesures.
Les entités en sortie contiennent les champs de la valeur de similarité, de la valeur de similarité attendue, de la valeur Kappa et des catégories de niveau de signification pour chaque paire d’entités correspondantes. À l’exécution de l’outil sur une carte, trois couches sont ajoutées à un groupe de couches pour vous permettre d’examiner spatialement la similarité, l’association et les paires de niveaux de signification. La première couche affiche les valeurs de similarité classées selon cinq intervalles égaux compris entre 0 et 1, les valeurs de similarité plus faibles étant représentées dans des couleurs plus foncées de manière à faire ressortir les zones qui sont les plus dissemblables. La deuxième couche présente les valeurs de Kappa flou spatial, symbolisées avec des intervalles égaux et six classes. La troisième couche affiche chaque combinaison de niveaux de signification avec une symbologie personnalisée pour vous permettre d’identifier les entités dont un résultat de point chaud en entrée était un point chaud statistiquement significatif et l’autre était un point froid statistiquement significatif (la symbologie personnalisée ne fait pas la distinction entre les niveaux de signification de 90 %, 95 % et 99 % pour réduire le nombre de combinaisons).
La dernière couche comporte également un diagramme de densité et un diagramme à barres personnalisé pour approfondir l’examen des paires de niveaux de signification. Ces diagrammes affichent les mêmes informations que les tables figurant dans les messages, mais les diagrammes sont colorés en fonction des nombres totaux et des pourcentages pour en faciliter l’interprétation. Vous pouvez également utiliser des sélections entre les diagrammes et la carte pour notamment sélectionner toutes les entités qui étaient des points chauds à 99 % dans un résultat et des points froids à 99 % dans l’autre résultat, indiquant ainsi les plus importantes différences possibles.
En savoir plus sur les sorties de l’outil
Le paramètre Méthode de pondération de la similarité définit la similarité entre chaque combinaison de catégories de niveau de signification selon l’appartenance à un ensemble flou. Chaque pondération est une valeur comprise entre 0 et 1, qui indique dans quelle mesure les catégories sont traitées comme similaires dans les comparaisons. Par exemple, vous pouvez définir un facteur de pondération de 0,75 entre les catégories de points chauds à 99 % et celles à 95 % pour indiquer qu’elles ne sont pas exactement identiques, mais qu’elles présentent plus de similitudes que de différences.
L’option Pondérations floues par défaut pondère les catégories par la proximité du niveau de signification (déterminée par des ratios de valeurs critiques). D’autres options vous permettent de combiner les catégories en leur attribuant une valeur de pondération de 1 entre elles. Par exemple, l’option Combiner les niveaux de signification de 95 % et 99 % combine les points chauds à 99 % et 95 % en une seule catégorie, combine les points froids à 99 % et 95 % et combine les points chauds à 90 %, les points non significatifs et les points froids à 90 %. Cette option traite tous les points chauds (ou froids) d’un niveau de signification égal ou supérieur à 95 % comme étant identiques (statistiquement significatifs) et toutes les entités d’un niveau de signification inférieur à 95 % comme étant identiques (non significatifs statistiquement). Cela est utile lorsque vous avez l’intention de réaliser les deux analyses de points chauds avec un niveau de signification de 95 %, et que vous voulez traiter tous les points chauds et froids significatifs à 90 % comme des points non significatifs. L’option Inverser les relations des points chauds et froids attribue des pondérations de similarité élevées entre les points chauds et froids. Par exemple, les points chauds à 99 % sont considérés comme parfaitement semblables aux points froids à 99 % et complètement dissemblables des autres points chauds à 99 %. Cette option est utile pour mesurer la similarité et l’association entre des variables ayant une relation négative (par exemple, dans une comparaison des points chauds de la mortalité infantile avec les points froids du revenu médian).
L’option Pondérations personnalisées permet de définir des pondérations de similarité personnalisées pour fusionner des catégories et définir vos préférences. Vous pouvez indiquer les pondérations personnalisées dans le champ du paramètre Pondérations de similarité personnalisées. Ce paramètre se présente sous la forme d’une matrice contextuelle composée de 49 combinaisons de niveaux de signification (7 x 7). Pour définir une pondération entre une paire de catégories, saisissez la valeur dans la cellule correspondante et appuyez sur la touche Entrée. Vous pouvez exporter les pondérations personnalisées dans une table, à partir de la boîte de dialogue contextuelle, pour les réutiliser avec l’option Extraire les pondérations à partir de la table.
Les pondérations de similarité affectent uniquement le calcul de la valeur de similarité et de la valeur Kappa. Même si les catégories de niveau de signification sont combinées selon des pondérations de similarité, les tables de messages, la symbologie de la couche en sortie et les diagrammes les traitent comme des catégories distinctes.
En savoir plus sur la similarité catégorielle
Lorsque des proportions importantes de chaque résultat de points chauds ne sont pas significatives, la valeur de similarité est élevée en raison de l’appariement des zones non significatives. Toutefois, si les entités non significatives ne présentent pas d’intérêt pour les recherches, vous pouvez ne pas souhaiter que la valeur de similarité et la valeur Kappa reflètent uniquement les nombreuses zones non significatives dans les deux résultats. Vous pouvez utiliser le paramètre Exclure les entités non significatives pour exclure toute paire d’entités correspondantes des comparaisons dès lors que les deux résultats de points chauds ne sont pas significatifs statistiquement. Le cas échéant, l’outil calcule des valeurs de similarité et Kappa conditionnelles qui ne comparent que les points chauds et froids statistiquement significatifs. L’exclusion des entités non significatives des calculs vous permet de calculer les valeurs de similarité et Kappa uniquement parmi les points chauds et froids statistiquement significatifs, de manière à refléter leur similarité et leur association avec exactitude.
Si des catégories de niveau de signification sont combinées avec la catégorie non significative par l’attribution d’une pondération de similarité relative de 1, ces catégories sont exclues des comparaisons également.
Si l’une des couches de résultat de points chauds en entrée contient des polygones superposés, les superpositions sont intersectées dans les nouvelles entités. En conséquence, les valeurs de similarité peuvent être différentes de 1 même pour les couches de résultat avec des catégories de niveau de signification identiques. Utilisez l’environnement Tolérance XY pour supprimer les superpositions involontaires, telles que les erreurs de géocodage. Il est recommandé d’examiner le nombre d’entités dans les entités en sortie pour établir si les intersections sont plus nombreuses que prévu.
Le paramètre Nombre de voisins indique le nombre d’entités voisines supplémentaires à utiliser pour la similarité de distance. À l’instar de la méthode de pondération de la similarité, la similarité de distance accepte les correspondances partielles lorsque les entités ont un niveau de signification différent, mais que d’autres entités de leur voisinage ont le même niveau de signification. Du fait que l’analyse des points chauds est une méthode spatiale qui utilise les voisinages locaux, le niveau de signification de chaque entité est une caractérisation des valeurs de l’entité et de ses voisins les plus proches, pas simplement de l’entité. En ce sens, si une entité voisine est similaire, elle doit contribuer dans une certaine mesure à la similarité de ses voisins.
La similarité partielle par les voisins est incorporée au moyen d’une pondération de distance basée sur le classement des voisins. L’entité reçoit une pondération de distance de 1, et les pondérations diminuent uniformément pour chaque voisin supplémentaire. La similarité globale entre deux entités est leur similarité catégorielle (selon la méthode de pondération de la similarité) multipliée par leur similarité de distance.
En savoir plus sur la similarité de distance et la pondération des voisins
Le changement de l’ordre des résultats de points chauds en entrée n’a aucune incidence sur les valeurs de similarité, mais il a pour effet de modifier légèrement la valeur de similarité attendue et la valeur Kappa en raison du caractère aléatoire des permutations. Les axes des tables de messages et des diagrammes sont également inversés, ce qui va rendre leur interprétation plus aisée dans certains cas. Comme les messages et les diagrammes affichent les catégories de niveau de signification du second résultat de points chauds suivant le classement des catégories du premier résultat, à la place, vous pouvez afficher les catégories du premier résultat suivant le classement des catégories du second résultat en inversant l’ordre des couches en entrée.