Comparaison d’analyses de points chauds (Statistiques spatiales)

Synthèse

Permet de comparer deux couches de résultats d’analyse de points chauds et de mesurer leur similarité et leur association.

La similarité et l’association entre les couches de résultat de points chauds sont établies par comparaison des catégories de niveau de signification entre les entités correspondantes dans les deux couches en entrée. La similarité mesure le degré d’alignement spatial des points chauds, des points froids et des zones non significatives des deux résultats de points chauds. L’association (ou la dépendance) mesure la force de la relation statistique sous-jacente entre les variables de point chaud (comparable à la corrélation pour les variables continues)

En savoir plus sur le fonctionnement de l’outil Comparaison d’analyses de points chauds.

Illustration

Illustration de l’outil Comparaison d’analyses de points chauds
Deux couches de résultat d’analyse de points chauds sont comparées. Des nuances orangées plus soutenues indiquent les différences les plus marquées entre les couches.

Utilisation

  • Toutes les comparaisons sont établies par comparaison des catégories de niveau de signification (point chaud à 99 %, 95 % et 90 %, non significatif, point froid à 90 %, 95 % et 99 %) entre les entités correspondantes et leurs voisins dans les deux couches en entrée. La similarité mesure le degré d’alignement spatial des points chauds, des points froids et des zones non significatives des deux résultats de points chauds. L’association (ou la dépendance) mesure la force de la relation statistique sous-jacente entre les variables de point chaud (comparable à la corrélation pour les variables continues) La distinction entre la similarité et l’association est importante. En effet, il est courant que deux résultats de points chauds présentent une très forte similarité (nombreuses entités correspondantes et leurs voisins ayant le même niveau de signification) avec toutefois une faible association ou dépendance. En d’autres termes, malgré la similarité des niveaux de signification, les tentatives d’influence d’une variable (notamment les mesures d’atténuation) n’auront aucun effet sur l’autre variable. Il est fréquent d’obtenir des résultats très similaires, mais dissociés, lorsque les deux résultats de points chauds sont dominés par une seule catégorie (« non significatif », par exemple) ou lorsqu’ils comportent tous les deux des agrégats d’entités importants avec le même niveau de signification.

    La similarité entre les résultats de points chauds est mesurée par une valeur de similarité comprise entre 0 et 1. Dans le cas où de nombreuses entités correspondantes des deux résultats ont le même niveau de signification, la valeur est proche de 1. Dans le cas où de nombreuses entités correspondantes n’ont pas les mêmes niveaux de signification, la valeur est proche de 0. L’association est mesurée par une valeur Kappa : les résultats fortement associés ont des valeurs Kappa proches de 1, et les résultats dissociés (indépendants) ont des valeurs Kappa proches de 0 (ou légèrement négatives). La valeur Kappa est une version redimensionnée de la valeur de similarité, qui prend en compte l’agrégation spatiale et les fréquences de catégorie pour isoler l’association statistique entre les résultats de points chauds. Ces deux valeurs utilisent l’appartenance à un ensemble flou pour autoriser les correspondances partielles entre les entités correspondantes, en fonction de la similarité du niveau de signification et des voisinages spatiaux. Par exemple, les points chauds à 99 % peuvent être considérés comme des correspondances parfaites d’autres points chauds à 99 %, des correspondances partielles de points chauds à 95 % et des non-correspondances complètes de points froids à 99 %. Deux entités correspondantes peuvent également être considérées comme des correspondances partielles lorsqu’elles ont un niveau de signification différent mais que leurs entités voisines ont le même niveau de signification.

    L’outil calcule une valeur de similarité globale et une valeur Kappa globale pour mesurer l’ensemble de la similarité et de l’association entre les résultats de points chauds, et les versions locales sont également calculées pour chaque paire d’entités correspondantes. Cela vous permet de cartographier les comparaisons pour examiner les zones avec une valeur de similarité ou d’association supérieure ou inférieure aux valeurs globales. Les entités en sortie comportent également des diagrammes et une symbologie personnalisée qui mettent en évidence les zones où les résultats de points chauds sont les plus dissemblables et synthétisent les paires de niveaux de signification de toutes les entités correspondantes.

  • Les valeurs des paramètres Résultat des points chauds en entrée 1 et Résultat des points chauds en entrée 2 doivent être les entités en sortie des outils Hot Spot Analysis (Getis-Ord Gi*) ou Analyse de points chauds optimisée. Chaque entité de chaque résultat doit être appariée à une seule entité de l’autre résultat pour qu’il soit possible de comparer leurs catégories de niveau de signification. Si les entités des deux résultats de points chauds en entrée ne sont pas alignées spatialement (comme les polygones qui n’ont pas les mêmes bordures), les deux couches d’entités seront intersectées avant l’analyse, et les comparaisons porteront sur les intersections des entités. Faites attention lorsque les deux résultats de points chauds sont des polygones de tailles différentes, car l’intersection va subdiviser les grands polygones en plusieurs polygones plus petits et changer les fréquences des catégories de niveau de signification. Au moins 20 intersections d’entités sont nécessaires pour utiliser l’outil.

  • Les résultats des comparaisons sont renvoyés par le biais de messages de géotraitement, d’un groupe de couches de la classe d’entités en sortie et de diagrammes.

    Les messages affichent des informations sur les comparaisons globales entre les résultats de points chauds. Les messages présentent les informations suivantes :

    • Valeur de similarité - Valeur comprise entre 0 et 1 qui mesure la similarité globale entre les couches de résultats de points chauds. Cette valeur peut être interprétée comme une probabilité floue qu’une paire d’entités correspondantes partage la même catégorie de niveau de signification.
    • Valeur de similarité attendue - Valeur attendue de la similarité, en partant du principe que les deux couches de résultats de points chauds sont dissociées (indépendantes). Si la valeur de similarité est supérieure à sa valeur attendue, cela suggère une dépendance sous-jacente entre les deux cartes. Il s’agit d’une valeur à caractère essentiellement informationnel, qui est utilisée pour mettre à l’échelle la valeur de similarité lors du calcul de la valeur Kappa. La valeur est calculée par l’appariement de chaque entité avec des entités aléatoires dans l’autre résultat de points chauds et par le calcul de la similarité. En appariant chaque entité à des entités aléatoires (plutôt que son entité correspondante), la valeur attendue est ajustée spatialement pour tenir compte de l’agrégation spatiale et des fréquences de catégorie dans les deux résultats de points chauds. Le paramètre Nombre de permutations indique le nombre d’appariements aléatoires de chaque entité, et la valeur de similarité attendue est la moyenne des valeurs de similarité des permutations.
    • Kappa flou spatial - Mesure de l’association entre les variables d’analyse des points chauds qui est calculée par la mise à l’échelle de la valeur de similarité par sa valeur attendue. Les résultats de points chauds qui sont parfaitement associés ont la valeur 1, et les résultats dissociés (indépendants) ont une valeur proche de 0. Les valeurs négatives indiquent une relation négative entre les variables d’analyse des points chauds. Bien qu’il n’existe pas de limite inférieure pour cette valeur, elle est rarement inférieure à -3 en pratique.
    • Synthèses des pondérations entre chaque paire de niveaux de signification des points chauds.
    • Tables de messages affichant les nombres totaux et les pourcentages de chaque paire de niveaux de signification des points chauds. Dans les tables, les nombres totaux et les pourcentages des niveaux de signification de la seconde couche de résultats de points chauds sont répartis suivant les catégories de la première couche de résultats. Par exemple, parmi les points chauds significatifs à 90 % de la première couche de résultats, vous pouvez voir le nombre total et le pourcentage de points chauds de la seconde couche de résultats qui sont également significatifs à 90 %, ainsi que les nombres totaux et pourcentages pour toutes les autres catégories de niveau de signification. Ce type d’affichage est particulièrement utile lorsque les deux résultats de points chauds représentent la même variable mesurée à différents moments. En l’occurrence, la table vous permet d’observer la transition dans le temps des catégories entre les mesures.

    Les entités en sortie contiennent les champs de la valeur de similarité, de la valeur de similarité attendue, de la valeur Kappa et des catégories de niveau de signification pour chaque paire d’entités correspondantes. À l’exécution de l’outil sur une carte, trois couches sont ajoutées à un groupe de couches pour vous permettre d’examiner spatialement la similarité, l’association et les paires de niveaux de signification. La première couche affiche les valeurs de similarité classées selon cinq intervalles égaux compris entre 0 et 1, les valeurs de similarité plus faibles étant représentées dans des couleurs plus foncées de manière à faire ressortir les zones qui sont les plus dissemblables. La deuxième couche présente les valeurs de Kappa flou spatial, symbolisées avec des intervalles égaux et six classes. La troisième couche affiche chaque combinaison de niveaux de signification avec une symbologie personnalisée pour vous permettre d’identifier les entités dont un résultat de point chaud en entrée était un point chaud statistiquement significatif et l’autre était un point froid statistiquement significatif (la symbologie personnalisée ne fait pas la distinction entre les niveaux de signification de 90 %, 95 % et 99 % pour réduire le nombre de combinaisons).

    La dernière couche comporte également un diagramme de densité et un diagramme à barres personnalisé pour approfondir l’examen des paires de niveaux de signification. Ces diagrammes affichent les mêmes informations que les tables figurant dans les messages, mais les diagrammes sont colorés en fonction des nombres totaux et des pourcentages pour en faciliter l’interprétation. Vous pouvez également utiliser des sélections entre les diagrammes et la carte pour notamment sélectionner toutes les entités qui étaient des points chauds à 99 % dans un résultat et des points froids à 99 % dans l’autre résultat, indiquant ainsi les plus importantes différences possibles.

    En savoir plus sur les sorties de l’outil

  • Le paramètre Méthode de pondération de la similarité définit la similarité entre chaque combinaison de catégories de niveau de signification selon l’appartenance à un ensemble flou. Chaque pondération est une valeur comprise entre 0 et 1, qui indique dans quelle mesure les catégories sont traitées comme similaires dans les comparaisons. Par exemple, vous pouvez définir un facteur de pondération de 0,75 entre les catégories de points chauds à 99 % et celles à 95 % pour indiquer qu’elles ne sont pas exactement identiques, mais qu’elles présentent plus de similitudes que de différences.

    L’option Pondérations floues par défaut pondère les catégories par la proximité du niveau de signification (déterminée par des ratios de valeurs critiques). D’autres options vous permettent de combiner les catégories en leur attribuant une valeur de pondération de 1 entre elles. Par exemple, l’option Combiner les niveaux de signification de 95 % et 99 % combine les points chauds à 99 % et 95 % en une seule catégorie, combine les points froids à 99 % et 95 % et combine les points chauds à 90 %, les points non significatifs et les points froids à 90 %. Cette option traite tous les points chauds (ou froids) d’un niveau de signification égal ou supérieur à 95 % comme étant identiques (statistiquement significatifs) et toutes les entités d’un niveau de signification inférieur à 95 % comme étant identiques (non significatifs statistiquement). Cela est utile lorsque vous avez l’intention de réaliser les deux analyses de points chauds avec un niveau de signification de 95 %, et que vous voulez traiter tous les points chauds et froids significatifs à 90 % comme des points non significatifs. L’option Inverser les relations des points chauds et froids attribue des pondérations de similarité élevées entre les points chauds et froids. Par exemple, les points chauds à 99 % sont considérés comme parfaitement semblables aux points froids à 99 % et complètement dissemblables des autres points chauds à 99 %. Cette option est utile pour mesurer la similarité et l’association entre des variables ayant une relation négative (par exemple, dans une comparaison des points chauds de la mortalité infantile avec les points froids du revenu médian).

    L’option Pondérations personnalisées permet de définir des pondérations de similarité personnalisées pour fusionner des catégories et définir vos préférences. Vous pouvez indiquer les pondérations personnalisées dans le champ du paramètre Pondérations de similarité personnalisées. Ce paramètre se présente sous la forme d’une matrice contextuelle composée de 49 combinaisons de niveaux de signification (7 x 7). Pour définir une pondération entre une paire de catégories, saisissez la valeur dans la cellule correspondante et appuyez sur la touche Entrée. Vous pouvez exporter les pondérations personnalisées dans une table, à partir de la boîte de dialogue contextuelle, pour les réutiliser avec l’option Extraire les pondérations à partir de la table.

    Remarque :

    Les pondérations de similarité affectent uniquement le calcul de la valeur de similarité et de la valeur Kappa. Même si les catégories de niveau de signification sont combinées selon des pondérations de similarité, les tables de messages, la symbologie de la couche en sortie et les diagrammes les traitent comme des catégories distinctes.

    En savoir plus sur la similarité catégorielle

  • Lorsque des proportions importantes de chaque résultat de points chauds ne sont pas significatives, la valeur de similarité est élevée en raison de l’appariement des zones non significatives. Toutefois, si les entités non significatives ne présentent pas d’intérêt pour les recherches, vous pouvez ne pas souhaiter que la valeur de similarité et la valeur Kappa reflètent uniquement les nombreuses zones non significatives dans les deux résultats. Vous pouvez utiliser le paramètre Exclure les entités non significatives pour exclure toute paire d’entités correspondantes des comparaisons dès lors que les deux résultats de points chauds ne sont pas significatifs statistiquement. Le cas échéant, l’outil calcule des valeurs de similarité et Kappa conditionnelles qui ne comparent que les points chauds et froids statistiquement significatifs. L’exclusion des entités non significatives des calculs vous permet de calculer les valeurs de similarité et Kappa uniquement parmi les points chauds et froids statistiquement significatifs, de manière à refléter leur similarité et leur association avec exactitude.

    Remarque :

    Si des catégories de niveau de signification sont combinées avec la catégorie non significative par l’attribution d’une pondération de similarité relative de 1, ces catégories sont exclues des comparaisons également.

  • Si l’une des couches de résultat de points chauds en entrée contient des polygones superposés, les superpositions sont intersectées dans les nouvelles entités. En conséquence, les valeurs de similarité peuvent être différentes de 1 même pour les couches de résultat avec des catégories de niveau de signification identiques. Utilisez l’environnement Tolérance XY pour supprimer les superpositions involontaires, telles que les erreurs de géocodage. Il est recommandé d’examiner le nombre d’entités dans les entités en sortie pour établir si les intersections sont plus nombreuses que prévu.

  • Le paramètre Nombre de voisins indique le nombre d’entités voisines supplémentaires à utiliser pour la similarité de distance. À l’instar de la méthode de pondération de la similarité, la similarité de distance accepte les correspondances partielles lorsque les entités ont un niveau de signification différent, mais que d’autres entités de leur voisinage ont le même niveau de signification. Du fait que l’analyse des points chauds est une méthode spatiale qui utilise les voisinages locaux, le niveau de signification de chaque entité est une caractérisation des valeurs de l’entité et de ses voisins les plus proches, pas simplement de l’entité. En ce sens, si une entité voisine est similaire, elle doit contribuer dans une certaine mesure à la similarité de ses voisins.

    La similarité partielle par les voisins est incorporée au moyen d’une pondération de distance basée sur le classement des voisins. L’entité reçoit une pondération de distance de 1, et les pondérations diminuent uniformément pour chaque voisin supplémentaire. La similarité globale entre deux entités est leur similarité catégorielle (selon la méthode de pondération de la similarité) multipliée par leur similarité de distance.

    En savoir plus sur la similarité de distance et la pondération des voisins

  • Le changement de l’ordre des résultats de points chauds en entrée n’a aucune incidence sur les valeurs de similarité, mais il a pour effet de modifier légèrement la valeur de similarité attendue et la valeur Kappa en raison du caractère aléatoire des permutations. Les axes des tables de messages et des diagrammes sont également inversés, ce qui va rendre leur interprétation plus aisée dans certains cas. Comme les messages et les diagrammes affichent les catégories de niveau de signification du second résultat de points chauds suivant le classement des catégories du premier résultat, à la place, vous pouvez afficher les catégories du premier résultat suivant le classement des catégories du second résultat en inversant l’ordre des couches en entrée.

Paramètres

ÉtiquetteExplicationType de données
Résultat des points chauds en entrée 1

Première couche de résultats de l’analyse des points chauds.

Feature Layer
Résultat des points chauds en entrée 2

Seconde couche de résultats de l’analyse des points chauds.

Feature Layer
Entités en sortie

Classe d’entités en sortie qui contient les mesures locales de la similarité et de l’association.

Feature Class
Nombre de voisins
(Facultatif)

Nombre de voisins autour de chaque entité à utiliser pour la pondération de la distance. La pondération de la distance est un composant de la similarité globale, et toutes les entités de même niveau de signification dans le voisinage sont considérées comme des correspondances partielles lors du calcul de la similarité et de l’association.

Long
Nombre de permutations
(Facultatif)

Nombre de permutations à utiliser pour estimer la valeur de similarité attendue et la valeur Kappa. Un plus grand nombre de simulations a pour effet d’augmenter la précision des estimations, ainsi que le temps de calcul.

  • 99L’analyse utilisera 99 permutations.
  • 199L’analyse utilisera 199 permutations.
  • 499L’analyse utilisera 499 permutations. Il s’agit de l’option par défaut.
  • 999L’analyse utilisera 999 permutations.
  • 9999L’analyse utilisera 9 999 permutations.
Long
Méthode de pondération de la similarité
(Facultatif)

Indique comment les pondérations de similarité entre les catégories de niveau de signification sont définies. Les pondérations de similarité sont des valeurs numériques comprises entre 0 et 1 qui définissent les catégories d’un résultat qui sont censées correspondre aux catégories de l’autre résultat. Une valeur de 1 indique que les catégories sont considérées comme étant exactement identiques, et une valeur de 0 indique que les catégories sont considérées comme étant complètement différentes. Les valeurs comprises entre 0 et 1 indiquent les degrés de similarité partielle entre les catégories. Par exemple, les points chauds significatifs à 99 % peuvent être considérés parfaitement semblables aux autres points chauds à 99 %, partiellement semblables aux points chauds à 95 % et complètement dissemblables des points froids à 99 %.

  • Pondérations flouesLes pondérations de similarité sont floues (non binaires) et déterminées par la proximité des niveaux de signification. Par exemple, les points chauds significatifs à 99 % sont parfaitement semblables aux autres points chauds significatifs à 99 % (pondération de 1), mais ils sont partiellement semblables aux points chauds significatifs à 95 % (pondération de 0,71) et aux points chauds significatifs à 90 % (pondération de 0,55). La pondération entre le niveau de signification de 95 % et le niveau de signification de 90 % est de 0,78. Tous les points chauds sont complètement dissemblables de tous les points froids et de toutes les entités non significatives (pondération de 0). Il s’agit de l’option par défaut.
  • Correspondance exacte du niveau de significationLes entités doivent avoir le même niveau de signification pour être considérées comme semblables. Par exemple, les points chauds significatifs à 99 % sont considérés complètement dissemblables des points chauds significatifs à 95 % et 90 %.
  • Combiner les niveaux de signification de 90 %, 95 % et 99 %Les entités qui sont des points chauds significatifs à 90 %, 95 % et 99 % sont considérées parfaitement semblables, et toutes les entités qui sont des points froids significatifs à 90 %, 95 % et 99 % sont considérées parfaitement semblables. Cette option traite toutes les entités d’un niveau de signification égal ou supérieur à 90 % comme étant identiques (statistiquement significatives) et toutes les entités d’un niveau de confiance inférieur à 90 % comme étant identiques (non significatives). Cette option est recommandée pour les analyses des points chauds qui sont réalisées avec un niveau de signification de 90 %.
  • Combiner les niveaux de signification de 95 % et 99 %Les entités qui sont des points chauds (ou froids) significatifs à 95 % et 99 % sont considérées parfaitement semblables, et les entités qui sont des points froids significatifs à 95 % et 99 % sont considérées parfaitement semblables. Par exemple, les points chauds et froids significatifs à 90 % sont considérés complètement dissemblables des points chauds et froids dont le niveau de signification est plus élevé. Cette option traite toutes les entités d’un niveau de confiance égal ou supérieur à 95 % comme étant identiques (statistiquement significatives) et toutes les entités d’un niveau de confiance inférieur à 95 % comme étant identiques (non significatives). Cette option est recommandée pour les analyses des points chauds qui sont réalisées avec un niveau de signification de 95 %.
  • Utiliser uniquement le niveau de signification de 99 %Seules les entités qui sont des points chauds (ou froids) significatifs à 99 % sont considérées parfaitement semblables. Cette option traite toutes les entités d’un niveau de signification inférieur à 99 % comme des entités non significatives. Cette option est recommandée pour les analyses des points chauds qui sont réalisées avec un niveau de signification de 99 %.
  • Pondérations personnaliséesLes valeurs de pondération de similarité personnalisée indiquées pour le paramètre Pondérations de similarité de catégorie sont utilisées.
  • Extraire les pondérations à partir de la tableLes pondérations de similarité entre les niveaux de signification sont définies par une table en entrée. Indiquez la table dans le champ du paramètre Tables de pondération en entrée.
  • Inverser les relations des points chauds et froidsLes pondérations floues par défaut sont utilisées, mais les points chauds du premier résultat de points chauds sont considérés semblables aux points froids du second résultat de points chauds. Par exemple, les points chauds significatifs à 99 % d’un résultat sont considérés parfaitement semblables aux points froids à 99 % de l’autre résultat et partiellement semblables aux points froids à 95 % et 90 % de l’autre résultat. Cette option est recommandée lorsque les variables de l’analyse des points chauds ont une relation négative. Par exemple, vous pouvez mesurer le degré de correspondance des points chauds de la mortalité infantile avec les points froids de l’accès aux soins.
String
Pondérations de similarité de catégorie
(Facultatif)

Facteurs de pondération de similarité personnalisée entre les catégories de niveau de signification. Les pondérations sont des valeurs comprises entre 0 et 1 qui indiquent l’appréciation de la similarité des deux catégories. La valeur 0 indique que les catégories sont complètement dissemblables, la valeur 1 indique que les catégories sont parfaitement semblables et les valeurs comprises entre 0 et 1 indiquent que les catégories sont partiellement semblables. Dans la fenêtre contextuelle de la matrice de pondérations, cliquez sur une cellule, saisissez la valeur de pondération et appuyez sur la touche Entrée pour appliquer la pondération.

Value Table
Table des pondérations en entrée
(Facultatif)

Table répertoriant les pondérations de similarité personnalisées pour chaque combinaison de catégories de niveau de signification des points chauds. La table doit contenir les champs CATEGORY1, CATEGORY2 et WEIGHT. Indiquez les catégories de niveau de signification de la paire (valeurs du champ Gi_Bin des couches en entrée) dans les champs de catégorie, puis indiquez la pondération de similarité entre elles dans le champ de pondération. La pondération de toute combinaison non répertoriée dans la table est considérée comme étant de 0.

Table View
Exclure les entités non significatives
(Facultatif)

Indique si des paires d’entités sont à exclure des comparaisons dès lors que les deux résultats de points chauds ne sont pas significatifs. En cas d’exclusion, des valeurs de similarité et Kappa conditionnelles sont calculées ; ces valeurs ne comparent que les points chauds et froids statistiquement significatifs. Il est préconisé d’avoir recours à l’exclusion des entités lorsqu’il est nécessaire de déterminer simplement la correspondance ou non des points chauds et froids des couches en entrée, et non celle des zones non significatives (par exemple, établir par comparaison si les points chauds et froids du revenu médian correspondent aux points chauds et froids de l’accès aux denrées alimentaires).

  • Case cochée - Les entités non significatives sont exclues, et les comparaisons sont fonction des points chauds et froids statistiquement significatifs.
  • Case décochée - Les entités non significatives sont incluses. Il s’agit de l’option par défaut.

Si des catégories de niveau de signification se voient attribuer une pondération de similarité de 1 par rapport à la catégorie non significative (indiquant que la catégorie est traitée comme la catégorie non significative), les entités de cette catégorie sont également exclues des comparaisons dès lors qu’elles sont appariées avec une autre catégorie non significative.

Boolean

Sortie obtenue

ÉtiquetteExplicationType de données
Valeur de similarité globale

Valeur de similarité entre les résultats de points chauds.

Double
Valeur de similarité attendue globale

Valeur attendue de la similarité entre les résultats de points chauds.

Double
Kappa flou spatial global

Valeur de Kappa flou ajusté spatialement entre les résultats de points chauds.

Double
Groupe de couches en sortie

Groupe de couches des couches en sortie.

Group Layer

arcpy.stats.HotSpotAnalysisComparison(in_hot_spot_1, in_hot_spot_2, out_features, {num_neighbors}, {num_perms}, {weighting_method}, {similarity_weights}, {in_weights_table}, {exclude_nonsig_features})
NomExplicationType de données
in_hot_spot_1

Première couche de résultats de l’analyse des points chauds.

Feature Layer
in_hot_spot_2

Seconde couche de résultats de l’analyse des points chauds.

Feature Layer
out_features

Classe d’entités en sortie qui contient les mesures locales de la similarité et de l’association.

Feature Class
num_neighbors
(Facultatif)

Nombre de voisins autour de chaque entité à utiliser pour la pondération de la distance. La pondération de la distance est un composant de la similarité globale, et toutes les entités de même niveau de signification dans le voisinage sont considérées comme des correspondances partielles lors du calcul de la similarité et de l’association.

Long
num_perms
(Facultatif)

Nombre de permutations à utiliser pour estimer la valeur de similarité attendue et la valeur Kappa. Un plus grand nombre de simulations a pour effet d’augmenter la précision des estimations, ainsi que le temps de calcul.

  • 99L’analyse utilisera 99 permutations.
  • 199L’analyse utilisera 199 permutations.
  • 499L’analyse utilisera 499 permutations. Il s’agit de l’option par défaut.
  • 999L’analyse utilisera 999 permutations.
  • 9999L’analyse utilisera 9 999 permutations.
Long
weighting_method
(Facultatif)

Indique comment les pondérations de similarité entre les catégories de niveau de signification sont définies. Les pondérations de similarité sont des valeurs numériques comprises entre 0 et 1 qui définissent les catégories d’un résultat qui sont censées correspondre aux catégories de l’autre résultat. Une valeur de 1 indique que les catégories sont considérées comme étant exactement identiques, et une valeur de 0 indique que les catégories sont considérées comme étant complètement différentes. Les valeurs comprises entre 0 et 1 indiquent les degrés de similarité partielle entre les catégories. Par exemple, les points chauds significatifs à 99 % peuvent être considérés parfaitement semblables aux autres points chauds à 99 %, partiellement semblables aux points chauds à 95 % et complètement dissemblables des points froids à 99 %.

  • FUZZYLes pondérations de similarité sont floues (non binaires) et déterminées par la proximité des niveaux de signification. Par exemple, les points chauds significatifs à 99 % sont parfaitement semblables aux autres points chauds significatifs à 99 % (pondération de 1), mais ils sont partiellement semblables aux points chauds significatifs à 95 % (pondération de 0,71) et aux points chauds significatifs à 90 % (pondération de 0,55). La pondération entre le niveau de signification de 95 % et le niveau de signification de 90 % est de 0,78. Tous les points chauds sont complètement dissemblables de tous les points froids et de toutes les entités non significatives (pondération de 0). Il s’agit de l’option par défaut.
  • EXACT_MATCHLes entités doivent avoir le même niveau de signification pour être considérées comme semblables. Par exemple, les points chauds significatifs à 99 % sont considérés complètement dissemblables des points chauds significatifs à 95 % et 90 %.
  • ABOVE_90Les entités qui sont des points chauds significatifs à 90 %, 95 % et 99 % sont considérées parfaitement semblables, et toutes les entités qui sont des points froids significatifs à 90 %, 95 % et 99 % sont considérées parfaitement semblables. Cette option traite toutes les entités d’un niveau de signification égal ou supérieur à 90 % comme étant identiques (statistiquement significatives) et toutes les entités d’un niveau de confiance inférieur à 90 % comme étant identiques (non significatives). Cette option est recommandée pour les analyses des points chauds qui sont réalisées avec un niveau de signification de 90 %.
  • ABOVE_95Les entités qui sont des points chauds (ou froids) significatifs à 95 % et 99 % sont considérées parfaitement semblables, et les entités qui sont des points froids significatifs à 95 % et 99 % sont considérées parfaitement semblables. Par exemple, les points chauds et froids significatifs à 90 % sont considérés complètement dissemblables des points chauds et froids dont le niveau de signification est plus élevé. Cette option traite toutes les entités d’un niveau de confiance égal ou supérieur à 95 % comme étant identiques (statistiquement significatives) et toutes les entités d’un niveau de confiance inférieur à 95 % comme étant identiques (non significatives). Cette option est recommandée pour les analyses des points chauds qui sont réalisées avec un niveau de signification de 95 %.
  • ABOVE_99Seules les entités qui sont des points chauds (ou froids) significatifs à 99 % sont considérées parfaitement semblables. Cette option traite toutes les entités d’un niveau de signification inférieur à 99 % comme des entités non significatives. Cette option est recommandée pour les analyses des points chauds qui sont réalisées avec un niveau de signification de 99 %.
  • CUSTOMLes pondérations de similarité personnalisées indiquées dans le paramètre similarity_weights sont utilisées.
  • TABLELes pondérations de similarité entre les niveaux de signification sont définies par une table en entrée. Indiquez la table dans le paramètre in_weights_table.
  • REVERSELes pondérations floues par défaut sont utilisées, mais les points chauds du premier résultat de points chauds sont considérés semblables aux points froids du second résultat de points chauds. Par exemple, les points chauds significatifs à 99 % d’un résultat sont considérés parfaitement semblables aux points froids à 99 % de l’autre résultat et partiellement semblables aux points froids à 95 % et 90 % de l’autre résultat. Cette option est recommandée lorsque les variables de l’analyse des points chauds ont une relation négative. Par exemple, vous pouvez mesurer le degré de correspondance des points chauds de la mortalité infantile avec les points froids de l’accès aux soins.
String
similarity_weights
[similarity_weights,...]
(Facultatif)

Facteurs de pondération de similarité personnalisée entre les catégories de niveau de signification. Les pondérations sont des valeurs comprises entre 0 et 1 qui indiquent l’appréciation de la similarité des deux catégories. La valeur 0 indique que les catégories sont complètement dissemblables, la valeur 1 indique que les catégories sont parfaitement semblables et les valeurs comprises entre 0 et 1 indiquent que les catégories sont partiellement semblables.

Value Table
in_weights_table
(Facultatif)

Table répertoriant les pondérations de similarité personnalisées pour chaque combinaison de catégories de niveau de signification des points chauds. La table doit contenir les champs CATEGORY1, CATEGORY2 et WEIGHT. Indiquez les catégories de niveau de signification de la paire (valeurs du champ Gi_Bin des couches en entrée) dans les champs de catégorie, puis indiquez la pondération de similarité entre elles dans le champ de pondération. La pondération de toute combinaison non répertoriée dans la table est considérée comme étant de 0.

Table View
exclude_nonsig_features
(Facultatif)

Indique si des paires d’entités sont à exclure des comparaisons dès lors que les deux résultats de points chauds ne sont pas significatifs. En cas d’exclusion, des valeurs de similarité et Kappa conditionnelles sont calculées ; ces valeurs ne comparent que les points chauds et froids statistiquement significatifs. Il est préconisé d’avoir recours à l’exclusion des entités lorsqu’il est nécessaire de déterminer simplement la correspondance ou non des points chauds et froids des couches en entrée, et non celle des zones non significatives (par exemple, établir par comparaison si les points chauds et froids du revenu médian correspondent aux points chauds et froids de l’accès aux denrées alimentaires).

  • EXCLUDELes entités non significatives sont exclues, et les comparaisons sont fonction des points chauds et froids statistiquement significatifs.
  • NO_EXCLUDELes entités non significatives sont incluses. Il s’agit de l’option par défaut.

Si des catégories de niveau de signification se voient attribuer une pondération de similarité de 1 par rapport à la catégorie non significative (indiquant que la catégorie est traitée comme la catégorie non significative), les entités de cette catégorie sont également exclues des comparaisons dès lors qu’elles sont appariées avec une autre catégorie non significative.

Boolean

Sortie obtenue

NomExplicationType de données
SIM_VALUE

Valeur de similarité entre les résultats de points chauds.

Double
EXP_SIM_VALUE

Valeur attendue de la similarité entre les résultats de points chauds.

Double
KAPPA

Valeur de Kappa flou ajusté spatialement entre les résultats de points chauds.

Double
output_layer_group

Groupe de couches des couches en sortie.

Group Layer

Exemple de code

Exemple 1 d’utilisation de la fonction HotSpotAnalysisComparison (fenêtre Python)

Le script Python ci-dessous montre comment utiliser la fonction HotSpotAnalysisComparison.


arcpy.stats.HotSpotAnalysisComparison("c:/data/boston.gdb/robbery_hotspot", 
      "c:/data/boston.gdb/social_disorder_hotspot", "robbery_disorder_comparison",
      8, 499, "FUZZY", None, None, "EXCLUDE")
Exemple 2 d’utilisation de la fonction HotSpotAnalysisComparison (script autonome)

Le script Python ci-dessous montre comment utiliser la fonction HotSpotAnalysisComparison.


# Compare hot spot analysis results for robberies and social disorder.

# Import required modules.
import arcpy

# Set the workspace.
arcpy.env.workspace = "c:/data/boston.gdb"

# Create hot spot result for robberies in Boston.
robbery_hs = arcpy.stats.HotSpots(
    "boston_ecometrics_hex", "robbery", "robbery_hotspot",
     "K_NEAREST_NEIGHBORS", None, None, None, None, None, None, 8
)

# Create hot spot result of social disorder in Boston.
social_disorder_hs = arcpy.stats.HotSpots(
    "boston_ecometrics_hex", "scl_dsr", "social_disorder_hotspot", 
    "K_NEAREST_NEIGHBORS", None, None, None, None, None, None, 8
)

# Compare robbery and social disorder hot spot results.
try:
    hs_compare = arcpy.stats.HotSpotAnalysisComparison(
        robbery_hs, social_disorder_hs, "robbery_disorder_comparison", 8, 999, "FUZZY", 
        None, None, False
    )
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

# Save similarity and kappa derived outputs.
result_vals = [hs_compare.getOutput(out) for out in range(hs_compare.outputCount)]

# Apply labels to derived outputs
results_names = ["output_fc", "similarity", "expected_similarity", "fuzzy_kappa", 
    "output_layer"]

# Combine to dictionary and print derived outputs.
results = dict(zip(results_names, result_vals))
results