Étiquette | Explication | Type de données |
Cube spatio-temporel en entrée | Le cube spatio-temporel contenant la variable à analyser. Les cubes spatio-temporels ont une extension de fichier .nc et sont créés à l’aide de divers outils dans la boîte à outils Exploration des modèles spatio-temporels. | File |
Variable d’analyse | Variable numérique dans le fichier netCDF que vous voulez analyser. | String |
Entités en sortie | Classe d’entités en sortie contenant les localisations ayant été considérées comme des agrégats ou points aberrants statistiquement significatifs. | Feature Class |
Distance de voisinage (Facultatif) | Étendue spatiale du voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale. | Linear Unit |
Intervalle temporel de voisinage | Nombre d’intervalles temporels à inclure dans le voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale. | Long |
Nombre de permutations (Facultatif) | Nombre de permutations aléatoires pour le calcul des pseudo valeurs p. Le nombre de permutations par défaut est 499. Si vous choisissez 0 permutation, la valeur p standard est calculée.
| Long |
Masque d’analyse surfacique (Facultatif) | Couche d’entités surfaciques dont un ou plusieurs polygones définissent la zone d’étude de l’analyse. Un masque d’analyse surfacique permet, par exemple, d’exclure un lac de grande envergure de l’analyse. Les groupes définis dans le cube spatio-temporel en entrée qui se situent en dehors du masque ne sont pas inclus dans l’analyse. Ce paramètre est uniquement disponible pour les cubes de grille. | Feature Layer |
Conceptualisation des relations spatiales (Facultatif) | Indique comment les relations spatiales entre les entités sont définies.
| String |
Nombre de voisins spatiaux (Facultatif) | Entier spécifiant le nombre minimal ou exact de voisins à inclure dans les calculs du groupe cible. Pour K voisins les plus proches, chaque groupe aura exactement ce nombre spécifié de voisins. Pour Distance fixe, chaque groupe aura au moins ce nombre de voisins (la distance de voisinage sera temporairement étendue pour garantir ce nombre de voisins, le cas échéant). Si l’une des conceptualisations de contiguïté est sélectionnée, ce nombre minimal de voisins est attribué à chaque groupe. Pour les groupes dont le nombre de voisins contigus est inférieur à celui spécifié, les voisins supplémentaires reposeront sur la proximité avec le centroïde des entités. | Long |
Définir la fenêtre globale (Facultatif) | La statistique Indice local de Moran (Anselin) compare une statistique locale, calculée d’après les voisins de chaque groupe, à une valeur globale. Ce paramètre permet de contrôler les groupes à utiliser pour calculer la valeur globale.
| String |
Synthèse
Identifie les agrégats et points aberrants statistiquement significatifs dans l’espace et le temps. Cet outil est une implémentation spatio-temporelle de la statistique Indice local de Moran (Anselin).
En savoir plus sur le fonctionnement de l’outil Analyse des points chauds émergents
Illustration
Utilisation
Cet outil accepte les fichiers netCDF créés à l’aide de divers outils figurant dans la boîte à outils Exploration des modèles spatio-temporels.
Chaque groupe dans le cube spatio-temporel présente une valeur LOCATION_ID, time_step_ID et COUNT, ainsi que les champs de récapitulation ou les variables qui ont été inclus lors de la création du cube. Les groupes associés à la même localisation physique partagent le même ID de localisation et constituent ensemble une série chronologique. Les groupes associés au même intervalle temporel partagent le même ID d’intervalle temporel et constituent ensemble une tranche temporelle. La valeur de nombre de chaque groupe représente le nombre d’incidents ou d’enregistrements présents à la localisation associée dans l’intervalle temporel associé.
Cet outil analyse une variable dans le cube spatio-temporel en entrée netCDF à l’aide d’une implémentation spatio-temporelle de la statistique Indice local de Moran (Anselin).
Les entités en sortie seront ajoutées à la fenêtre Contenu avec un rendu qui résume les résultats de l’analyse spatio-temporelle pour toutes les localisations analysées. Si vous spécifiez un Masque d’analyse surfacique, les localisations analysées seront celles qui figurent dans le masque d’analyse. Sinon, les localisations analysées seront celles qui présentent au moins un point pour au moins un intervalle temporel.
Outre l’option Classe d’entités en sortie, un résumé de l’analyse est généré sous forme de messages apparaissant en bas de la fenêtre Géotraitement pendant l’exécution de l’outil. Vous pouvez accéder aux messages en passant le curseur de la souris sur la barre de progression, en cliquant sur le bouton de menu contextuel ou en développant la section de détails des messages dans la fenêtre Géotraitement. Vous pouvez également accéder aux messages d’un outil précédemment exécuté via l’historique de géotraitement dans la fenêtre Catalogue.
L’outil Analyse des valeurs aberrantes locales identifie les agrégats et points aberrants statistiquement significatifs dans l’espace et le temps. Reportez-vous à la section En savoir plus sur le fonctionnement de l’outil Analyse des valeurs aberrantes locales pour accéder aux définitions des catégories en sortie par défaut et obtenir des informations supplémentaires sur les algorithmes utilisés par cet outil d’analyse.
Pour identifier les agrégats et points aberrants au sein du cube spatio-temporel, cet outil utilise une implémentation spatio-temporelle de la statistique Indice local de Moran (Anselin), qui tient compte de la valeur de chaque groupe dans le contexte des valeurs des groupes voisins.
Pour déterminer les groupes à inclure dans chaque voisinage d’analyse, l’outil identifie d’abord les groupes voisins inclus dans la conceptualisation des relations spatiales. Ensuite, pour chacun de ces groupes, il inclut les groupes se trouvant aux mêmes endroits séparés par N phases précédentes, N représentant la valeur d’intervalle temporel de voisinage que vous spécifiez.
Le choix du paramètre Conceptualisation des relations spatiales doit refléter les relations inhérentes entre les entités que vous analysez. Plus la modélisation des interactions entre les entités dans l’espace est réaliste, plus les résultats sont précis. Des recommandations sont présentées dans la section Sélection d’une conceptualisation des relations spatiales : bonnes pratiques.
La conceptualisation des relations spatiales par défaut est Distance fixe. Un groupe est considéré comme un voisin lorsque son centroïde se trouve dans la distance de voisinage et que son intervalle temporel est compris dans l’intervalle temporel de voisinage spécifié. Si vous n’indiquez pas de valeur pour le paramètre Distance de voisinage, une valeur est calculée pour vous en fonction de la distribution spatiale de vos données ponctuelles. Si vous n’indiquez pas de valeur pour le paramètre Intervalle temporel de voisinage, l’outil utilise une valeur par défaut, à savoir 1 intervalle temporel.
Le paramètre Nombre de voisins peut remplacer la distance de voisinage pour l’option Distance fixe ou étendre la recherche de voisinage pour les options Segments de contiguïté uniquement et Angles des segments de contiguïté. Dans ce cas, Nombre de voisins est utilisé comme nombre minimal. Par exemple, si vous choisissez Distance fixe avec une distance de voisinage de 10 miles et 3 pour le paramètre Nombre de voisins, tous les groupes reçoivent un minimum de 3 voisins spatiaux même si la distance de voisinage doit augmenter pour les trouver. La distance augmente uniquement pour les groupes où le nombre de voisins minimal n’est pas satisfait. De même, avec les options de contiguïté, pour les groupes dont le nombre de voisins contigus est inférieur au nombre spécifié, des voisins supplémentaires sont choisis en fonction de la proximité avec le centroïde.
La valeur du paramètre Intervalle temporel de voisinage représente le nombre d’intervalles temporels à inclure dans le voisinage d’analyse. Si l’intervalle temporel de votre cube équivaut à trois mois, par exemple, et que vous indiquez 2 comme valeur pour Intervalle temporel de voisinage, le nombre total de groupes compris dans la conceptualisation des relations spatiales spécifiée, ainsi que tous les groupes associés pour les deux intervalles temporels précédents (représentant une période de neuf mois) seront inclus dans le voisinage d’analyse.
Les permutations permettent de déterminer la probabilité de trouver la distribution spatiale réelle des valeurs que vous analysez. Pour chaque permutation, les valeurs voisines autour de chaque groupe sont réorganisées de manière aléatoire et la valeur de l’indice local de Moran est calculée. Le résultat est une distribution de référence des valeurs qui est ensuite comparée à l’indice de Moran réel observé pour déterminer la probabilité que la valeur observée se trouve dans la distribution aléatoire. La valeur par défaut est de 499 permutations. Cependant, vous pouvez améliorer la distribution aléatoire en augmentant le nombre de permutations, ce qui augmente la précision de la pseudo valeur p.
Si le paramètre Nombre de permutations est défini sur 0, le résultat est une valeur p classique et non une pseudo valeur p.
Les permutations employées par cet outil tirent parti des performances accrues disponibles dans les systèmes équipés de plusieurs processeurs (ou de processeurs multicœurs). L’outil s’exécute par défaut avec 50 % des processeurs disponibles. Toutefois, le nombre de processeurs peut être augmenté ou réduit à l’aide de l’environnement Facteur de traitement parallèle. La vitesse de traitement optimisée se remarque davantage dans les cubes spatio-temporels plus volumineux ou lors de l’exécution de l’outil avec un nombre plus important de permutations.
La couche d’entités Masque d’analyse surfacique peut inclure un ou plusieurs polygones qui définissent la zone d’étude de l’analyse. Ces polygones doivent indiquer l’endroit où les entités ponctuelles risquent d’être présentes et exclure les zones où les points ne risquent pas d’apparaître. Si vous analysez les tendances en matière de cambriolage dans les résidences, par exemple, vous pouvez utiliser le masque d’analyse surfacique pour exclure un lac étendu, des parcs régionaux ou d’autres endroits ne comprenant aucune habitation.
Le masque d’analyse surfacique est intersecté avec l’étendue du cube spatio-temporel en entrée et n’étend pas les dimensions du cube.
Si le masque d’analyse surfacique que vous utilisez pour définir votre zone d’étude couvre une surface qui s’étend au-delà de l’étendue des entités en entrée qui ont servi lors de la création initiale du cube, vous pouvez recréer votre cube en utilisant ce masque d’analyse surfacique en tant que paramètre d’environnement Étendue. Cette opération permet de s’assurer que toute la surface couverte par le masque d’analyse surfacique est comprise dans l’outil Analyse des valeurs aberrantes locales. L’utilisation du masque d’analyse surfacique comme paramètre d’environnement Étendue au cours de la création du cube permet de s’assurer que l’étendue du cube concorde avec l’étendue du masque d’analyse surfacique.
- Cet outil crée une nouvelle classe d’entités en sortie comportant les attributs suivants pour chaque localisation du cube spatio-temporel. Ces champs peuvent être utilisés pour une visualisation personnalisée de la sortie. Reportez-vous à la rubrique En savoir plus sur le fonctionnement de l’outil Analyse des valeurs aberrantes locales pour plus d’informations sur les autres résultats d’analyse.
- Number of Outliers
- Percentage of Outliers
- Number of Low Clusters
- Percentage of Low Clusters
- Number of Low Outliers
- Percentage of Low Outliers
- Number of High Clusters
- Percentage of High Clusters
- Number of High Outliers
- Percentage of High Outliers
- localisations avec No Spatial Neighbors
- localisations avec un Outlier in the Most Recent Time Step
- Cluster Outlier Type
- et résumés statistiques complémentaires
Le champ Cluster Outlier Type indique toujours les agrégats et points aberrants statistiquement significatifs pour un niveau de confiance de 95 % et seuls les groupes statistiquement significatifs contiennent des valeurs dans ce champ. Cette signification reflète une correction FDR (False Discovery Rate).
- Le rendu par défaut pour Classe d’entités en sortie repose sur le champ CO_TYPE et indique les localisations statistiquement significatives. Il présente les localisations ayant fait partie d’un agrégat élevé-élevé, d’un point aberrant élevé-faible, d’un point aberrant faible-élevé ou d’un agrégat faible-faible, ou classées en tant que Types multiples au fil du temps.
Pour garantir que chaque localisation possède au moins un voisin temporel, l’indice local de Moran n’est pas calculé pour la première tranche temporelle. Les valeurs de groupe de la première tranche temporelle sont cependant incluses dans le calcul de la moyenne globale.
L’exécution de l’outil Analyse des valeurs aberrantes locales permet de rajouter des résultats d’analyse dans le cube spatio-temporel en entrée netCDF. Chaque groupe est analysé par rapport aux groupes voisins pour mesurer l’agrégation des valeurs élevées et faibles et pour identifier les éventuels points aberrants spatiaux et temporels au sein de ces agrégats. Le résultat de cette analyse est un indice local de Moran, une pseudo valeur p (ou une valeur p si aucune permutation n’a été utilisée) et un type d’agrégat ou de point aberrant (CO_TYPE) pour chaque groupe du cube spatio-temporel.
Vous trouverez ci-dessous un récapitulatif des variables ajoutées au Cube spatio-temporel en entrée :
Nom de variable Description Dimension OUTLIER_{ANALYSIS_VARIABLE}_INDEX
Indice local de Moran calculé.
Tridimensionnel : une valeur d’indice local de Moran pour chaque groupe du cube spatio-temporel.
OUTLIER_{ANALYSIS_VARIABLE}_PVALUE
Pseudo valeur p ou valeur p de la statistique Indice local de Moran (Anselin) qui mesure la signification statistique de la valeur de l’indice local de Moran.
Tridimensionnel : une valeur p ou pseudo valeur p pour chaque groupe du cube spatio-temporel.
OUTLIER_{ANALYSIS_VARIABLE}_TYPE
Le type de catégorie de résultat faisant la distinction entre un agrégat statistiquement significatif de valeurs élevées (élevé-élevé), un agrégat de valeurs faibles (faible-faible), un point aberrant dans lequel une valeur élevée est entourée principalement de valeurs faibles (élevé-faible) et un point aberrant dans lequel une valeur faible est entourée principalement de valeurs élevées (faible-élevé).
Tridimensionnel : un type d’agrégat ou de point aberrant pour chaque groupe du cube spatio-temporel. Ce groupe est basé sur une correction FDR.
OUTLIER_{ANALYSIS_VARIABLE}
_HAS_SPATIAL_NEIGHBORS
Indique les localisations qui ont des voisins spatiaux et celles qui s’appuient uniquement sur des voisins temporels.
Bidimensionnel : une classification pour chaque localisation. L’analyse des localisations qui n’ont pas de voisins spatiaux génère des calculs reposant uniquement sur des voisins temporels.
Paramètres
arcpy.stpm.LocalOutlierAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, neighborhood_time_step, {number_of_permutations}, {polygon_mask}, {conceptualization_of_spatial_relationships}, {number_of_neighbors}, {define_global_window})
Nom | Explication | Type de données |
in_cube | Le cube spatio-temporel contenant la variable à analyser. Les cubes spatio-temporels ont une extension de fichier .nc et sont créés à l’aide de divers outils dans la boîte à outils Exploration des modèles spatio-temporels. | File |
analysis_variable | Variable numérique dans le fichier netCDF que vous voulez analyser. | String |
output_features | Classe d’entités en sortie contenant les localisations ayant été considérées comme des agrégats ou points aberrants statistiquement significatifs. | Feature Class |
neighborhood_distance (Facultatif) | Étendue spatiale du voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale. | Linear Unit |
neighborhood_time_step | Nombre d’intervalles temporels à inclure dans le voisinage d’analyse. Cette valeur désigne les entités qui sont analysées ensemble en vue d’évaluer l’agrégation spatio-temporelle locale. | Long |
number_of_permutations (Facultatif) | Nombre de permutations aléatoires pour le calcul des pseudo valeurs p. Le nombre de permutations par défaut est 499. Si vous choisissez 0 permutation, la valeur p standard est calculée.
| Long |
polygon_mask (Facultatif) | Couche d’entités surfaciques dont un ou plusieurs polygones définissent la zone d’étude de l’analyse. Un masque d’analyse surfacique permet, par exemple, d’exclure un lac de grande envergure de l’analyse. Les groupes définis dans le in_cube qui se situent en dehors du masque ne sont pas inclus dans l’analyse. Ce paramètre est uniquement disponible pour les cubes de grille. | Feature Layer |
conceptualization_of_spatial_relationships (Facultatif) | Indique comment les relations spatiales entre les groupes sont définies.
| String |
number_of_neighbors (Facultatif) | Entier spécifiant le nombre minimal ou exact de voisins à inclure dans les calculs du groupe cible. Pour K_NEAREST_NEIGHBORS, chaque groupe aura exactement ce nombre spécifié de voisins. Pour FIXED_DISTANCE, chaque groupe aura au moins ce nombre de voisins (la neighborhood_distance sera temporairement étendue pour garantir ce nombre de voisins, le cas échéant). Si l’une des conceptualisations de contiguïté est sélectionnée, ce nombre minimal de voisins est attribué à chaque groupe. Pour les groupes dont le nombre de voisins contigus est inférieur à celui spécifié, les voisins supplémentaires reposeront sur la proximité avec le centroïde des entités. | Long |
define_global_window (Facultatif) | La statistique Indice local de Moran (Anselin) compare une statistique locale, calculée d’après les voisins de chaque groupe, à une valeur globale. Ce paramètre permet de contrôler les groupes à utiliser pour calculer la valeur globale.
| String |
Exemple de code
Le script suivant pour la fenêtre Python illustre l’utilisation de la fonction LocalOutlierAnalysis.
# LocalOutlierAnalysis of homicides in a metropolitan area
import arcpy
arcpy.env.workspace = r"C:\STPM"
arcpy.stpm.LocalOutlierAnalysis("Homicides.nc", "COUNT", "LOA_Homicides.shp", "5 Miles", 2, 499, "#", "FIXED_DISTANCE", "3", "NEIGHBORHOOD_TIME_STEP")
Le script suivant pour la fenêtre Python autonome illustre l’utilisation de la fonction LocalOutlierAnalysis.
# Create Space Time Cube by aggregating homicide incidents in a metropolitan area
# Import system modules
import arcpy
# Set overwriteOutput property to overwrite existing output, by default
arcpy.env.overwriteOutput = True
# Local variables...
workspace = r"C:\STPM"
try:
# Set the current workspace (to avoid having to specify the full path to the feature
# classes each time)
arcpy.env.workspace = workspace
# Create Space Time Cube by aggregating homicide incident data with 3 months and 3 miles settings
# Process: Create Space Time Cube By Aggregating Points
cube = arcpy.stpm.CreateSpaceTimeCube("Homicides.shp", "Homicides.nc", "MyDate", "#",
"3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS", "HEXAGON_GRID")
# Create a polygon that defines where incidents are possible
# Process: Minimum Bounding Geometry of homicide incident data
arcpy.management.MinimumBoundingGeometry("Homicides.shp", "bounding.shp", "CONVEX_HULL",
"ALL", "#", "NO_MBG_FIELDS")
# Local Outlier Analysis of homicide incident cube using 5 Miles neighborhood
# distance and 2 neighborhood time step with 499 permutations to detect outliers
# Process: Local Outlier Analysis
loa = arcpy.stpm.LocalOutlierAnalysis("Homicides.nc", "COUNT", "LOA_Homicides.shp", "5 Miles",
2, 499, "bounding.shp", "FIXED_DISTANCE")
except arcpy.ExecuteError:
# If any error occurred when running the tool, print the messages
print(arcpy.GetMessages())
Environnements
Cas particuliers
- Générateur de nombres aléatoires
Le type de générateur de nombres aléatoires utilisé est toujours Mersenne Twister.
Vous avez un commentaire à formuler concernant cette rubrique ?