Prévoir à l’aide d’un fichier de modèle de statistiques spatiales (Statistiques spatiales)—ArcGIS AllSource

Synthèse

Prévoit des valeurs continues ou catégorielles à l’aide d’un modèle de statistiques spatiales entraîné (fichier .ssm).

Plus d’informations sur les fichiers de modèle de statistiques spatiales

Utilisation

Voici des scénarios d’exemple d’utilisation de cet outil :
- Dans le cas d’un modèle de classification et de régression basées sur une forêt entraîné à déterminer la présence d’herbiers marins à l’aide d’un certain nombre de variables explicatives environnementales représentées sous forme d’attributs et de rasters, en supplément des distances par rapport aux usines situées en amont et aux ports principaux, il est possible de prévoir la présence future d’herbiers marins sur la base de projections dans l’avenir de ces variables explicatives environnementales.
- Il est possible de partager un modèle entraîné par un expert afin de permettre à d’autres utilisateurs d’effectuer des prévisions sans partager de données confidentielles. Ainsi, avec un modèle combinant les niveaux de plomb relevés dans le sang des enfants, les identifiants d’imposition et de parcelle de leurs domiciles et incluant des attributs au niveau de la parcelle comme l’année de construction d’un logement, des données de recensement tels que les niveaux de revenu et d’éducation et les jeux de données nationaux reflétant les émissions toxiques de plomb et de composés de plomb, il est possible de prévoir le risque d’exposition au plomb des parcelles pour lesquelles vous n’avez pas de données sur les niveaux de plomb dans le sang. Ces prévisions de risques peuvent guider la mise en place de politiques et de programmes d’éducation dans cette zone.
- Un spécialiste de la faune sauvage a collecté sur le terrain des données relatives aux emplacements où ont été observées des espèces menacées. Ce spécialiste a besoin d’estimer la présence de ces espèces dans une zone d’étude plus large et de partager son travail avec d’autres chercheurs. S’il utilise les emplacements de présence connue et fournit les facteurs sous-jacents en tant que rasters, ce spécialiste peut modéliser la présence de ces espèces au moyen d’une prévision de présence uniquement et partager le modèle entraîné sans partager d’informations sensibles sur la présence de ces espèces. Le modèle peut être utilisé pour créer une carte de prévision des emplacements où les espèces ont le plus de chances d’être trouvées.
La valeur du paramètre Fichier de modèle en entrée est un fichier de modèle de statistiques spatiales (.ssm) créé à l’aide de plusieurs outils du jeu d’outils Modélisation des relations spatiales de la boîte à outils Statistiques spatiales. Vous pouvez créer le fichier de modèle à l’aide des outils Régression linéaire généralisée, Régression et classification basées sur une forêt et Prévision de présence uniquement (MaxEnt) en spécifiant la valeur du paramètre Fichier du modèle entraîné en sortie dans chaque outil.
Consultez les rubriques Fonctionnement de la régression linéaire généralisée, Fonctionnement de l’outil Classification et régression basées sur une forêt et Fonctionnement de l’outil Prévision de présence uniquement pour comprendre comment chaque modèle effectue les prévisions pour chaque type de modèle.
Lorsque vous utilisez l’option Prévoir des entités du paramètre Type de prévision, utilisez le paramètre Entité prévue en sortie pour créer une classe d’entités contenant les prévisions. Lorsque vous utilisez l’option Prévoir un raster, utilisez le paramètre Surface de prévision en sortie pour créer un raster des valeurs prévues.
Pour prévoir un raster, le fichier .ssm doit avoir été entraîné en utilisant uniquement des rasters.
Une licence ArcGIS Spatial Analyst extension est requise pour utiliser un fichier .ssm entraîné à l’aide de rasters.
Remarque :
Il est recommandé d’exécuter l’outil Décrire le fichier de modèle de statistiques spatiales avant d’exécuter cet outil pour en savoir plus sur les noms de variables, les types, les descriptions et les unités afin de préparer les données en conséquence. Vous pouvez également utiliser les diagnostics du modèle pour évaluer la qualité du fichier de modèle en entrée.
Les variables explicatives peuvent provenir de champs, être calculées à partir d’entités de distance ou extraites de rasters. La combinaison des variables explicatives doit correspondre au fichier de modèle en entrée.
Si une variable ou un raster explicatif est défini comme catégoriel lors de la création du fichier de modèle, le paramètre Catégoriel sera sélectionné et la variable correspondante sera traitée comme catégorielle. Vous pouvez utiliser l’outil Décrire le fichier de modèle de statistiques spatiales avant d’exécuter cet outil pour déterminer quelles variables du fichier de modèle sont catégorielles.
Le type de champ des variables d’entraînement et de prévision doit correspondre. Ainsi, si le champ d’entraînement est de type texte, la variable de prévision correspondante devra également être de type texte.
Remarque :
Nous vous recommandons de définir les unités des variables avant de faire correspondre les variables d’entraînement et de prévision. Il se peut que les résultats soient incorrects si le fichier de modèle entraîné et les unités des variables de prévision diffèrent. Par exemple, si vous entraînez un modèle en utilisant une variable de revenu en dollars américains, mais que vous faites correspondre cette variable à un revenu exprimé en roupies indiennes lors des prévisions, une incohérence risque d’exister dans la plage des variables entre les variables entraînées et les variables de prévision, ce qui se traduira par des variables de prévision inexactes.
Cet outil crée également des messages et des diagrammes qui décrivent la performance du modèle. Vous pouvez accéder aux messages en passant le curseur de la souris sur la barre d’avancement, en cliquant sur le bouton de menu contextuel ou en développant la section de messages dans la fenêtre Geoprocessing (Géotraitement). Vous pouvez également accéder aux messages d’une précédente exécution de l’outil via l’historique du géotraitement. Ces messages comprennent les diagnostics du modèle et d’autres informations sur le modèle.
Dans les messages de géotraitement, le tableau Paramètres du modèle décrit la variable et le type de champ à prévoir et les variables explicatives utilisées pour créer le modèle. Le tableau contient également les unités (si elles ont été définies à l’aide de l’outil Définir les propriétés du fichier de modèle de statistiques spatiales) de chaque variable pour garantir que celles-ci correspondent aux variables de prévision lorsque le modèle est utilisé pour effectuer des prévisions.
Attention :
Nous vous recommandons d’évaluer les diagnostics du modèle avant de vous fier aux résultats de la prévision. La précision des prévisions ne peut pas être évaluée si un modèle a été entraîné sans qu’aucune donnée de validation ne soit retenue.
Attention :
Lorsque l’on exécute l’outil à l’aide de ArcPy, il est important de respecter l’ordre et le cas des variables fournies dans les tableaux de valeurs des paramètres Apparier les variables explicatives, Apparier les entités de distance et Apparier les rasters explicatifs. Par exemple, si vous avez deux variables explicatives représentant la température et l’humidité, et que la valeur de la température est attendue avant celle de l’humidité, vous devez fournir ces variables dans cet ordre. Utilisez les sorties dérivées de l’outil Décrire le fichier de modèle de statistiques spatiales pour obtenir l’ordre correct des variables stockées dans le fichier de modèle en entrée.

Paramètres

Étiquette	Explication	Type de données
Fichier de modèle en entrée.	Le fichier de modèle de statistiques spatiales qui sera utilisé pour effectuer les prévisions.	File
Type de prévision	Spécifie le mode d’opération qui sera utilisé. L’outil peut prévoir les nouvelles entités ou créer une surface raster de prévision. Prévoir des entités—Les prévisions ou les classifications seront générées pour les entités. Les variables explicatives doivent être fournies pour les faire correspondre aux variables utilisées pour entraîner le fichier de modèle en entrée. Cette option génère une classe d’entités et des diagnostics de modèle dans la fenêtre de messages. Prévoir un raster—Un raster de prédiction est généré pour la zone correspondant à l’intersection des rasters explicatifs. Les rasters explicatifs doivent être fournis pour les faire correspondre aux rasters utilisés pour entraîner le fichier de modèle en entrée. Cette option génère une surface de prédiction et des diagnostics de modèle dans la fenêtre de messages.	String
Entités de prévision en entrée (Facultatif)	Classe d’entités qui représente les emplacements où des prévisions sont réalisées. Cette classe d’entités doit également comporter toutes les variables explicatives fournies en tant que champs et correspondant aux champs utilisés pour entraîner le modèle en entrée.	Feature Layer
Entités prévues en sortie (Facultatif)	La classe d’entités en sortie qui contient les résultats de la prévision.	Feature Class
Raster prévu en sortie (Facultatif)	Le raster en sortie qui contient les résultats de la prévision. La taille de cellule par défaut correspondra à la taille de cellule maximale des rasters en entrée.	Raster Dataset
Apparier les variables explicatives (Facultatif)	Une liste des variables explicatives du modèle en entrée et des champs correspondants des entités de prévision en entrée. Pour chaque variable explicative de la colonne Training, fournissez le champ de prévision correspondant dans la colonne Prediction. La colonne Categorical indique si la variable est catégorielle ou continue.	Value Table
Apparier les entités de distance (Facultatif)	Une liste des entités de distance explicatives du modèle en entrée et les entités de distance de prévision correspondantes. Pour chaque entité de distance explicative de la colonne Training, fournissez l’entité de distance de prévision correspondante dans la colonne Prediction.	Value Table
Apparier les rasters explicatifs (Facultatif)	Une liste des rasters explicatifs du modèle en entrée et les rasters de prévision correspondants. Pour chaque raster explicatif de la colonne Training, fournissez le raster de prévision correspondant dans la colonne Prediction. La colonne Categorical indique si le raster est catégoriel ou continu.	Value Table

arcpy.stats.PredictUsingSSMFile(input_model, prediction_type, {features_to_predict}, {output_features}, {output_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching})

Nom	Explication	Type de données
input_model	Le fichier de modèle de statistiques spatiales qui sera utilisé pour effectuer les prévisions.	File
prediction_type	Spécifie le mode d’opération qui sera utilisé. L’outil peut prévoir les nouvelles entités ou créer une surface raster de prévision. PREDICT_FEATURES—Les prévisions ou les classifications seront générées pour les entités. Les variables explicatives doivent être fournies pour les faire correspondre aux variables utilisées pour entraîner le fichier de modèle en entrée. Cette option génère une classe d’entités et des diagnostics de modèle dans la fenêtre de messages. PREDICT_RASTER—Un raster de prédiction est généré pour la zone correspondant à l’intersection des rasters explicatifs. Les rasters explicatifs doivent être fournis pour les faire correspondre aux rasters utilisés pour entraîner le fichier de modèle en entrée. Cette option génère une surface de prédiction et des diagnostics de modèle dans la fenêtre de messages.	String
features_to_predict (Facultatif)	Classe d’entités qui représente les emplacements où des prévisions sont réalisées. Cette classe d’entités doit également comporter toutes les variables explicatives fournies en tant que champs et correspondant aux champs utilisés pour entraîner le modèle en entrée.	Feature Layer
output_features (Facultatif)	La classe d’entités en sortie qui contient les résultats de la prévision.	Feature Class
output_raster (Facultatif)	Le raster en sortie qui contient les résultats de la prévision. La taille de cellule par défaut correspondra à la taille de cellule maximale des rasters en entrée.	Raster Dataset
explanatory_variable_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (Facultatif)	Une liste des variables explicatives du modèle en entrée et des champs correspondants des entités de prévision en entrée. Pour chaque variable explicative de la colonne Training, fournissez le champ de prévision correspondant dans la colonne Prediction. La colonne Categorical indique si la variable est catégorielle ou continue.	Value Table
explanatory_distance_matching [[pred1, cat1], [pred2, cat2],...] (Facultatif)	Une liste des entités de distance explicatives du modèle en entrée et les entités de distance de prévision correspondantes. Pour chaque entité de distance explicative de la colonne Training, fournissez l’entité de distance de prévision correspondante dans la colonne Prediction.	Value Table
explanatory_rasters_matching [[pred1, train1, cat1], [pred2, train2, cat2],...] (Facultatif)	Une liste des rasters explicatifs du modèle en entrée et les rasters de prévision correspondants. Pour chaque raster explicatif de la colonne Training, fournissez le raster de prévision correspondant dans la colonne Prediction. La colonne Categorical indique si le raster est catégoriel ou continu.	Value Table

Exemple de code

Exemple 1 d’utilisation de l’outil PredictUsingSSMFile (fenêtre Python)

Le script suivant pour la fenêtre Python illustre l’utilisation de la fonction PredictUsingSSMFile.


arcpy.stats.PredictUsingSSMFile(
      "PredictAsthma_Forest.ssm", "PREDICT_FEATURES", 
      "MedicareSpendingData", "Predicted_features", None, 
      "AVERAGE_HCC_SCORE_2010_CAT AVERAGE_HCC_SCORE_2010_CAT true;
      HOSPBEDSD_INT HOSPBEDSD_INT false; 
      PERCENT_ASTHMA_2010_DBL PERCENT_ASTHMA_2010_DBL false", 
      "Distance_Hospital DF_POLY", "EVANDMAND_RASTER EVANDMAND #")

Exemple 2 d’utilisation de l’outil PredictUsingSSMFile (script autonome)

Le script Python autonome ci-dessous illustre l’utilisation de la fonction PredictUsingSSMFile.

# Predict to Raster using the Predict using spatial statistics model file tool 

# Import system modules.
import arcpy
import os

# Set workspace.
arcpy.env.workspace = r"C:\Analysis"
arcpy.env.overwriteOutput = True

# Read the explanatory raster order and variable names using Describe Spatial 
# Statistics Model File tool.
in_model = "Suitability.ssm"
desc_result = arcpy.stats.DescribeSSMFile(in_model)

# Print the list of explanatory rasters.
print(desc_result[2])

# Split the explanatory raster strings into a list of variable names.
exp_ras = desc_result[2].split(";")

# Set Parameters for prediction.
prediction_type="PREDICT_RASTER"
out_raster= "suitability_predicted_raster.tif"
match_exp_ras0 = "Climate_Bio2050.tif"
match_exp_ras1 = "Climate_Temp2050.tif"
match_exp_ras2 = "Climate_Solar2050.tif"
match_rasters = [[match_exp_ras0, exp_ras[0], None], 
                 [match_exp_ras1, exp_ras[1], None], 
                 [match_exp_ras2, exp_ras[2], None]]

# Run tool.
arcpy.stats.PredictUsingSSMFile(in_model, prediction_type, "", "", out_raster, 
                "", "", match_rasters)

Environnements

Système de coordonnées en sortie, Facteur de traitement parallèle, Taille de cellule, Étendue, Méthode de projection de la taille de cellule, Masque, Générateur de nombres aléatoires, Raster de capture

Cas particuliers

Générateur de nombres aléatoires: Le type de générateur de nombres aléatoires utilisé est toujours Mersenne Twister.

Vous avez un commentaire à formuler concernant cette rubrique ?