Predecir con archivo de modelo de estadística espacial (Estadística espacial)

Resumen

Predice valores continuos o de categorías con un modelo de estadísticas espaciales entrenado (archivo .ssm).

Más información sobre los archivos de modelo de estadística espacial

Uso

  • A continuación, se muestran escenarios de ejemplo para usar esta herramienta:

    • Para un modelo de clasificación y regresión basadas en bosque entrenado sobre la presencia de posidonia mediante numerosas variables explicativas medioambientales representadas como atributos y rásteres, además de las distancias hasta fábricas aguas arriba y puertos importantes, es posible predecir la presencia futura de posidonia basándose en proyecciones futuras de esas variables explicativas medioambientales.
    • Un modelo entrenado por un experto se puede compartir con otras personas para hacer predicciones sin compartir datos confidenciales. Por ejemplo, un modelo sobre los niveles de plomo en sangre en niños y el Id. de parcela fiscal de sus viviendas, combinada con atributos a nivel de parcela (por ejemplo, la antigüedad de la vivienda), datos a nivel de censo (por ejemplo, niveles de ingresos y de estudios) y datasets nacionales que reflejen los vertidos tóxicos de plomo y compuestos de plomo, es posible predecir el riesgo de exposición al plomo para las parcelas sin datos sobre el nivel de plomo en sangre. Estas predicciones de riesgos pueden impulsar las políticas y los programas de educación del área.
    • Un ecólogo de la vida salvaje ha recopilado datos de campo para ubicaciones de presencia observadas de una especie en peligro. Necesita estimar la presencia de la especie en un área de estudio más amplia y compartir su trabajo con otros investigadores. Mediante las ubicaciones de presencia conocidas y con factores subyacentes como rásteres, el ecólogo puede modelar la presencia de la especie utilizando predicciones de solo presencia y compartir el modelo entrenado sin compartir información confidencial sobre la presencia de la especie. El modelo se puede usar para crear un mapa de las ubicaciones predichas donde es más probable que se encuentren la especie.

  • El valor del parámetro Archivo de modelo de entrada es un archivo de .ssm creado por varias herramientas del conjunto de herramientas Modelado de relaciones espaciales de la caja de herramientas Estadísticas espaciales. Puede crear el archivo de modelo con las herramientas Regresión lineal generalizada, Clasificación y regresión basadas en bosques y aumentadas y Predicción de solo presencia (MaxEnt) especificando el valor del parámetro Archivo de modelo entrenado de salida en cada herramienta.

    Consulte Cómo funciona Regresión lineal generalizada, Cómo funciona Clasificación y regresión basadas en bosques y aumentadas y Cómo funciona Predicción de solo presencia para obtener más información sobre cómo cada modelo hace predicciones para cada tipo de modelo.

  • Si usa la opción Predecir a entidades del parámetro Tipo de predicción, use el parámetro Entidad predicha de salida para crear una clase de entidad con las predicciones. Si usa la opción Predecir a ráster, utilice el parámetro Superficie de predicción de salida para crear un ráster de los valores predichos.

  • Para predecir a ráster, el archivo .ssm se debe entrenar solo con rásteres.

  • Se requiere una licencia de ArcGIS Spatial Analyst extension para utilizar un archivo .ssm entrenado con rásteres.

    Nota:

    Se recomienda que ejecute la herramienta Describir archivo de modelo de estadística espacial antes de ejecutar esta herramienta para obtener información sobre los nombres, tipos, descripciones y unidades de las variables para preparar los datos según corresponda. También puede utilizar el diagnóstico del modelo para evaluar la calidad del archivo de modelo de entrada.

  • Las variables explicativas pueden provenir de campos, calcularse a partir de entidades de distancia o extraerse de rásteres. La combinación de las variables explicativas debe coincidir con el archivo de modelo de entrada.

  • Si una variable explicativa o ráster se marca como de categorías al crear el archivo de modelo, el parámetro De categorías se activará y tratará la variable coincidente como de categorías. Puede utilizar la herramienta Describir archivo de modelo de estadística espacial antes de ejecutar esta herramienta para determinar las variables que son de categorías en el archivo de modelo.

  • Las variables de entrenamiento y predicción deben ser tipos de campo similares. Por ejemplo, todos los tipos de campo numérico pueden emparejarse con todos los demás tipos de campo numérico, pero si el campo de entrenamiento es texto, la variable de predicción correspondiente también deberá ser texto.

    Nota:

    Se recomienda que defina las unidades de variable antes de hacer coincidir las variables de entrenamiento y predicción. Si el archivo de modelo entrenado y las unidades de la variable de predicción son diferentes, los resultados pueden ser incorrectos. Por ejemplo, si entrena un modelo con una variable de ingresos en dólares estadounidenses, pero hace coincidir esa variable con los ingresos de rupias indias al realizar predicciones, el rango de variables puede ser incoherente entre las variables de entrenamiento y de predicción, lo que genera variables predichas imprecisas.

  • Esta herramienta también crea mensajes y gráficos que describen el rendimiento del modelo. Para acceder a los mensajes, pase el cursor sobre la barra de progreso y haga clic en el botón emergente o expanda la sección de mensajes del panel Geoprocesamiento. También puede acceder a los mensajes de una ejecución anterior de la herramienta a través del historial de geoprocesamiento. Los mensajes incluyen diagnósticos del modelo y otra información acerca del modelo.

  • En los mensajes de geoprocesamiento, la tabla Parámetros de modelo describe la variable y el tipo de campo que se van a predecir y las variables explicativas utilizadas para crear el modelo. La tabla también contiene unidades (si se ha definido con la herramienta Establecer propiedades del archivo de modelo de estadística espacial) para cada variable, con el fin de garantizar que se alineen con las variables de predicción cuando se use el modelo para realizar predicciones.

    Precaución:

    Se recomienda que evalúe el diagnóstico del modelo antes de confiar en los resultados de predicción. Si un modelo se entrenó sin retener ningún dato de validación, no es posible evaluar la precisión de las predicciones.

    Precaución:

    Al ejecutar la herramienta con ArcPy, el orden y el caso de las variables proporcionadas en las tablas de los valores de los parámetros Variables explicativas coincidentes, Entidades de distancia coincidentes y Rásteres explicativos coincidentes son importantes. Por ejemplo, si tiene dos variables explicativas que representan la temperatura y la humedad, y el valor de temperatura se espera antes del valor de humedad, debe proporcionar las variables en ese orden. Utilice las salidas derivadas de la herramienta Describir archivo de modelo de estadística espacial para obtener el orden correcto de las variables almacenadas en el archivo de modelo de entrada.

Parámetros

EtiquetaExplicaciónTipo de datos
Archivo de modelo de entrada

El archivo de modelo de estadística espacial que se utilizará para realizar nuevas predicciones.

File
Tipo de predicción

Especifica el modo de operación que se utilizará. La herramienta puede predecir nuevas entidades o crear una superficie de ráster de predicción.

  • Predecir a entidadesSe generarán predicciones o clasificaciones para las entidades. Se deben proporcionar variables explicativas para que coincidan con las variables utilizadas para entrenar el archivo de modelo de entrada. La salida de esta opción será una clase de entidad y diagnósticos del modelo en la ventana de mensajes.
  • Predecir a rásterSe generará un ráster de predicción para el área en la que se intersecan los rásteres explicativos. Se deben proporcionar rásteres explicativos para que coincidan con los rásteres utilizados para entrenar el archivo de modelo de entrada. La salida de esta opción será una superficie de predicción y diagnósticos del modelo en la ventana de mensajes.
String
Entidades de predicción de entrada
(Opcional)

Clase de entidad que representa las ubicaciones en las que se realizarán predicciones. Esta clase de entidad también debe contener las variables explicativas proporcionadas como campos que se correspondan con las utilizadas para entrenar el modelo de entrada.

Feature Layer
Entidades predichas de salida
(Opcional)

La clase de entidad de salida que contiene los resultados de predicción.

Feature Class
Ráster predicho de salida
(Opcional)

El ráster de salida que contiene los resultados de predicción. El tamaño de celda predeterminado será el tamaño de celda máximo de los rásteres de entrada.

Raster Dataset
Variables explicativas coincidentes
(Opcional)

Una lista de las variables explicativas del modelo de entrada y los campos correspondientes de las entidades de predicción de entrada. Para cada variable explicativa de la columna Training, proporcione el campo de predicción correspondiente en la columna Prediction. La columna Categorical especifica si la variable es de categorías o continua.

Value Table
Entidades de distancia coincidentes
(Opcional)

Una lista de las entidades de distancia explicativas del modelo de entrada y las entidades de distancia de predicción correspondientes. Para cada entidad de distancia explicativa de la columna Training, proporcione la entidad de distancia de predicción correspondiente en la columna Prediction.

Value Table
Rásteres explicativos coincidentes
(Opcional)

Una lista de los rásteres explicativos del modelo de entrada y los rásteres de predicción correspondientes. Para cada ráster explicativo de la columna Training, proporcione el ráster de predicción correspondiente en la columna Prediction. La columna Categorical especifica si el ráster es de categorías o continuo.

Value Table

arcpy.stats.PredictUsingSSMFile(input_model, prediction_type, {features_to_predict}, {output_features}, {output_raster}, {explanatory_variable_matching}, {explanatory_distance_matching}, {explanatory_rasters_matching})
NombreExplicaciónTipo de datos
input_model

El archivo de modelo de estadística espacial que se utilizará para realizar nuevas predicciones.

File
prediction_type

Especifica el modo de operación que se utilizará. La herramienta puede predecir nuevas entidades o crear una superficie de ráster de predicción.

  • PREDICT_FEATURESSe generarán predicciones o clasificaciones para las entidades. Se deben proporcionar variables explicativas para que coincidan con las variables utilizadas para entrenar el archivo de modelo de entrada. La salida de esta opción será una clase de entidad y diagnósticos del modelo en la ventana de mensajes.
  • PREDICT_RASTERSe generará un ráster de predicción para el área en la que se intersecan los rásteres explicativos. Se deben proporcionar rásteres explicativos para que coincidan con los rásteres utilizados para entrenar el archivo de modelo de entrada. La salida de esta opción será una superficie de predicción y diagnósticos del modelo en la ventana de mensajes.
String
features_to_predict
(Opcional)

Clase de entidad que representa las ubicaciones en las que se realizarán predicciones. Esta clase de entidad también debe contener las variables explicativas proporcionadas como campos que se correspondan con las utilizadas para entrenar el modelo de entrada.

Feature Layer
output_features
(Opcional)

La clase de entidad de salida que contiene los resultados de predicción.

Feature Class
output_raster
(Opcional)

El ráster de salida que contiene los resultados de predicción. El tamaño de celda predeterminado será el tamaño de celda máximo de los rásteres de entrada.

Raster Dataset
explanatory_variable_matching
[[pred1, train1, cat1], [pred2, train2, cat2],...]
(Opcional)

Una lista de las variables explicativas del modelo de entrada y los campos correspondientes de las entidades de predicción de entrada. Para cada variable explicativa de la columna Training, proporcione el campo de predicción correspondiente en la columna Prediction. La columna Categorical especifica si la variable es de categorías o continua.

Value Table
explanatory_distance_matching
[[pred1, cat1], [pred2, cat2],...]
(Opcional)

Una lista de las entidades de distancia explicativas del modelo de entrada y las entidades de distancia de predicción correspondientes. Para cada entidad de distancia explicativa de la columna Training, proporcione la entidad de distancia de predicción correspondiente en la columna Prediction.

Value Table
explanatory_rasters_matching
[[pred1, train1, cat1], [pred2, train2, cat2],...]
(Opcional)

Una lista de los rásteres explicativos del modelo de entrada y los rásteres de predicción correspondientes. Para cada ráster explicativo de la columna Training, proporcione el ráster de predicción correspondiente en la columna Prediction. La columna Categorical especifica si el ráster es de categorías o continuo.

Value Table

Muestra de código

Ejemplo 1 de PredictUsingSSMFile (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función PredictUsingSSMFile.


arcpy.stats.PredictUsingSSMFile(
      "PredictAsthma_Forest.ssm", "PREDICT_FEATURES", 
      "MedicareSpendingData", "Predicted_features", None, 
      "AVERAGE_HCC_SCORE_2010_CAT AVERAGE_HCC_SCORE_2010_CAT true;
      HOSPBEDSD_INT HOSPBEDSD_INT false; 
      PERCENT_ASTHMA_2010_DBL PERCENT_ASTHMA_2010_DBL false", 
      "Distance_Hospital DF_POLY", "EVANDMAND_RASTER EVANDMAND #")
Ejemplo 2 de PredictUsingSSMFile (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función PredictUsingSSMFile.

# Predict to Raster using the Predict using spatial statistics model file tool 

# Import system modules.
import arcpy
import os

# Set workspace.
arcpy.env.workspace = r"C:\Analysis"
arcpy.env.overwriteOutput = True

# Read the explanatory raster order and variable names using Describe Spatial 
# Statistics Model File tool.
in_model = "Suitability.ssm"
desc_result = arcpy.stats.DescribeSSMFile(in_model)

# Print the list of explanatory rasters.
print(desc_result[2])

# Split the explanatory raster strings into a list of variable names.
exp_ras = desc_result[2].split(";")

# Set Parameters for prediction.
prediction_type="PREDICT_RASTER"
out_raster= "suitability_predicted_raster.tif"
match_exp_ras0 = "Climate_Bio2050.tif"
match_exp_ras1 = "Climate_Temp2050.tif"
match_exp_ras2 = "Climate_Solar2050.tif"
match_rasters = [[match_exp_ras0, exp_ras[0], None], 
                 [match_exp_ras1, exp_ras[1], None], 
                 [match_exp_ras2, exp_ras[2], None]]

# Run tool.
arcpy.stats.PredictUsingSSMFile(in_model, prediction_type, "", "", out_raster, 
                "", "", match_rasters)