Previsión de suavizado exponencial (Minería de patrones en espacio-tiempo)

Resumen

Predice los valores de cada ubicación de un cubo de espacio-tiempo utilizando el método de suavizado exponencial Holt-Winters al descomponer las series temporales de cada cubo de ubicación en componentes estacionales y de tendencia.

Más información sobre el funcionamiento de la previsión de suavizado exponencial

Ilustración

Ilustración de la herramienta Predicción de suavizado exponencial
La herramienta Predicción de suavizado exponencial se utiliza para predecir los valores de periodos de tiempo futuros.

Uso

  • Esta herramienta acepta archivos netCDF creados con las herramientas Crear cubo de espacio-tiempo agregando puntos, Crear cubo de espacio-tiempo a partir de entidades definidas y Crear cubo de espacio-tiempo a partir de capa ráster multidimensional.

  • En comparación con otras herramientas de predicción del conjunto de herramientas Predicción de serie temporal, esta herramienta se recomienda para datos que presenten tendencias moderadas y un comportamiento estacional marcado. Al utilizar el modelo de suavizado exponencial se asume que se pueden separar el comportamiento estacional y la tendencia, por lo que el modelo resulta más eficaz con datos con una tendencia que cambia gradualmente y sigue patrones estacionales constantes a lo largo del tiempo.

  • Se pueden comparar y fusionar varios cubos de espacio-tiempo predichos mediante la herramienta Evaluar previsiones por ubicación. Esto permite crear varios cubos de previsión con parámetros y herramientas de previsión diferentes; la herramienta identificará la mejor previsión correspondiente a cada ubicación por medio del error cuadrático medio de previsión (RMSE) o el RMSE de validación.

  • Para cada ubicación del parámetro Cubo de espacio-tiempo de entrada, la herramienta crea dos modelos que sirven para diferentes propósitos.

    • Modelo de predicción: este modelo se utiliza para predecir los valores del cubo de espacio-tiempo realizando un suavizado exponencial a los valores de las series temporales y extendiendo este suavizado a futuros periodos de tiempo. El ajuste del modelo de previsión a los valores del cubo de espacio-tiempo se mide mediante el valor de RMSE de previsión.
    • Modelo de validación: este modelo se utiliza para validar el modelo de predicción y evaluar con qué precisión es capaz de predecir los valores. Si se especifica un número mayor que 0 en el parámetro Número de periodos de tiempo a excluir para la validación, este modelo se ajusta a los periodos de tiempo incluidos y se utiliza para predecir los valores de los periodos de tiempo excluidos. Permite ver con qué precisión el modelo puede predecir valores. El ajuste de los valores previstos a los valores excluidos se mide mediante el valor RMSE de validación.

    Más información sobre el modelo de previsión, el modelo de validación y la estadística de RMSE

  • Los valores del parámetro Entidades de salida se agregarán al panel Contenido con una representación en pantalla basada en el periodo de tiempo predicho final.

  • Esta herramienta genera mensajes de geoprocesamiento y gráficos emergentes que puede utilizar para comprender y visualizar los resultados de predicción. Los mensajes contienen información sobre la estructura del cubo de espacio-tiempo y estadísticas resumidas de los valores de RMSE y la duración de las estaciones. Haga clic en una entidad con la herramienta de navegación Explorar para que aparezca un gráfico de líneas en el panel Elementos emergentes que muestra los valores del cubo de espacio-tiempo, los valores del bosque ajustados, los valores predichos y los límites de confianza de esa ubicación.

  • El parámetro Opción de valor atípico se puede utilizar para detectar valores atípicos estadísticamente significativos en los valores de la serie temporal de cada ubicación.

    Más información sobre cómo detectar valores atípicos de series temporales

  • La decisión sobre cuántos periodos de tiempo deben excluirse para la validación es importante. Cuantos más periodos de tiempo se excluyan, menores periodos de tiempo se mantienen para estimar el modelo de validación. No obstante, si se excluyen muy pocos periodos de tiempo, el RMSE de validación se estimará usando una pequeña cantidad de datos y puede llevar a engaño. Se recomienda excluir los máximos periodos de tiempo posibles, pero manteniendo a la vez suficientes periodos de tiempo para estimar el modelo de validación. También se recomienda mantener al menos tanto periodos de tiempo para validación como número de periodos de tiempo pretenda pronosticar si el cubo de espacio-tiempo tiene suficientes periodos de tiempo para permitirlo.

  • El modelo de suavizado exponencial asume que todos los componentes son aditivos y lineales. Siempre se utiliza la tendencia amortiguada; la estacionalidad aditiva se admite, pero no es obligatoria. Los intervalos de confianza se construyen bajo la suposición de que los residuales son aditivos y se distribuyen normalmente.

    Más información sobre los componentes del modelo de suavizado exponencial

Parámetros

EtiquetaExplicaciónTipo de datos
Cubo de espacio-tiempo de entrada

El cubo netCDF que contiene la variable para predecir los periodos de tiempo futuros. Este archivo debe tener una extensión .nc y se debe haber creado utilizando las herramientas Crear cubo de espacio-tiempo agregando puntos, Crear cubo de espacio-tiempo a partir de ubicaciones definidas o Crear cubo de espacio-tiempo a partir de capa ráster multidimensional.

File
Variable de análisis

Variable numérica del archivo netCDF que se pronosticará en periodos de tiempo futuros.

String
Entidades de salida

Clase de entidad de salida de todas las ubicaciones en el cubo de espacio-tiempo con valores previstos almacenados como campos. La capa muestra la predicción del paso de tiempo final y contiene gráficos emergentes que muestran las series de tiempo, las predicciones y los límites de confianza del 90 por ciento de cada ubicación.

Feature Class
Cubo de espacio-tiempo de salida
(Opcional)

Nuevo cubo de espacio-tiempo (archivo .nc) que contiene los valores del cubo de espacio-tiempo de entrada con los periodos de tiempo previstos anexados. La herramienta Visualizar cubo de espacio-tiempo en 3D puede utilizarse para ver todos los valores observados y previstos de forma simultánea.

File
Número de periodos de tiempo para previsión
(Opcional)

Entero positivo que especifica el número de periodos de tiempo de la previsión. Este valor no puede ser mayor que el 50% de los periodos de tiempo totales del cubo de espacio-tiempo de entrada. El valor predeterminado es un periodo de tiempo.

Long
Duración de estación

Número de periodos de tiempo correspondientes a una estación en cada ubicación. Si hay varias estaciones en los datos, se recomienda que utilice la estación más larga para producir el resultado más fiable. Si no se especifica ningún valor, la herramienta estimará la duración de una estación en cada ubicación con una función de densidad espectral.

Long
Número de periodos de tiempo a excluir para validación
(Opcional)

Número de periodos de tiempo al final de cada serie temporal que se van a excluir para validación. El valor predeterminado es el 10% (redondeado por defecto) del número de periodos de tiempo de entrada y no puede ser mayor que el 25% del número de periodos de tiempo. Si no quiere excluir ningún periodo de tiempo, introduzca el valor 0.

Long
Opción de valor atípico
(Opcional)

Especifica si se identificarán valores atípicos de series temporales estadísticamente significativos.

  • NadaNo se identificarán valores atípicos. Esta es la opción predeterminada.
  • Identificar valores atípicosSe identificarán valores atípicos utilizando la prueba de ESD generalizada.
String
Nivel de confianza
(Opcional)

Especifica el nivel de confianza para la prueba de los valores atípicos de series temporales.

  • 90%El nivel de confianza para la prueba es de un 90 por ciento. Esta es la opción predeterminada.
  • 95%El nivel de confianza para la prueba es de un 95 por ciento.
  • 99%El nivel de confianza para la prueba es de un 99 por ciento.
String
Número máximo de valores atípicos

El número máximo de periodos de tiempo que se pueden declarar como valores atípicos para cada ubicación. El valor predeterminado corresponde a un cinco por ciento (redondeado a la baja) del número de periodos de tiempo del cubo de espacio-tiempo de entrada (siempre se utilizará un valor de al menos 1). Este valor no puede superar el 20 por ciento del número de periodos de tiempo.

Long

arcpy.stpm.ExponentialSmoothingForecast(in_cube, analysis_variable, output_features, {output_cube}, {number_of_time_steps_to_forecast}, season_length, {number_for_validation}, {outlier_option}, {level_of_confidence}, maximum_number_of_outliers)
NombreExplicaciónTipo de datos
in_cube

El cubo netCDF que contiene la variable para predecir los periodos de tiempo futuros. Este archivo debe tener una extensión .nc y se debe haber creado utilizando las herramientas Crear cubo de espacio-tiempo agregando puntos, Crear cubo de espacio-tiempo a partir de ubicaciones definidas o Crear cubo de espacio-tiempo a partir de capa ráster multidimensional.

File
analysis_variable

Variable numérica del archivo netCDF que se pronosticará en periodos de tiempo futuros.

String
output_features

Clase de entidad de salida de todas las ubicaciones en el cubo de espacio-tiempo con valores previstos almacenados como campos. La capa muestra la predicción del paso de tiempo final y contiene gráficos emergentes que muestran las series de tiempo, las predicciones y los límites de confianza del 90 por ciento de cada ubicación.

Feature Class
output_cube
(Opcional)

Nuevo cubo de espacio-tiempo (archivo .nc) que contiene los valores del cubo de espacio-tiempo de entrada con los periodos de tiempo previstos anexados. La herramienta Visualizar cubo de espacio-tiempo en 3D puede utilizarse para ver todos los valores observados y previstos de forma simultánea.

File
number_of_time_steps_to_forecast
(Opcional)

Entero positivo que especifica el número de periodos de tiempo de la previsión. Este valor no puede ser mayor que el 50% de los periodos de tiempo totales del cubo de espacio-tiempo de entrada. El valor predeterminado es un periodo de tiempo.

Long
season_length

Número de periodos de tiempo correspondientes a una estación en cada ubicación. Si hay varias estaciones en los datos, se recomienda que utilice la estación más larga para producir el resultado más fiable. Si no se especifica ningún valor, la herramienta estimará la duración de una estación en cada ubicación con una función de densidad espectral.

Long
number_for_validation
(Opcional)

Número de periodos de tiempo al final de cada serie temporal que se van a excluir para validación. El valor predeterminado es el 10% (redondeado por defecto) del número de periodos de tiempo de entrada y no puede ser mayor que el 25% del número de periodos de tiempo. Si no quiere excluir ningún periodo de tiempo, introduzca el valor 0.

Long
outlier_option
(Opcional)

Especifica si se identificarán valores atípicos de series temporales estadísticamente significativos.

  • NONENo se identificarán valores atípicos. Esta es la opción predeterminada.
  • IDENTIFYSe identificarán valores atípicos utilizando la prueba de ESD generalizada.
String
level_of_confidence
(Opcional)

Especifica el nivel de confianza para la prueba de los valores atípicos de series temporales.

  • 90%El nivel de confianza para la prueba es de un 90 por ciento. Esta es la opción predeterminada.
  • 95%El nivel de confianza para la prueba es de un 95 por ciento.
  • 99%El nivel de confianza para la prueba es de un 99 por ciento.
String
maximum_number_of_outliers

El número máximo de periodos de tiempo que se pueden declarar como valores atípicos para cada ubicación. El valor predeterminado corresponde a un cinco por ciento (redondeado a la baja) del número de periodos de tiempo del cubo de espacio-tiempo de entrada (siempre se utilizará un valor de al menos 1). Este valor no puede superar el 20 por ciento del número de periodos de tiempo.

Long

Muestra de código

Ejemplo 1 de ExponentialSmoothingForecast (ventana de Python)

En el siguiente script de Python se muestra cómo utilizar la herramienta ExponentialSmoothingForecast.

import arcpy
arcpy.env.workspace = "C:/Analysis"
# Forecast four time steps using exponential smoothing.
arcpy.stpm.ExponentialSmoothingForecast("Temperature.nc","Temp_NONE_ZEROS", 
                                        "Analysis.gdb/Forecasts", 
                                        "outForecastCube.nc", 4, 2, 5)
Ejemplo 2 de ExponentialSmoothingForecast (script independiente)

En el siguiente script de Python se muestra cómo utilizar la herramienta ExponentialSmoothingForecast para predecir la temperatura.

# Forecast temperature using exponential smoothing.
# Import system modules.
import arcpy
# Set property to overwrite existing output.
arcpy.env.overwriteOutput = True
# Set workspace.
workspace = r"C:\Analysis"
arcpy.env.workspace = workspace
# Forecast three time steps.
arcpy.stpm.ExponentialSmoothingForecast("Temperature.nc","Temp_NONE_ZEROS", 
                                        "Analysis.gdb/Forecasts", 
                                        "outForecastCube.nc", 3, 2, 5,
                                        "IDENTIFY", "90%", 4)
# Create a feature class visualizing the forecasts.
arcpy.stpm.VisualizeSpaceTimeCube3D("outForecastCube.nc", "Temp_NONE_ZEROS", 
                                    "VALUE", "Analysis.gdb/ForecastsFC")