La descomposición de tendencia estacional utilizando el método LOESS (STL) es un método robusto de descomposición de series temporales que se utiliza a menudo en los análisis económicos y medioambientales. El método STL utiliza modelos de regresión ajustados localmente para descomponer una serie temporal en componentes de tendencia, estacional y resto.
Acerca de STL
Puede aplicar STL a cualquier dataset, pero solo se obtienen resultados significativos si existe un patrón temporal recurrente en los datos (por ejemplo, la calidad del aire disminuye durante los meses más cálidos o las compras online aumentan en el cuarto trimestre de cada año). El patrón se muestra en los resultados del modelo STL como componente estacional.
El algoritmo STL realiza el suavizado de las series temporales mediante el método LOESS en dos bucles; el bucle interior itera entre el suavizado estacional y el suavizado de tendencia y el bucle exterior minimiza el efecto de los valores atípicos. Durante el bucle interno, se calcula primero el componente estacional y se elimina para calcular el componente de tendencia. El resto se calcula restando los componentes estacional y de tendencia de la serie temporal.
Los tres componentes del análisis STL se relacionan con las series temporales sin procesar de la siguiente manera:
yi = si + ti + ri
donde:
- yi = El valor de la serie temporal en el punto i.
- si = El valor del componente estacional en el punto i.
- ti = El valor del componente de tendencia en el punto i.
- ri = El valor del componente resto en el punto i.
Ejemplos
Una meteoróloga estudia el efecto del cambio climático en la frecuencia de los tornados en Estados Unidos. Utiliza el método STL para descomponer una serie temporal de recuentos de tornados con el fin de determinar cómo afecta la estacionalidad a la frecuencia de los tornados y si esta última aumenta con el tiempo. La meteoróloga puede comparar de esta manera las tendencias de los tornados con otras tendencias climáticas, como la temperatura media global, para determinar si el cambio climático es un factor de aumento de la frecuencia de los tornados.
Un economista realiza un seguimiento de los precios de la gasolina en su región y busca las tendencias generales de los precios a lo largo del tiempo. Sabe que los precios de la gasolina tienden a aumentar en los meses de verano, por lo que utiliza el análisis STL para descomponer la serie temporal de los precios de la gasolina y analizar la tendencia de forma independiente del componente estacional.
Componente estacional
El componente estacional de un resultado del método STL muestra el patrón temporal recurrente presente en los datos en función de la estacionalidad elegida. Si existe un patrón estacional, normalmente adopta la forma de un patrón oscilante u ondulado.
El suavizado del componente estacional se realiza para cada subserie (semana, mes, trimestre o año) aparte. Por ejemplo, si se utiliza STL con estacionalidad mensual en un dataset con datos recopilados diariamente desde enero de 2015 hasta diciembre de 2020, el suavizado se realiza primero en todos los datos recopilados en enero para todos los años, a continuación en febrero para todos los años, y así sucesivamente hasta que se haya realizado el suavizado de todos los meses. A continuación, las subseries se recombinan para crear el componente estacional.
Ejemplo
El siguiente ejemplo muestra el componente estacional de un análisis STL utilizando incidentes de tornados en Estados Unidos. El componente se calculó utilizando la estacionalidad mensual y oscila entre un recuento alto en junio y un recuento bajo en enero. Las oscilaciones aumentan en amplitud con el tiempo, lo que indica que la variación estacional de la frecuencia de los tornados aumenta con el tiempo.
Componente de tendencia
El componente de tendencia es el segundo componente calculado durante el bucle interno. Los valores del componente estacional se restan de los datos sin procesar, eliminando la variación estacional de la serie temporal. A continuación, se crea una línea de tendencia suavizada aplicando LOESS a los valores restantes.
Ejemplo
El siguiente ejemplo muestra el componente de tendencia de un análisis STL utilizando incidentes de tornados en Estados Unidos. El resultado muestra una tendencia general positiva, lo que significa que el número de incidentes de tornados en Estados Unidos está aumentando con el tiempo.
Componente de resto
El componente de resto se calcula restando los valores del componente estacional y de tendencia de la serie temporal. Los valores de resto indican la cantidad de ruido presente en los datos. Los valores cercanos a cero indican que los componentes estacional y de tendencia son precisos a la hora de describir la serie temporal, mientras que los valores de resto más grandes indican la presencia de ruido.
También puede utilizar el componente de resto para identificar los valores atípicos en los datos, que aparecen como valores positivos o negativos relativamente grandes en comparación con los demás valores del resto.
Ejemplo
El siguiente ejemplo muestra el componente de resto de un análisis STL utilizando incidentes de tornados en Estados Unidos. Los valores de resto comienzan siendo relativamente pequeños y aumentan en años posteriores, lo que indica que la cantidad de ruido en los datos aumentó con el tiempo. Los valores de resto representados también muestran un claro valor atípico en abril de 2011.