A decomposição de Tendência Sazonal usando LOESS (STL) é um método robusto de decomposição da série de tempo frequentemente usado em análises econômicas e ambientais. O método STL usa modelos de regressão ajustados localmente para decompor uma série de tempo em tendência, sazonalidade e componentes remanescentes.
Sobre STL
Você pode aplicar STL a qualquer conjunto de dados, mas resultados significativos serão retornados somente se houver um padrão temporal recorrente nos dados (por exemplo, diminuição da qualidade do ar durante os meses mais quentes ou aumento das compras online no quarto trimestre de cada ano). O padrão é exibido nos resultados do STL como o componente sazonal.
O algoritmo STL executa suavização na série de tempo usando LOESS em dois loops; o loop interno itera entre a suavização sazonal e de tendência e o loop externo minimiza o efeito de valores atípicos. Durante o loop interno, o componente sazonal é calculado primeiro e removido para calcular o componente de tendência. O restante é calculado subtraindo os componentes sazonais e de tendência da série de tempo.
Os três componentes da análise STL se relacionam com a série de tempo bruta da seguinte forma:
yi = si + ti + ri
Onde:
- yi = O valor da série de tempo no ponto i.
- si = O valor do componente sazonal no ponto i.
- ti = O valor do componente de tendência no ponto i.
- ri = O valor do componente restante no ponto i.
Exemplos
Um meteorologista está estudando o efeito da mudança climática na frequência dos tornados nos Estados Unidos. Ela usa STL para decompor uma série de tempo de contagens de tornados para determinar como a sazonalidade afeta a frequência dos tornados e se a frequência dos tornados aumentou ao longo do tempo. O meteorologista pode então comparar as tendências dos tornados com outras tendências climáticas, como a temperatura global média, para determinar se as mudanças climáticas são um fator no aumento da frequência dos tornados.
Um economista está monitorando os preços do gás em sua região e procurando tendências gerais nos preços ao longo do tempo. Ele sabe que os preços do gás tendem a aumentar nos meses de verão, então ele usa a análise STL para decompor a série de tempo dos preços do gás e analisar a tendência separadamente do componente sazonal.
Componente sazonal
O componente sazonal de uma saída STL mostra o padrão temporal recorrente presente nos dados com base na sazonalidade escolhida. Se houver um padrão sazonal, ele normalmente assume a forma de um padrão oscilante ou de onda.
A suavização do componente sazonal é realizada para cada subsérie (semana, mês, trimestre ou ano) separadamente. Por exemplo, se estiver usando STL com sazonalidade mensal em um conjunto de dados com dados coletados diariamente de Janeiro de 2015 a Dezembro de 2020, a suavização será realizada primeiro em todos os dados coletados em Janeiro para todos os anos, em Fevereiro para todos os anos e assim por diante até todos os meses tiveram a suavização executada. As subséries são então, recombinadas para criar o componente sazonal.
Exemplo
O seguinte exemplo mostra o componente sazonal de uma análise STL usando incidentes de tornado nos Estados Unidos. O componente foi calculado com base na sazonalidade mensal e oscila entre uma contagem alta em Junho e uma contagem baixa em Janeiro. As oscilações aumentam em amplitude ao longo do tempo, o que indica que a variação sazonal na frequência do tornado está aumentando ao longo do tempo.
Componente de tendência
O componente de tendência é o segundo componente calculado durante o loop interno. Os valores do componente sazonal são subtraídos dos dados brutos, eliminando a variação sazonal da série de tempo. Uma linha de tendência suavizada é então criada aplicando LOESS aos valores restantes.
Exemplo
O seguinte exemplo mostra o componente de tendência de uma análise STL usando incidentes de tornado nos Estados Unidos. O resultado mostra uma tendência geral positiva, o que significa que o número de incidentes de tornado nos Estados Unidos está aumentando com o tempo.
Componente restante
O componente restante é calculado subtraindo os valores do componente sazonal e de tendência da série de tempo. Os valores restantes indicam a quantidade de ruído presente nos dados. Valores próximos de zero indicam que os componentes sazonais e de tendência são precisos na descrição da série de tempo, enquanto os valores remanescentes maiores indicam a presença de ruído.
Você também pode usar o componente restante para identificar valores discrepantes nos dados, que aparecem como valores positivos ou negativos relativamente grandes em comparação com os outros valores restantes.
Exemplo
O seguinte exemplo mostra o componente restante de uma análise STL usando incidentes de tornado nos Estados Unidos. Os valores restantes começam relativamente pequenos e se tornam maiores nos anos posteriores, o que indica que a quantidade de ruído nos dados aumentou com o tempo. Os valores restantes plotados também mostram um valor atípico claro em Abril de 2011.