Decomposizione Trend-Stagionale attraverso l'utilizzo del LOESS

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

La Seasonal-Trend decomposition using LOESS (STL) o decomposizone Trend-Stagionale attraverso l'utilizzo del LOESS, è un valido metodo di decomposizione di una serie temporale spesso utilizzato nelle analisi economiche ed ambientali. Il metodo STL utilizza dei modelli di regressione adattati alla posizione per decomporre una serie temporale in componenti di trend, stagionali e rimanenti.

Informazioni sull'STL

È possibile applicare l'STL a qualsiasi dataset, ma per ottenere dei risultati significativi, nei dati deve esistere un modello temporale ricorrente (ad esempio, la qualità dell'aria decrescente durante i mesi più caldi o gli acquisti online in aumento nel quarto trimestre di ogni anno). Il modello è visualizzato nei risultati dell'STL come componente stagionale.

L'algoritmo STL esegue uno smussamento della serie temporale utilizzando il metodo LOESS in due cicli; il ciclo più interno si muove fra lo smussamento stagionale e di trend e il più esterno minimizza l'effetto dei valori erratici. Durante il ciclo interno, la componente stagionale è calcolata per prima e viene rimossa per il calcolo della componente di trend. Il rimanente viene calcolato sottraendo le componenti stagionali e di trend dalla serie temporale.

Le tre componenti dell'analisi STL sono correlate alla serie temporale allo stato originario come segue:

yi = si + ti + ri

dove:

  • yi = Il valore della componente temporale ad un punto i.
  • si = Il valore della componente stagionale ad un punto i.
  • ti = Il valore della componente di trend ad un punto i.
  • ri = Il valore della componente rimanente ad un punto i.

Esempi

Una meteorologa sta studiando l'effetto del cambiamento climatico sulla frequenza dei tornado negli Stati Uniti. Grazie all'STL, decompone la serie temporale dei conteggi di tornado per determinare l'impatto della stagionalità sulla frequenza dei tornado e se la frequenza dei tornado è cresciuta nel tempo. La meteorologa può quindi confrontare i trend dei tornado ad altri trend climatici, come la temperatura media globale, per determinare se il cambiamento climatico è un fattore che incide sulla crescita della frequenza dei tornado.

Un economista sta tracciando i prezzi del gasolio nella sua regione e sta cercando i trend complessivi dei prezzi nel tempo. Lui sa che i prezzi della benzina tendono a crescere nei mesi estivi, quindi utilizza l'analisi STL per decomporre la serie temporale dei prezzi della benzina ed analizzare il trend separatamente dalla componente stagionale.

Componente stagionale

La componente stagionale di un output STL mostra il modello temporale ricorrente presente nei dati in base alla stagionalità scelta. Se esiste un modello stagionale, questo normalmente prende la forma di un modello oscillante o ad onda.

Lo smussamento per la componente stagionale viene eseguito per ogni sottoserie (settimana, mese, trimestre o anno) separatamente. Per esempio, se si sta utilizzando l'STL con la stagionalità mensile su un dataset con dati raccolti da gennaio 2015 a dicembre 2020, lo smussamento viene eseguito prima su tutti i dati raccolti a gennaio di ogni anno menzionato, poi a febbraio di ogni anno menzionato e così via fino a quando lo smussamento è stato eseguito per tutti i mesi. Le sottoserie sono poi ricombinate per creare la componente stagionale.

Esempio

Il seguente esempio mostra la componente stagionale di un'analisi STL utilizzando gli episodi di tornado degli Stati Uniti. La componente è stata calcolata utilizzando la stagionalità mensile ed oscilla fra un conteggio elevato a giugno ed un conteggio basso a gennaio. Le oscillazioni crescono in ampiezza nel corso del tempo, ad indicare che la variazione stagionale della frequenza dei tornado sta crescendo nel tempo.

Il numero di tornado negli Stati Uniti ha una componente stagionale che oscilla fra un conteggio elevato a giugno ed un conteggio basso a gennaio.

La componente Trend

La componente trend è la seconda componente calcolata durante il ciclo interno. I valori della componente stagionale sono sottratti dai dati erratici, eliminando la variazione stagionale dalla serie temporale. Una linea di tendenza smussata viene poi creata applicando il LOESS ai valori rimanenti.

Esempio

Il seguente esempio mostra la componente trend di un'analisi STL utilizzando gli episodi di tornado lungo gli Stati Uniti. Il risultato mostra una tendenza complessiva positiva, cioè il numero di episodi di tornado negli Stati Uniti sta crescendo nel tempo.

Il numero di tornado negli Stati Uniti ha generalmente la tendenza a crescere nel tempo.

Componente rimanente

La componente rimanente è calcolata sottraendo i valori della componente stagionale e di quella di trend dalla serie temporale. I valori rimanenti indicano la quantità di disturbo presente nei dati. I valori vicini allo zero indicano che le componenti stagionali e di tendenza sono accurate nella descrizione della serie temporale, mentre dei valori rimanenti superiori indicano la presenza di disturbo.

È anche possibile utilizzare la componente rimanente per identificare i valori erratici nei dati, che appaiono come valori negativi o positivi relativamente ampi rispetto agli altri valori rimanenti.

Esempio

Il seguente esempio mostra la componente rimanente di un'analisi STL utilizzando gli episodi di tornado negli Stati Uniti. I valori rimanenti sono all'inizio relativamente piccoli e diventano più grandi negli anni successivi, e ciò indica che la quantità di disturbo nei dati è cresciuta nel tempo. I valori rimanenti tracciati mostrano anche un chiaro valore erratico ad aprile 2011.

I valori rimanenti sono determinati dopo la stagionalità e il trend.