Méthode STL (Seasonal-Trend decomposition using LOESS)

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

STL (Seasonal-Trend decomposition using LOESS) est une méthode fiable de décomposition d’une série chronologique qui est souvent employée dans les analyses économiques et environnementales. La méthode STL utilise des modèles de régression ajustés localement pour décomposer une série chronologique en composants saisonniers, de tendance et restants.

À propos de STL

Vous pouvez appliquer la méthode STL à n’importe quel jeu de données, mais vous obtiendrez des résultats optimaux si un modèle temporel récurrent est présent dans les données (par exemple, la détérioration de la qualité de l’air pendant les mois d’été ou l’augmentation des achats en ligne au quatrième trimestre de chaque année). Le modèle s’affiche dans les résultats STL en tant que composant saisonnier.

L’algorithme STL effectue un lissage sur la série chronologique en utilisant LOESS en deux boucles ; la boucle interne réalise une itération entre le lissage saisonnier et de tendance et la boucle externe réduit l’effet des points aberrants. Au cours de la boucle interne, le composant saisonnier est calculé d’abord, puis supprimé pour calculer le composant de tendance. Le reste est calculé en soustrayant les composants saisonniers et de tendance de la série chronologique.

Les trois composants de l’analyse STL sont associés à la série chronologique brute comme suit :

yi = si + ti + ri

où :

  • yi = Valeur de la série chronologique au point i.
  • si = Valeur du composant saisonnier au point i.
  • ti = Valeur du composant de tendance au point i.
  • ri = Valeur du composant restant au point i.

Exemples

Une météorologue étudie l’effet du changement climatique sur la fréquence des tornades aux États-Unis. Elle utilise la méthode STL pour décomposer une série chronologique du nombre de tornades et déterminer en quoi la saisonnalité affecte la fréquence des tornades et si cette fréquence s’est accrue au fil du temps. La météorologue peut ensuite comparer les tendances des tornades avec d’autres tendances climatiques, par exemple la température globale moyenne, pour déterminer si le changement climatique est un facteur d’augmentation de la fréquence des tornades.

Un économiste suit le prix du carburant dans sa région et recherche les grandes tendances de l’évolution des tarifs au fil du temps. Sachant que les prix ont tendance à augmenter les mois d’été, il utilise l’analyse STL pour décomposer la série chronologie des prix du carburant et analyser la tendance séparément du composant saisonnier.

Composant saisonnier

Le composant saisonnier d’une sortie STL illustre le modèle temporel récurrent présent dans les données en fonction de la saisonnalité choisie. Si un modèle saisonnier existe, il prend généralement la forme d’une vague ou d’une oscillation.

Le lissage du composant saisonnier s’effectue séparément pour chaque sous-série (semaine, mois, trimestre ou année). Par exemple, si vous utilisez la méthode STL avec une saisonnalité mensuelle sur un jeu de données dont les données ont été collectées quotidiennement entre janvier 2015 et décembre 2020, le lissage s’effectue d’abord sur toutes les données collectées en janvier de toutes les années, puis en février de toutes les années, et ainsi de suite jusqu’à ce que tous les mois aient été lissés. Les sous-séries sont ensuite recombinées pour créer le composant saisonnier.

Exemple

L’exemple suivant montre le composant saisonnier d’une analyse STL qui utilise des incidents de tornades aux États-Unis. Le composant a été calculé à l’aide de la saisonnalité mensuelle et oscille entre un nombre élevé en juin et un nombre faible en janvier. Les oscillations augmentent en amplitude au fil du temps, ce qui indique que la variation saisonnière en fréquence des tornades augmente au fil du temps.

Le nombre de tornades aux États-Unis comporte un composant saisonnier qui oscille entre un nombre élevé en juin et un nombre faible en janvier.

Composant de tendance

Le composant de tendance est le deuxième composant calculé au cours de la boucle interne. Les valeurs du composant saisonnier sont extraites des valeurs brutes, ce qui élimine la variation saisonnière de la série chronologique. Une ligne de tendance lissée est ensuite créée en appliquant LOESS aux valeurs restantes.

Exemple

L’exemple suivant montre le composant de tendance d’une analyse STL qui utilise des incidents de tornades aux États-Unis. Le résultat illustre une tendance positive globale, ce qui indique que le nombre d’incidents de tornades aux États-Unis augmente au fil du temps.

Le nombre de tornades aux États-Unis a généralement tendance a augmenter au fil du temps.

Composant restant

Le composant restant est calculé en soustrayant les valeurs du composant saisonnier et du composant de tendance de la série chronologique. Les valeurs restantes quantifient le bruit présent dans les données. Les valeurs proches de zéro indiquent que les composants saisonniers et de tendance sont exacts dans leur description de la série chronologique, tandis que des valeurs restantes importantes indiquent la présence de bruit.

Vous pouvez également utiliser le composant restant pour identifier les points aberrants dans les données, qui apparaissent sous forme de valeurs positives ou négatives relativement importantes par rapport aux autres valeurs restantes.

Exemple

L’exemple suivant montre le composant restant d’une analyse STL qui utilise des incidents de tornades aux États-Unis. Les valeurs restantes sont relativement restreintes au début et augmentent au cours des années, ce qui indique que la quantité de bruit dans les données s’est accrue au fil du temps. Les valeurs restantes tracées illustrent également un point aberrant clair en avril 2011.

Les valeurs restantes après la saisonnalité et la tendance sont déterminées.