Dekompozycja sezonowo-trendowa z wykorzystaniem metody LOESS (STL) jest solidną metodą dekompozycji szeregów czasowych często stosowaną w analizach ekonomicznych i środowiskowych. Metoda STL wykorzystuje lokalnie dopasowane modele regresji do dekompozycji szeregów czasowych na komponenty trendu, sezonowości i reszty.
Informacje o metodzie STL
Metodę STL można zastosować do dowolnego zestawu danych, ale sensowne wyniki są zwracane tylko wtedy, gdy w danych istnieje powtarzający się wzorzec czasowy (na przykład jakość powietrza spada w cieplejszych miesiącach lub zakupy online wzrastają w czwartym kwartale każdego roku). Wzorzec ten jest wyświetlany w wynikach metody STL jako komponent sezonowości.
Algorytm metody STL wykonuje wygładzanie szeregów czasowych przy użyciu metody LOESS w dwóch pętlach: pętla wewnętrzna iteruje pomiędzy wygładzaniem sezonowym i wygładzaniem trendu, a pętla zewnętrzna minimalizuje efekt elementów odstających. Podczas pętli wewnętrznej komponent sezonowości jest obliczany jako pierwszy i usuwany w celu obliczenia komponentu trendu. Komponent reszty oblicza się poprzez odjęcie komponentów sezonowości i trendu od szeregu czasowego.
Te trzy komponenty analizy STL odnoszą się do nieprzetworzonego szeregu czasowego w następujący sposób:
yi = si + ti + ri
gdzie:
- yi = wartość szeregu czasowego w punkcie i.
- si = wartość komponentu sezonowości w punkcie i.
- ti = wartość komponentu trendu w punkcie i.
- ri = wartość komponentu reszty w punkcie i.
Przykłady
Meteorolog bada wpływ zmian klimatycznych na częstotliwość występowania tornad w Stanach Zjednoczonych. Używa metody STL do dekompozycji szeregu czasowego liczby tornad, aby określić, jak sezonowość wpływa na częstotliwość tornad i czy częstotliwość tornad wzrosła w czasie. Meteorolog może następnie porównać trendy dotyczące tornad z innymi trendami dotyczącymi klimatu, takimi jak średnia temperatura globalna, aby ustalić, czy zmiany klimatyczne są czynnikiem wpływającym na wzrost częstotliwości występowania tornad.
Ekonomista śledzi ceny gazu w swoim regionie i poszukuje ogólnych trendów cenowych na przestrzeni czasu. Wie, że w miesiącach letnich istnieje tendencja wzrostu cen gazu, więc używa analizy STL do dekompozycji szeregu czasowego cen gazu i analizy trendu oddzielnie od komponentu sezonowości.
Komponent sezonowości
Komponent sezonowości danych wynikowych analizy STL pokazuje powtarzający się wzorzec czasowy obecny w danych w oparciu o wybraną sezonowość. Jeśli istnieje wzorzec sezonowości, zazwyczaj przybiera on kształt oscylacji lub fali.
Wygładzanie dla komponentu sezonowości jest wykonywane oddzielnie dla każdej podserii (tygodnia, miesiąca, kwartału lub roku). Jeśli na przykład używana jest analiza STL z sezonowością miesięczną na zestawie danych z danymi zbieranymi codziennie od stycznia 2015 r. do grudnia 2020 r., wygładzanie jest wykonywane najpierw na wszystkich danych zebranych w styczniu dla wszystkich lat, następnie w lutym dla wszystkich lat i tak dalej, aż wszystkie miesiące będą miały wykonane wygładzanie. Podserie są następnie ponownie łączone w celu utworzenia komponentu sezonowości.
Przykład
Poniższy przykład pokazuje komponent sezonowości analizy STL na przykładzie wystąpień tornad w Stanach Zjednoczonych. Komponent ten został obliczony z wykorzystaniem sezonowości miesięcznej i oscyluje pomiędzy wysoką liczbą w czerwcu a niską liczbą w styczniu. Oscylacje te zwiększają swoją amplitudę w czasie, co wskazuje, że sezonowa zmienność częstotliwości tornad wzrasta w czasie.
Komponent trendu
Komponent trendu jest drugim komponentem obliczanym podczas pętli wewnętrznej. Wartości dla komponentu sezonowości są odejmowane od danych nieprzetworzonych, eliminując zmienność sezonową z szeregu czasowego. Następnie tworzona jest wygładzona linia trendu poprzez zastosowanie metody LOESS do pozostałych wartości.
Przykład
Poniższy przykład pokazuje komponent trendu analizy STL na przykładzie wystąpień tornad w Stanach Zjednoczonych. Wynik pokazuje ogólny trend dodatni, co oznacza, że liczba wystąpień tornad w Stanach Zjednoczonych rośnie z czasem.
Komponent reszty
Komponent reszty oblicza się poprzez odjęcie wartości komponentów sezonowości i trendu od szeregu czasowego. Komponent reszty wskazuje ilość szumu obecnego w danych. Wartości bliskie zeru wskazują, że komponenty sezonowości i trendu są dokładne w opisie szeregu czasowego, podczas gdy większe wartości komponentu reszty wskazują na obecność szumu.
Komponentu reszty można również użyć do identyfikacji elementów odstających w danych. Elementy te pojawiają się jako stosunkowo duże wartości dodatnie lub ujemne w porównaniu z innymi wartościami komponentu reszty.
Przykład
Poniższy przykład pokazuje komponent reszty analizy STL na przykładzie wystąpień tornad w Stanach Zjednoczonych. Wartości komponentu reszty zaczynają się od stosunkowo niewielkich wartości i stają się większe w późniejszych latach, co wskazuje, że ilość szumu w danych wzrosła z czasem. Wykreślone wartości komponentu reszty wykazują również wyraźny element odstający w kwietniu 2011 r.