Декомпозиция по сезонным трендам с помощью LOESS (STL) - это надежный метод декомпозиции временных рядов, который часто используется в экономическом анализе и анализе окружающей среды. В методе STL используются локально подобранные регрессионные модели для разложения временного ряда на компоненты тренда, сезонности и остатка.
О STL
Вы можете применить STL к любому набору данных, но значимые результаты будут получены только в том случае, если в данных есть повторяющаяся временная закономерность (например, качество воздуха ухудшается в теплые месяцы, либо онлайн-шоппинг возрастает в четвертом квартале каждого года). Закономерность отображается в результатах STL как сезонный компонент.
Алгоритм STL сглаживает временные ряды с помощью LOESS в двух циклах; внутренний цикл выполняет итерацию между сезонным сглаживанием и сглаживанием тренда, а внешний цикл минимизирует влияние выбросов. В ходе внутреннего цикла сезонный компонент вычисляется первым и удаляется для вычисления компонента тренда. Остаток вычисляется путем вычитания сезонного и трендового компононентов из временных рядов.
Эти три компонента анализа STL связаны с сырыми временными рядами следующим образом:
yi = si + ti + ri
, где:
- yi = значение временного ряда в точке i.
- si = значение сезонного компонента в точке i.
- ti = значение компонента тренда в точке i.
- ri = значение компонента остатка в точке i.
Примеры
Метеоролог изучает эффект изменения климата по частоте торнадо в США. Она использует STL для декомпозиции временных рядов случаев торнадо, чтобы определить, как сезонность влияет на частоту торнадо, и увеличивается ли частота торнадо с течением времени. Затем метеоролог сравнивает тренды с торнадо с другими климатическими трендами, например, средней глобальной температурой, чтобы понять, является ли изменение климата фактором, который действительно повышает частоту возникновения торнадо.
Экономист отслеживает цены на газ в своем регионе и пытается найти общие закономерности в изменении цены в течение времени. Он знает, что цены на газ склонны повышаться в летние месяцы, поэтому он использует анализ SLT для декомпозиции временных рядов цен на газ и анализа трендов независимо от этого сезонного компонента.
Сезонный компонент
Сезонный компонент результата STL показывает повторяющуюся временную закономерность в данных на основе выбранной сезонности. Если существует сезонная закономерность, то она обычно принимает форму колеблющейся или волновой закономерности.
Сглаживание сезонного компонента выполняется для каждой подсерии (неделя, месяц, квартал или год) отдельно. Например, при использовании STL с ежемесячной сезонностью в наборе с данными, собираемыми ежедневно с января 2015 года по декабрь 2020 года, сглаживание выполняется сначала для всех данных, собранных в январе для всех лет, затем в феврале для всех лет и так далее, пока для всех месяцев будет выполнено сглаживание. Поднаборы серий потом перекомбинируются для создания сезонного компонента.
Пример
В следующем примере показан сезонный компонент STL-анализа, где используются случаи торнадо в США. Этот компонент был вычислен на основе месячной сезонности и колеблется между максимальным количеством в июне и минимальным в январе. Амплитуда колебаний возрастает с течением времени, что говорит о том, что сезонная разница в частоте торнадо увеличивается.
Компонент тренда
Компонент тренда - это второй компонент, который вычисляется в ходе внутреннего цикла. Значения для сезонного компонента вычитаются из необработанных данных, таким образом во временных рядах выделяется сезонная вариация. Затем с помощью применения LOESS создается сглаженная линия тренда для остальных значений.
Пример
В следующем примере показан компонент тренда STL-анализа, где используются случаи торнадо в США. Результат показывает общий положительный тренд, это говорит о том, что количество случаев торнадо в США увеличивается со временем.
Компонент остатка
Компонент остатка вычисляется путем вычитания значений сезонного и трендового компонентов из временных рядов. Значения остатка указывают на количество шума в данных. Значения, близкие к нулю, говорят о том, что сезонный и трендовый компоненты являются точными описаниями временных рядов, а большие значения говорят о том, что в данных присутствует шум.
Вы также можете использовать компонент остатка для выявления выбросов в данных, которые представлены как относительно большие положительные или отрицательные значения по сравнению с остальными значениями остатков.
Пример
В следующем примере показан компонент остатка STL-анализа, где используются случаи торнадо в США. Значения остатка сначала относительно невелики, но в последние годы они становятся больше, это говорит о том, что со временем объем шума в данных возрастает. Точечный график значений остатков показывает также явный выброс в апреле 2011 года.