Временная декомпозиция и прогноз разбивает график временных рядов на трендовые, сезонные и остальные компоненты.
Временная декомпозиция и прогноз применяет метод разложения по сезонным трендам с использованием LOESS (STL) для вычисления составляющих временных рядов.
Пример
Экологическая организация изучает изменения качества воздуха с течением времени. Временную декомпозицию можно использовать для определения того, как сезонность влияет на качество воздуха, а также что с ним происходит в течение времени: улучшение или ухудшение. Прогноз можно использовать для предсказания будущих значений качества воздуха.
Использование функции Временной декомпозиции
Для запуска возможности Временной декомпозиции выполните следующие шаги:
- Создайте карту, диаграмму или таблицу на основе набора данных, для которого вы хотите применить временную декомпозицию.
- Щелкните кнопку Действие .
- Вы можете сделать следующее:
- Если ваша карточка уже представляет собой диаграмму временных рядов, останьтесь на вкладке Временной анализ.
- Если у вас карточка с диаграммой другого типа или таблицей, щелкните Как оно изменилось? на панели Аналитика
- Если ваша карточка представляет карту, щелкните вкладку Найти ответы и затем Как оно изменилось?.
- Щелкните Временная декомпозиция.
- Для Выбрать слой выберите набор данных, для которого вы хотите применить временную декомпозицию.
- Для Выбрать поле даты/времени выберите поле даты/времени, которое хотите использовать для временной шкалы.
- Разверните Дополнительные опции и введите при необходимости значения для параметров Выбрать числовое поле, Настройка для сезонности, и Выбрать размер окна. Более подробно см. Советы по использованию.
- По желанию выберите Показать прогноз, чтобы включить во временную шкалу предсказанные значения. Если выбрано Показать прогноз, вы также можете настроить параметр Установить циклы горизонта прогноза, чтобы определить, сколько циклов должно быть включено в прогноз. Значение числа циклов по умолчанию - два.
- Щелкните Запустить.
Использование возможности Прогноз
Выполните следующие шаги, чтобы запустить возможность Прогноза:
- Создайте карту, диаграмму или таблицу на основе набора данных, для которого вы хотите применить временную декомпозицию.
- Щелкните кнопку Действие .
- Вы можете сделать следующее:
- Если ваша карточка уже представляет собой диаграмму временных рядов, останьтесь на вкладке Временной анализ.
- Если у вас карточка с диаграммой другого типа или таблицей, щелкните Как оно изменилось? на панели Аналитика
- Если ваша карточка представляет карту, щелкните вкладку Найти ответы и затем Как оно изменилось?.
- Щелкните Прогноз.
- Для Выбрать слой выберите набор данных, для которого вы хотите посчитать прогноз.
- Для Выбрать поле даты/времени выберите поле даты/времени, которое хотите использовать для временной шкалы.
- Разверните Дополнительные опции и введите при необходимости значения для параметров Выбрать числовое поле, Настройка для сезонности, и Выбрать размер окна. Более подробно см. Советы по использованию.
- Настройте параметр Установить циклы горизонта прогноза, чтобы определить, сколько циклов должно быть включено в прогноз. Значение числа циклов по умолчанию - два.
- Щелкните Запустить.
Примечания по использованию
Временную декомпозицию и прогноз можно найти с помощью кнопки Действие в разделе Как оно изменилось? на вкладке Найти ответы или Временной анализ для диаграммы временных рядов. На вход должен быть подан набор данных, который включает поле даты/времени, а данные должны быть представлены как минимум за один год. Подробнее см. Как работает Временная декомпозиция и прогноз.
Используйте параметр Выбрать поле даты/времени, чтобы выбрать поле даты/времени, к которому нужно будет применить временную декомпозицию.
Разверните Дополнительные опции, чтобы получить доступ к параметрам Выбрать числовое поле, Настройка для сезонности и Выбрать размер окна. В следующей таблице приведены эти три параметра, в том числе их значения по умолчанию:
Параметр | Описание | Значение по умолчанию |
---|---|---|
Выбрать числовое поле | Поле, в котором хранится значение каждого измерения во временных рядах. Например, при разложении временного ряда средних глобальных температур с течением времени используйте поле температуры для параметра Выбрать числовое поле. | Нет. Значение для каждой точки будет основано на количестве. |
Настройка для сезонности | Сезонность используется для определения того, как вычисляется компонент сезонов. Доступны следующие опции сезонности:
| Нет. Соответствующий вариант выбирается на основе ваших данных. |
Выбрать размер окна | Размер окна определяет процент точек данных, которые используются при вычислении сглаживания. | 50%. |
Для Временной декомпозиции выберите Показать прогноз, чтобы создать выходные временные ряды, показывающие спрогнозированные будущие значения на основе компонента сезонности и скорректированного компонента сезонности. Количество циклов в прогнозе основывается на параметре Установить циклы горизонта прогноза. Значение по умолчанию – 2. Параметр Показать прогноз недоступен для Прогноза, поскольку он уже и так включен.
Результаты для Временной декомпозиции и прогноза включают два набора данных: один под названием STL, а другой - Forecast - STL (включен только для Временной декомпозиции, если также включен Показать прогноз).
Набор данных STL включает поля для сырых данных (основанные либо на количестве, либо на числовом поле, используемом для разложения временного ряда), четыре компонента (сезонный, тренд, остаток и сезонная корректировка) и исходное поле даты/времени.
Набор данных Forecast - STL включает исходное поле даты/времени, а также поля для сырых данных (на основе поля количества или числового поля, используемого для разложения временного ряда), оценки, а также верхнего и нижнего интервалов прогнозирования (80% и 95%).
Как работает Временная декомпозиция и прогноз
Временная декомпозиция и прогноз использует метод STL для разбивания временных рядов на сезонный, трендовый и остальные компоненты. Требования к данным для алгоритма STL основаны на сезонности, которая используется для описания сезонного компонента.
Сезонность
Сезонность (также называемая периодичностью) используется в STL для корректировки сезонных эффектов во временных рядах. Например, качество воздуха имеет тенденцию следовать ежегодному циклу с улучшением качества воздуха в зимние месяцы и снижением качества воздуха в летние месяцы. Следовательно, данные о качестве воздуха можно разложить с использованием месячной сезонности, чтобы скорректировать временные ряды для повторяющегося цикла улучшения и снижения качества воздуха, чтобы получить лучшее представление об общей тенденции изменения качества воздуха во времени.
Сезонность может быть недельной, месячной, квартальной или годовой. Требования к данным для Временной декомпозиции и прогноза зависят от того, какая сезонность используется.
Для всех вариантов сезонности данные разбиты на подсерии. Чтобы использовать Временную декомпозицию или прогноз, должно быть хотя бы одно событие каждой подсерии в наборе данных.
В следующей таблице приведены варианты сезонности, подсерии и требования к данным для каждого из них.
Сезонность | Подсерии | Требования к данным |
---|---|---|
Каждую неделю | Недели с 1 по 52. Например, 1–7 января - это 1 неделя, 8–14 января - 2 неделя и т.д. | Минимум данных за 52 недели с как минимум одной точкой данных для каждой недели. |
Ежемесячно | Месяцы с января по декабрь. | Минимум данных за 12 месяцев с как минимум одной точкой данных за каждый месяц. |
Ежеквартально | Кварталы с 1 по 4. | Минимум данных за 4 квартала с как минимум одной точкой данных за каждый квартал. |
Ежегодно | Отдельные годы. Например, если ваш набор данных включает данные, начиная с 2015 года и заканчивая 2020 годом, подсерии будут 2015, 2016, 2017, 2018, 2019 и 2020. | Минимум четырехлетний интервал данных с как минимум одной точкой данных за каждый год. |
Пример
Вы хотите запустить Временную декомпозицию или прогноз с использованием еженедельной сезонности для набора данных, которые собирались ежедневно с января 2015 года по декабрь 2020 года. Однако система для сбора данных ежегодно закрывается с 1 по 10 января для обновлений и обслуживания, поэтому в этот период сбор данных не производится. Чтобы использовать еженедельную сезонность, ваши данные должны включать как минимум одно событие в данных за каждую неделю. Поскольку неделя 1 (с 1 по 7 января) полностью отсутствует в ваших данных, вы не можете использовать еженедельную сезонность в наборе данных. Все остальные варианты сезонности совместимы с набором данных, поскольку он соответствует минимальным требованиям к данным и имеет как минимум одно событие для каждой ежемесячной, квартальной и годовой подсерии.
Чтобы сделать набор данных подходящим для еженедельной сезонностью, запланированное отключение перенесено на 2 января, начиная с 2021 года. Данные, собранные 1 января 2021 г., являются частью подсерии недели 1, поэтому теперь в наборе данных есть как минимум одна точка данных для каждой подсерии.
Примечание:
Требование к одной точке данных на подсерию является общим требованием, а не требованием к каждому году в ней. Вот почему точка данных от 2 января 2021 года поможет соответствовать этому требованию, хотя данных за первую неделю с 2015 по 2020 год нет.
Интервалы прогнозирования
Интервалы прогнозирования вычисляются с помощью опции Прогноз на основе уравнения из Hyndman and Athanasopoulos (2018, chap. 7):
ŷT+h|T ± cσh
Где:
- ŷt=среднее значение распределения прогноза во время t.
- ŷT+h|T=кумулятивный проогноз ŷt до времени T для h циклов горизонта прогноза.
- c=вероятность покрытия
- σh=квадратный корень из дисперсии прогноза
Ограничения
Временная декомпозиция и Прогнозирование не поддерживают поля, содержащие только время (другими словами, поля дата/время с компонентом времени, но без дат).
Справочная информация
Hyndman, Rob J., and George Athanasopoulos. 2018. Forecasting: Principles and Practice. 2nd ed. Melbourne, Australia: OTexts. OTexts.com/fpp2.