Временная декомпозиция и прогноз разбивает график временных рядов на трендовые, сезонные и остальные компоненты.
Временная декомпозиция и прогноз применяет метод разложения по сезонным трендам с использованием LOESS (STL) для вычисления составляющих временных рядов.
Пример
Экологическая организация изучает изменения качества воздуха с течением времени. В ней используется временная декомпозиция для определения того, как сезонность влияет на качество воздуха, а также что с ним происходит в течение времени: улучшение или ухудшение. Прогноз используется для предсказания будущих значений качества воздуха.
Запуск Временной декомпозиции
Для запуска временной декомпозиции выполните следующие действия:
- Создайте карту, диаграмму или таблицу на основе набора данных, для которого вы хотите применить временную декомпозицию.
- Щелкните кнопку Действие .
- Вы можете сделать следующее:
- В случае карточки временной серии останьтесь на вкладке Временной анализ.
- В случае карточки с диаграммой другого типа или карточки с таблицей, щелкните Как изменились данные? на панели Аналитика.
- Для карточки карты щелкните вкладку Найти ответы выберите Как изменились данные.
- Щелкните Временная декомпозиция.
- Для параметра Выбрать слой выберите набор данных, для которого вы хотите применить временную декомпозицию.
- Для параметра Выбрать поле даты/времени выберите поле даты/времени для временной шкалы.
- Разверните Дополнительные опции и введите при необходимости значения для параметров Выбрать числовое поле, Настройка для сезонности и Выбрать размер окна.
Более подробно см. расположенные ниже раздел Советы по использованию.
- По желанию выберите Показать прогноз, чтобы добавить во временную шкалу предсказанные значения.
Если выбрано Показать прогноз, вы также можете настроить параметр Установить циклы горизонта прогноза, чтобы определить, сколько циклов должно быть включено в прогноз. Значение числа циклов по умолчанию - два.
- Щелкните Запустить.
Запуск функции Прогноз
Выполните следующие действия для выполнения прогнозирования:
- Создайте карту, диаграмму или таблицу на основе набора данных, для которого вы хотите выполнить прогнозирование.
- Щелкните кнопку Действие .
- Вы можете сделать следующее:
- В случае карточки временной серии останьтесь на вкладке Временной анализ.
- В случае карточки с диаграммой другого типа или карточки с таблицей, щелкните Как изменились данные? на панели Аналитика.
- Для карточки карты щелкните вкладку Найти ответы и выберите Как изменились данные.
- Щелкните Прогноз.
- Для параметра Выбрать слой выберите набор данных для выполнения прогнозирования.
- Для параметра Выбрать поле даты/времени выберите поле даты/времени для временной шкалы.
- Разверните Дополнительные опции и введите при необходимости значения для параметров Выбрать числовое поле, Настройка для сезонности и Выбрать размер окна.
Более подробно см. расположенные ниже раздел Советы по использованию.
- Настройте значение параметра Установить циклы горизонта прогноза, чтобы определить, сколько циклов должно быть включено в прогноз.
Значение числа циклов по умолчанию - два.
- Щелкните Запустить.
Примечания по использованию
Временную декомпозицию и прогноз можно выполнить, нажав на кнопку Действие в разделе Как изменились данные? на вкладке Найти ответы или Временной анализ для диаграммы временных рядов. На вход должен быть подан набор данных, который включает поле даты/времени, а данные должны быть представлены как минимум за один год. Подробнее см. расположенный ниже раздел Как работает Временная декомпозиция и прогноз.
Используйте параметр Выбрать поле даты/времени, чтобы выбрать поле даты/времени, к которому нужно будет применить временную декомпозицию.
Разверните Дополнительные опции, чтобы получить доступ к параметрам Выбрать числовое поле, Настройка для сезонности и Выбрать размер окна. В следующей таблице приведены эти три параметра, в том числе их значения по умолчанию:
Параметр | Описание | Значение по умолчанию |
---|---|---|
Выбрать числовое поле | Поле, в котором хранится значение каждого измерения во временных рядах. Например, при разложении временного ряда средних глобальных температур с течением времени используйте поле температуры для параметра Выбрать числовое поле. | Нет. Значение для каждой точки будет основано на количестве. |
Настройка для сезонности | Сезонность используется для определения того, как вычисляется компонент сезонов. Доступны следующие опции сезонности:
| Нет. Выберите вариант сезонности в соответствии с данными. |
Выбрать размер окна | Размер окна определяет процент точек данных, которые используются при вычислении сглаживания. | 50%. |
Для Временной декомпозиции выберите Показать прогноз, чтобы создать выходные временные ряды, показывающие спрогнозированные будущие значения на основе компонента сезонности и скорректированного компонента сезонности. Количество циклов в прогнозе основывается на параметре Установить циклы горизонта прогноза. Значение по умолчанию – 2. Параметр Показать прогноз недоступен для Прогноза, поскольку он уже и так включен.
Результаты для Временной декомпозиции и прогноза включают два набора данных: один под названием STL, а другой - Прогноз - STL (включен только для Временной декомпозиции, если также включен Показать прогноз).
Набор данных Прогноз - STL содержит поля для сырых данных (основанные либо на количестве, либо на числовом поле, используемом для разложения временного ряда), четыре компонента (сезонный, тренд, остаток и сезонная корректировка) и исходное поле даты/времени.
Набор данных Прогноз - STL включает исходное поле даты/времени, а также поля для необработанных данных (на основе поля количества или числового поля, используемого для разложения временного ряда), оценки, а также верхнего и нижнего интервалов прогнозирования (80% и 95%).
Как работает Временная декомпозиция и прогноз
Временная декомпозиция и прогноз использует метод STL для разбивания временных рядов на сезонный, трендовый и остальные компоненты. Требования к данным для алгоритма STL основаны на сезонности, которая используется для описания сезонного компонента.
Сезонность
Сезонность (также называемая периодичностью) используется в STL для корректировки сезонных эффектов во временных рядах. Например, качество воздуха имеет тенденцию следовать ежегодному циклу с улучшением качества воздуха в зимние месяцы и снижением качества воздуха в летние месяцы. Данные о качестве воздуха можно разложить с использованием месячной сезонности, чтобы скорректировать временные ряды для повторяющегося цикла улучшения и снижения качества воздуха, чтобы получить лучшее представление об общей тенденции изменения качества воздуха во времени.
Сезонность может быть недельной, месячной, квартальной или годовой. Требования к данным для Временной декомпозиции и прогноза зависят от того, какая сезонность используется.
Для всех вариантов сезонности данные разбиты на подсерии. Чтобы использовать Временную декомпозицию или прогноз, должно быть хотя бы одно событие каждой подсерии в наборе данных.
В следующей таблице приведены варианты сезонности, подсерии и требования к данным для каждого из них:
Сезонность | Подсерии | Требования к данным |
---|---|---|
Каждую неделю | Недели с 1 по 52. Например, 1–7 января - это 1 неделя, 8–14 января - 2 неделя и т.д. | Минимум данных за 52 недели с как минимум одной точкой данных для каждой недели. |
Ежемесячно | Месяцы с января по декабрь. | Минимум данных за 12 месяцев с как минимум одной точкой данных за каждый месяц. |
Ежеквартально | Кварталы с 1 по 4. | Минимум данных за 4 квартала с как минимум одной точкой данных за каждый квартал. |
Ежегодно | Отдельные годы. Например, если набор данных включает данные, начиная с 2015 года и заканчивая 2020 годом, подсерии будут 2015, 2016, 2017, 2018, 2019 и 2020. | Минимум четырехлетний интервал данных с как минимум одной точкой данных за каждый год. |
Пример сезонности
Вы хотите запустить Временную декомпозицию или прогноз с использованием еженедельной сезонности для набора данных, которые собирались ежедневно с января 2015 года по декабрь 2020 года. Однако система для сбора данных ежегодно закрывается с 1 по 10 января для обновлений и обслуживания, поэтому в этот период сбор данных не производится. Чтобы использовать еженедельную сезонность, данные должны включать как минимум одно событие в данных за каждую неделю. Поскольку неделя 1 (с 1 по 7 января) полностью отсутствует в данных, вы не можете использовать еженедельную сезонность в наборе данных. Все остальные варианты сезонности совместимы с набором данных, поскольку он соответствует минимальным требованиям к данным и имеет как минимум одно событие для каждой ежемесячной, квартальной и годовой подсерии.
Чтобы сделать набор данных подходящим для еженедельной сезонностью, запланированное отключение перенесено на 2 января, начиная с 2021 года. Данные, собранные 1 января 2021 г., являются частью подсерии недели 1, поэтому теперь в наборе данных есть как минимум одна точка данных для каждой подсерии.
Примечание:
Требование к одной точке данных на подсерию является общим требованием, а не требованием к каждому году в ней. Вот почему точка данных от 2 января 2021 года поможет соответствовать этому требованию, хотя данных за первую неделю с 2015 по 2020 год нет.
Интервалы прогнозирования
Интервалы прогнозирования вычисляются Прогнозом на основе уравнения из Hyndman and Athanasopoulos (2018, chap. 7):
ŷT+h|T ± cσh
Где:
- ŷt=среднее значение распределения прогноза во время t.
- ŷT+h|T=кумулятивный проогноз ŷt до времени T для h циклов горизонта прогноза.
- c=вероятность покрытия
- σh=квадратный корень из дисперсии прогноза
Ограничения
Временная декомпозиция и Прогнозирование не поддерживают поля, содержащие только время (поля дата/время с компонентом времени, но без дат).
Справочная информация
Hyndman, Rob J., and George Athanasopoulos. 2018. Forecasting: Principles and Practice. 2nd ed. Melbourne, Australia: OTexts. OTexts.com/fpp2.