时间分解和预测将时间序列图分割为趋势、季节和其余分量。
时间分解和预测将应用使用 LOESS (STL) 方法的季节性趋势分解方法来计算时间序列的分量。
示例
一个环境组织正在研究空气质量随时间的变化。 他们使用时间分解确定季节性对空气质量的影响程度,以及空气质量是否随着时间的推移有所改善或恶化。 使用预测来预测未来的空气质量值。
运行时间分解
完成以下步骤以执行时间分解:
- 使用要用于执行时间分解的数据集来创建地图、图表或表格。
- 单击操作按钮 。
- 执行以下操作之一:
- 对于时间序列图卡片,请留在时间分析选项卡上。
- 对于其他图表类型的卡片或表卡片,请在分析窗格中单击变化方式。
- 对于地图卡片,请单击查找答案选项卡,然后单击变化方式。
- 单击时间分解。
- 对于选择图层,选择用于执行时间分解的数据集。
- 对于选择日期/时间字段,选择要用于时间轴的日期/时间字段。
- 展开其他选项,然后根据需要,为选择数字字段、针对季节性进行调整和选择窗口大小参数提供值。
有关详细信息,请参阅以下用法说明部分。
- 或者,选择显示预测以使时间轴上包含预测值。
如果选择了显示预测,则还可以调整设置预测地平线周期参数来指定预测中包含的周期数。 默认周期数为 2。
- 单击运行。
运行预测功能
完成以下步骤以执行预测:
- 使用要用于执行预测的数据集来创建地图、图表或表格。
- 单击操作按钮 。
- 执行以下操作之一:
- 对于时间序列图卡片,请留在时间分析选项卡上。
- 对于其他图表类型的卡片或表卡片,请在分析窗格中单击变化方式。
- 对于地图卡片,请单击查找答案选项卡,然后单击变化方式。
- 单击预测。
- 对于选择图层,选择要用于执行预测的数据集。
- 对于选择日期/时间字段,选择要用于时间轴的日期/时间字段。
- 展开其他选项,然后根据需要,为选择数字字段、针对季节性进行调整和选择窗口大小参数提供值。
有关详细信息,请参阅以下用法说明部分。
- 调整设置预测地平线周期参数值以指定预测中包含的周期数。
默认周期数为 2。
- 单击运行。
用法说明
可以使用时间序列图上查找答案选项卡或时间分析选项卡上的更改方式下的操作按钮 访问“时间分解”和“预测”。 输入必须是包含日期/时间字段的数据集,并且必须至少包含一年的数据。 有关详细信息,请参阅下方的“时间分解和预测的工作原理”部分。
使用选择日期/时间字段参数来选择将应用时间分解的日期/时间字段。
展开其他选项以访问选择数字字段、针对季节性进行调整和选择窗口大小参数。 下表对以上参数进行了汇总,其中包括其默认值:
参数 | 描述 | 默认值 |
---|---|---|
选择一个数字字段 | 表示时间序列中每个观测值的字段。 例如,在分解全球平均温度随时间变化的时间序列时,将温度字段用于选择数字字段参数。 | 无。 每个点的值基于计数。 |
针对季节性进行调整 | 季节性用于确定季节分量的计算方式。 可用季节性选项如下:
| 无。 根据数据选择适当的季节性。 |
选择窗口大小 | 窗口大小用于确定在平滑计算中使用的数据点的百分比。 | 50%。 |
对于“时间分解”,选择显示预测以创建输出时间序列,该输出时间序列显示基于季节分量和经过季节性调整的分量的预测未来值。 预测中的周期数基于设置预测地平线周期参数。 默认值为 2。 显示预测参数不适用于“预测”,因为它始终处于启用状态。
时间分解和预测的结果包括两个数据集:一个名为 STL,一个名为 Forecast - STL(仅在已启用显示预测的情况下,包括在“时间分解”的结果中)。
STL 数据集包括原始数据的字段(基于用于分解时间序列的计数或数字字段)、四个分量(季节、趋势、其余和经过季节性调整的分量)以及原始日期/时间字段。
Forecast - STL 数据集包括原始日期/时间字段,以及原始数据的字段(基于用于分解时间序列的计数或数字字段)、估计,以及预测区间的上限和下限(80% 和 95%)。
时间分解和预测的工作原理
时间分解和预测使用 STL 方法将时间序列分解为季节、趋势和其余分量。 STL 算法中的数据要求基于用于描述季节分量的季节性。
季节性
季节性(也称为周期性)将在 STL 内用来调整时间序列中的季节性影响。 例如,空气质量通常遵循每年的周期,在冬季,空气质量有所提高,而在夏季,空气质量则会下降。 可以使用每月的季节性来分解空气质量数据,以针对空气质量提高和下降的循环周期调整时间序列,从而更好地了解空气质量随时间变化的总体趋势。
季节性可以为每周、每月、每季度或每年。 时间分解和预测的数据要求取决于所使用的季节性。
对于所有季节性选项,数据将被分割为子序列。 要使用时间分解或预测,数据集中每个子序列必须至少出现一个。
下表汇总了季节性选项以及每个选项的子序列和数据要求:
季节性 | 子序列 | 数据要求 |
---|---|---|
每周 | 第 1 周到第 52 周。 例如,1 月 1 日至 1 月 7 日是第 1 周,1 月 8 日至 1 月 14 日是第 2 周,依此类推。 | 至少需要 52 周的数据,每周至少有一个数据点。 |
每月 | 1 月到 12 月。 | 至少需要 12 个月的数据,每个月至少有一个数据点。 |
季度 | 第 1 到第 4 季度。 | 至少需要 4 个季度的数据,每个季度至少有一个数据点。 |
每年 | 各个年份。 例如,如果数据集包含从 2015 年开始到 2020 年结束的数据,则子序列将为 2015、2016、2017、2018、2019 和 2020。 | 至少需要 4 年的数据,每年至少有一个数据点。 |
季节性示例
您想使用每周季节性为数据集运行“时间分解”或“预测”,而该数据集具有从 2015 年 1 月到 2020 年 12 月每天采集的数据。 但是,每年 1 月 1 日至 1 月 10 日都会关闭采集数据的系统,以进行更新和维护,因此在该段时间不会采集任何数据。 要使用每周季节性,数据必须每周包含至少一次数据。 由于数据中不包含第 1 周(1 月 1 日至 1 月 7 日)的任何数据,因此您无法对数据集使用每周季节性。 所有其他季节性选项均与数据集兼容,因为它符合最低数据要求,并且每个月度、季度和年度子序列至少出现一次。
为了使数据集与每周季节性兼容,从 2021 年起,计划关闭将更改为 1 月 2 日开始。 2021 年 1 月 1 日采集的数据是第 1 周子序列的一部分,因此现在数据集的每个子序列都有至少一个数据点。
注:
对于每个子序列一个数据点的需求为总体需求,而非年度需求。 这就是 2021 年 1 月 2 日数据点满足要求的原因,即使在 2015 年至 2020 年的第 1 周没有可用数据也是如此。
预测间隔
预测间隔通过预测来计算,使用 Hyndman and Athanasopoulos(2018 年,第 7 章)中的以下等式:
ŷT+h|T ± cσh
其中:
- ŷt = 时间为 t 时的预测分布平均值。
- ŷT+h|T = 到时间 T 时对 h 个预测地平线周期的 ŷt 累积预测。
- c = 覆盖概率
- σh = 预测方差的平方根
局限性
时间分解和预测不支持仅时间字段(具有时间成分,但没有日期的日期/时间字段)。
参考资料
Hyndman, Rob J., and George Athanasopoulos. 2018. Forecasting: Principles and Practice. 2nd ed. Melbourne, Australia: OTexts. OTexts.com/fpp2.