使用 LOESS 的季节性趋势分解

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights 桌面版

使用 LOESS (STL) 的季节性趋势分解是一种经常在经济和环境分析中使用的可靠的时间序列分解方法。 STL 方法使用局部拟合的回归模型将时间序列分解为趋势、季节和余数分量。

关于 STL

您可以将 STL 应用于任何数据集,但是只有在数据中存在循环的时间模式时(例如,在温暖的月份中空气质量下降,或者在每年的第四季度中的在线购物量增加),才返回有意义的结果。 该模式在 STL 结果中显示为季节分量。

STL 算法使用 LOESS 在两个循环中对时间序列执行平滑处理;内循环在季节性平滑和趋势平滑之间进行迭代,外循环将异常值的影响最小化。 在内循环期间,首先计算季节分量,然后将其移除以计算趋势分量。 余数分量是通过从时间序列中减去季节和趋势分量来计算的。

STL 分析的三个分量与原始时间序列相关,如下所示:

yi = si + ti + ri

其中:

  • yi = 点 i 处的时间序列值。
  • si = 点 i 处的季节分量的值。
  • ti = 点 i 处的趋势分量的值。
  • ri = 点 i 处的余数分量的值。

示例

一名气象学家正在研究气候变化对美国龙卷风发生频率的影响。 她使用 STL 分解龙卷风计数的时间序列,以确定季节性如何影响龙卷风的频率以及龙卷风的频率是否随时间增加。 然后,该气象学家可以将龙卷风的趋势与其他气候趋势(例如全球平均温度)进行比较,以确定气候变化是否是龙卷风发生频率增加的因素。

一位经济学家正在追踪该地区的天然气价格,并寻找一段时间内的总体价格趋势。 他知道夏季的天然气价格趋于上涨,因此他使用 STL 分析来分解天然气价格的时间序列,并在不考虑季节分量的情况下分析趋势。

季节分量

STL 输出的季节分量显示了基于所选季节性的数据中出现的循环时间模式。 如果存在季节性模式,则通常呈振荡或波动模式。

分别对每个子系列(周、月、季或年)执行季节分量的平滑处理。 例如,如果在数据集上使用具有每月季节性的 STL,且该数据集具有从 2015 年 1 月到 2020 年 12 月每天收集的数据,则首先对所有年份的 1 月收集的所有数据执行平滑处理,然后对所有年份的 2 月执行平滑处理,直到所有月份均已执行平滑处理。 然后将子系列重新组合以创建季节分量。

示例

以下示例显示了在美国各地使用龙卷风事件进行的 STL 分析的季节分量。 该分量是使用每月的季节性计算的,并且在 6 月的高计数和 1 月的低计数之间波动。 振荡的幅度随时间增加,这表明龙卷风频率的季节性变化随时间增加。

在美国,龙卷风的数量具有季节分量,在 6 月的高计数和 1 月的低计数之间波动。

趋势分量

趋势分量是在内循环期间计算出的第二个分量。 从原始数据中减去季节分量的值,从而消除时间序列中的季节性变化。 然后通过将 LOESS 应用于其余值来创建平滑的趋势线。

示例

以下示例显示了在美国各地使用龙卷风事件进行的 STL 分析的趋势分量。 结果显示总体上呈积极趋势,这意味着随着时间的推移,美国龙卷风事件的数量正在增加。

随着时间的推移,美国龙卷风的数量总体呈上升趋势。

余数分量

余数分量是通过从时间序列中减去季节和趋势分量的值来计算的。 余数值表示数据中存在的噪点量。 接近零的值表示季节和趋势分量在描述时间序列方面是准确的,而余数值较大则表示存在噪点。

您还可以使用余数分量来标识数据中的异常值,与其他余数值相比,异常值显示为相对较大的正值或负值。

示例

以下示例显示了在美国各地使用龙卷风事件进行的 STL 分析的余数分量。 余数值开始时相对较小,并在以后几年中变大,这表明数据中的噪点量随时间增加。 所绘制的余数值也显示了 2011 年 4 月的明显异常值。

确定了季节性和趋势之后的余数值。