LOESS を使用した季節およびトレンドの分解 (STL)

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights desktop

LOESS を使用した季節およびトレンドの分解 (STL) は、多くの場合、経済および環境の解析に使用される時系列分解の堅牢な方法です。 STL 法は、ローカルに適合する回帰モデルを使用して時系列をトレンド、季節、および余剰の各コンポーネントに分解します。

STL について

STL はどのデータセットにも適用できますが、繰り返しの時系列パターンがデータに存在する場合にのみ意味のある結果が返されます (たとえば、暖かい月の間に低下する大気環境や毎年の第 4 四半期に増加するオンライン ショッピング)。 パターンは STL 結果に季節性コンポーネントとして表示されます。

STL アルゴリズムは、2 つのループで LOESS を使用して時系列のスムージングを実行します。内部ループは季節およびトレンドのスムージングの間で反復し、外部ループは外れ値の影響を最小化します。 内部ループの間、季節性コンポーネントが最初に計算され、削除されてからトレンド コンポーネントが計算されます。 余剰は、時系列から季節性およびトレンド コンポーネントを引くことによって計算されます。

STL 解析の 3 つのコンポーネントは次のように未加工の時系列に関連します。

yi = si + ti + ri

ここで、

  • yi = 点 i における時系列の値。
  • si = 点 i における季節性コンポーネントの値。
  • ti = 点 i におけるトレンド コンポーネントの値。
  • ri = 点 i における余剰コンポーネントの値。

米国における竜巻の発生頻度に対する気候変動の影響を、ある気象学者が研究しています。 季節性が竜巻の発生頻度にどのように影響を与えるか、竜巻の発生頻度が時間経過に伴い増加するかどうかを判断するために、STL を使用して竜巻発生回数の時系列を分解します。 その後、気象学者は、竜巻の傾向と他の気候傾向 (平均地球温度など) を比較して、気候変動が竜巻の発生頻度が増加している要因であるかどうかを判断できます。

ある経済学者が地域のガソリン価格をトラッキングして、時間経過に伴う価格の全体的な傾向を調べています。 夏の間、ガソリン価格は増加する傾向があることがわかったため、STL 解析を使用してガソリン価格の時系列を分解して、季節性コンポーネントとは別に傾向を解析します。

季節性コンポーネント

STL 出力の季節性コンポーネントには、選択した季節性に基づくデータに存在する繰り返しの時系列パターンが表示されます。 季節的なパターンが存在する場合、通常、振動または波形パターンの形状を取ります。

季節性コンポーネントのスムージングはサブシリーズ (週、月、四半期、年) ごとに別々に実行されます。 たとえば、2015 年 1 月から 2020 年 12 月までのデータが収集されたデータセットに対して毎月の季節性で STL を使用すると、スムージングは最初にすべての年の 1 月に収集されたすべてのデータに対して実行され、すべての月に対して実行が完了するまで続けられます。 次に、サブシリーズが再結合され、季節性コンポーネントが作成されます。

次の例は、全米における竜巻の発生を使用する STL 解析の季節性コンポーネントを示しています。 コンポーネントは、毎月の季節性を使用して計算されました。発生回数の多い 6 月と発生回数の少ない 1 月の間で変動しています。 変動の振幅は時間経過に伴って増加しています。これは、竜巻発生頻度の季節的変動が時間経過に伴い増加していることを示しています。

米国における竜巻の発生回数には、発生回数の多い 6 月と発生回数の少ない 1 月の間で変動する季節性コンポーネントがあります。

トレンド コンポーネント

トレンド コンポーネントは、内部ループの間に計算される 2 つ目のコンポーネントです。 季節性コンポーネントの値は未加工データから引かれ、時系列から季節的変動が除去されます。 次に、LOESS を残りの値に適用して、スムージングされたトレンド ラインが作成されます。

次の例は、全米における竜巻の発生を使用する STL 解析のトレンド コンポーネントを示しています。 結果は全体的な正の傾向を示しています。これは、米国における竜巻発生数が時間経過に伴い増加していることを意味します。

米国における竜巻の数はほぼ上昇傾向にあります。

余剰コンポーネント

余剰コンポーネントは、時系列から季節およびトレンド コンポーネントの値を引くことによって計算されます。 余剰の値は、データに存在するノイズの量を示します。 ゼロに近い値は、時系列の説明において季節性およびトレンド コンポーネントが正確であることを示し、余剰の値が大きくなると、ノイズが存在することを示します。

余剰コンポーネントを使用して、データの外れ値を特定することもできます。外れ値は、その他の余剰の値と比べると比較的大きな正または負の値として表示されます。

次の例は、全米における竜巻の発生を使用する STL 解析の余剰コンポーネントを示しています。 余剰値は比較的小さい値で始まり、後年には大きくなります。これは、データ内のノイズ量が時間経過に伴い増加したことを示しています。 プロットされた余剰値は、2011 年 4 月の明確な外れ値も示しています。

季節性とトレンドの後の余剰値が決まります。