[移動平均] では、指定のウィンドウの平均値を計算し、時系列グラフで値をプロットします。 [移動平均] を使用すると、スムージング効果が作成され、日単位の変動からノイズが削減されます。 また、[移動平均] を使用して、欠損データを推定値で補うこともできます。
例
ある株式市場アナリストはさまざまな株式の価値を分析しています。 そのアナリストは、移動平均を計算して、株価の動向を追跡し、価値が上がっている株と価値が下がっている株を特定しています。
ある疫学者は、感染病の発生を調査していますが、一部の日付の値がデータセットから欠損しています。 中央移動平均を使用すると、欠損している日付の推定値を算出できます。
移動平均機能の使用
[移動平均] は、Y 軸の数値フィールドを使用して作成された時系列グラフからしか実行できません。
[移動平均] 解析機能を実行するには、次の手順に従います。
- 次のいずれかのデータの組み合わせを使用して、時系列チャートを作成します。
- 1 つの日付/時間フィールドと 1 つ以上の数値フィールドまたは割合/比率フィールド
- 1 つ以上の日付/時間フィールドと 1 つの数値フィールドまたは割合/比率フィールド
- 必要に応じて、時系列カードをクリックしてアクティブ化します。 ツールバーと [アクション] ボタン が表示されると、カードがアクティブになります。
- [アクション] ボタンをクリックして、[移動平均] を選択します。
- [数値フィールドの選択] または [日付/時間フィールドの選択] で、移動平均の計算に使用する数値フィールドまたは日付/時間フィールドを選択します。 このパラメーターを使用できるのは、複数の数値フィールドまたは複数の日付/時間フィールドを使用して時系列グラフを作成した場合だけです。
- 移動平均の計算に使用する日数を [移動平均期間] に入力し、必要に応じてスライダーを調整します。 詳細については、「使用に関する注意」をご参照ください。
- [その他のオプション] を展開し、必要に応じて [日単位の集計] パラメーターの値を変更します。
- [実行] をクリックします。
使用上の注意
[数値フィールドの選択] パラメーターは、Y 軸に 2 つ以上の数値を使用して作成された時系列チャートで使用できます。 [日付/時間フィールドの選択] パラメーターは、2 つ以上の日付/時間フィールドが時系列チャートで使用されている場合に使用できます。 これらのパラメーターでは、移動平均の計算に使用するフィールドを決定します。
[移動平均期間] パラメーターでは、移動平均の計算に含める日数を決定します。 たとえば、1 週間の移動平均を計算する場合は、7 日間の期間を使用します。 この期間は奇数にする必要があります。 デフォルトの期間は 3 日間です。
[移動平均期間] パラメーターのスライダーでは、計算に使用する期間を決定します。 移動平均の最も一般的な使用は、計算値 (スライダー上で 0 日目と表示されている) を終点として配置するか (末尾移動平均)、中点として配置する (中央移動平均) ことです。 [移動平均] では、デフォルトで中央移動平均が計算されます。つまり、計算対象の値の前後に同じ数のデータ ポイントが存在します。
スライダーを移動させて、計算に使用する期間を変更することができます。 スライダーを負の終点に移動させると、計算が末尾移動平均に変更されます。 たとえば、デフォルト期間 3 を使用すると、末尾移動平均が作成され、計算対象の日付とその前の 2 日が計算に使用されます。
また、スライダーを使用して、中央移動平均や末尾移動平均ではなく、計算対象の日の前後の日数をカスタマイズして移動平均の計算を作成することもできます。
移動平均を計算するには、日単位の 1 つのデータ ポイントを使用します。 [日単位の集計] では、1 つの日から取得された複数の値を 1 つのデータ ポイントに集約する方法を決定します。 集約オプションとして、平均値、最小値、および最大値があります。 デフォルトの集約オプションは平均です。
移動平均ラインが時系列グラフに追加されます。 n-day moving average という新しいフィールド (n は [移動平均期間] パラメーターの値です) が入力データセットに追加されます。 [移動平均] は、同じデータセットに対して複数回実行することができます。 それぞれの結果は、時系列グラフと入力データセットに追加されます。
制限事項
[移動平均] は、少なくとも 1 つの数値フィールドを使用して作成された時系列グラフからしか実行できません。
[移動平均期間] パラメーターには、3 ~ 999 の奇数値を指定する必要があります。
移動平均の機能
[移動平均] では、日を基準にした単純移動平均 (SMA) 計算が使用されます。 [移動平均期間] パラメーターとそれに対応するスライダーを使用して、計算に使用する期間を決定します。
移動平均の計算では、移動平均期間がカレンダー期間ではなく、データセット内の期間に適用されます。 データセットから日付が欠損している場合は、それに続くカレンダー日付ではなく、データセット内でその次に近い日付が使用されます。 このため、欠損している日付の範囲が大きいデータセットでは、欠損している日付の範囲の先頭と末尾の近くで計算結果が不正確になることがあります。
NULL 値を含む日付やデータが欠損している日付も期間に含まれますが、n の値から差し引かれます (下記の式を参照)。 NULL 値や欠損データを除外する場合は、[移動平均] を実行する前に、データセットにフィルターを適用することができます。 たとえば、営業日に基づいて移動平均を計算し、週末の NULL 値を除外するとします。 入力日付/時間フィールドの Day of week サブフィールドを基準にしたフィルターを適用して、土曜日と日曜日の値を削除することができます。
[日単位の集計] パラメーターで統計情報を使用して日単位のデータを集計してから、次の式に適用します。
MA0 = (d1+...+dn-1+dn)/(n-x)
それぞれの意味は次のとおりです。
- MA0 = 現在の日付の移動平均 この日付を式の任意の位置 (d1 ~ dn) に当てはめることができます。
- d = 日単位の集計値
- n = 移動平均の計算に使用する日単位の値の数 (移動平均期間)
- x = 移動平均の範囲内にある NULL 値の日単位の集計値の数 有効な計算では、この値は 0 ~ n-1 の範囲内の値になります。 x = n の場合、その日の移動平均は計算されません。