空間的自己回帰 (Spatial Autoregression) (空間統計)

サマリー

ポイント フィーチャクラスまたはポリゴン フィーチャクラスのグローバル空間回帰モデルを推定します。

空間データを使用した場合、従来の線形回帰モデルの仮定が成立しないことがよくあります。 データセットに空間的自己相関が存在する場合、係数の推定値に偏りが生じ、自信過剰な推測になることがあります。 このツールを使用することで、空間依存と不均一性の存在下で堅牢な回帰モデルを推定するとともに、空間スピルオーバー効果を見積もることができます。 このツールでは、ラグランジュの未定乗数法 (LM) (Rao スコアとも呼ぶ) 診断検定を使用して、最も適切なモデルが特定されます。 LM 診断に基づいて、最小二乗法 (OLS)、空間ラグ モデル (SLM)、空間誤差モデル (SEM)、または空間自己回帰結合モデル (SAC) を推定できます。

空間的自己回帰の仕組みの詳細

空間的自己回帰ツールの図

使用法

  • このツールは、入力としてポイントとポリゴンのみをとります。

  • 従属変数は連続でなければなりません (バイナリ変数やカテゴリ変数であってはなりません)。

  • 説明変数は連続でなければなりません (バイナリ変数やカテゴリ変数であってはなりません)。 バイナリ変数 (値 0 と 1 だけが含まれている) ではモデルの仮定が成立せず、エラーが生じる可能性があるため、バイナリ変数は使用しないでください。

  • このツールの出力には残差の Moran 散布図が含まれており、これを使用してモデルの残差で自己相関を特定することができます。

  • 使用する空間加重マトリックスに 30 パーセントを超える接続性があってはなりません。 この閾値に達すると、偏った推定を防止するため、エラーが発生します。

  • ローカル加重方式で K 最近隣内挿法を使用しているときに、バンド幅が指定されていない場合、適応バンド幅が計算されます。

  • SLM を適合させ、各説明変数とその空間ラグを含めることによって、空間ダービン モデルを推定することができます。 空間ラグを計算するには、[近傍要約統計量 (Neighborhood Summary Statistics)] ツールを使用します。

  • このモデルは、不均一性と正規性に関連する次の手法を使用して推定することができます。

    • SLM では S2SLS (Spatial Two Stage Least Squares) 回帰が使用されます。
    • SEM では GMM (Generalized Method of Moments) が使用されます。
    • SAC では GS2SLS (Generalized S2SLS) が使用されます。

パラメーター

ラベル説明データ タイプ
入力フィーチャ

従属変数と説明変数が含まれている入力フィーチャ。

Feature Layer
従属変数

回帰モデルで予測される数値フィールド。

Field
説明変数

回帰モデルで従属変数の予測に使用されるフィールドのリスト。

Field
出力フィーチャ

従属変数の予測値と残差が含まれている出力フィーチャクラス。

Feature Class
モデル タイプ

推定に使用されるモデル タイプ。 デフォルトでは、LM 診断検定を使用して、入力データに最も適したモデルが使用されます。

  • 自動検出LM 診断検定を使用して、OLS、SLM、SEM、SAC のいずれを推定するかを決定します。 これがデフォルトです。
  • 空間誤差モデル (SEM)LM 診断にかかわらず、SEM が推定されます。
  • 空間ラグ モデル (SLM)LM 診断にかかわらず、SLM が推定されます。
  • 空間自己回帰結合 (SAC)LM 診断にかかわらず、SAC が推定されます。
String
近傍タイプ
(オプション)

各入力フィーチャに対する近傍の選択方法を指定します。 ローカル空間パターンを明らかにするには、各入力フィーチャの近接フィーチャを特定する必要があります。

  • 固定距離バンド各フィーチャから指定した距離内にあるフィーチャが近接フィーチャと見なされます。
  • K 近傍最も近い K 個のフィーチャが近接フィーチャと見なされます。 近接フィーチャの数は [近接フィーチャの数] パラメーターを使用して指定します。
  • 隣接エッジのみエッジを共有するポリゴン フィーチャが近接フィーチャとして含められます。
  • 隣接エッジ コーナーエッジまたはコーナーを共有するポリゴン フィーチャが近接フィーチャとして含められます。 ポリゴン フィーチャに対するデフォルトです。
  • ドロネー三角形分割ドロネー三角形分割でエッジまたはコーナーを共有するフィーチャが近接フィーチャとして含められます。 これは、ポイント フィーチャに対するデフォルトの設定です。
  • 空間加重をファイルから取得近傍および加重は、指定した空間加重ファイルによって定義されます。 このファイルは [加重マトリックス ファイル] パラメーターを使用して指定します。
String
距離バンド
(オプション)

フィーチャを近傍として含める距離範囲。 値を指定しない場合、値は処理中に見積もられ、ジオプロセシング メッセージとして含められます。

Linear Unit
近接フィーチャの数
(オプション)

近接フィーチャとして含まれる近傍数。 この数にフォーカル フィーチャは含まれません。 デフォルトは 8 です。

Long
加重マトリックス ファイル
(オプション)

フィーチャ間の空間リレーションシップを定義する空間加重マトリックス ファイルのパスとファイル名。

File
ローカル加重方式
(オプション)

近接フィーチャに適用される加重方式を指定します。 空間加重マトリックス ファイルが指定されていない場合、加重は必ず行で標準化されます。

  • 加重なし近接フィーチャには加重 1 が割り当てられます。これがデフォルトです。
  • バイスクエア近接フィーチャは Bisquare (四次) カーネルを使用して加重されます。
  • ガウス近接フィーチャはガウス (正規分布) カーネルを使用して加重されます。
String
カーネル バンド幅
(オプション)

加重カーネルのバンド幅。 値が指定されていない場合、適応カーネルが使用されます。 適応カーネルでは、近接フィーチャからフォーカル フィーチャまでの最大距離がバンド幅として使用されます。

Linear Unit

arcpy.stats.SAR(in_features, dependent_variable, explanatory_variables, out_features, model_type, {neighborhood_type}, {distance_band}, {number_of_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth})
名前説明データ タイプ
in_features

従属変数と説明変数が含まれている入力フィーチャ。

Feature Layer
dependent_variable

回帰モデルで予測される数値フィールド。

Field
explanatory_variables
[explanatory_variables,...]

回帰モデルで従属変数の予測に使用されるフィールドのリスト。

Field
out_features

従属変数の予測値と残差が含まれている出力フィーチャクラス。

Feature Class
model_type

推定に使用されるモデル タイプ。 デフォルトでは、LM 診断検定を使用して、入力データに最も適したモデルが使用されます。

  • AUTOLM 診断検定を使用して、OLS、SLM、SEM、SAC のいずれを推定するかを決定します。 これがデフォルトです。
  • ERRORLM 診断にかかわらず、SEM が推定されます。
  • LAGLM 診断にかかわらず、SLM が推定されます。
  • COMBINEDLM 診断にかかわらず、SAC が推定されます。
String
neighborhood_type
(オプション)

各入力フィーチャに対する近傍の選択方法を指定します。 ローカル空間パターンを明らかにするには、各入力フィーチャの近接フィーチャを特定する必要があります。

  • DISTANCE_BAND各フィーチャから指定した距離内にあるフィーチャが近接フィーチャと見なされます。
  • K_NEAREST_NEIGHBORS最も近い K 個のフィーチャが近接フィーチャと見なされます。 近接フィーチャの数は number_of_neighbors パラメーターを使用して指定します。
  • CONTIGUITY_EDGES_ONLYエッジを共有するポリゴン フィーチャが近接フィーチャとして含められます。
  • CONTIGUITY_EDGES_CORNERSエッジまたはコーナーを共有するポリゴン フィーチャが近接フィーチャとして含められます。 ポリゴン フィーチャに対するデフォルトです。
  • DELAUNAY_TRIANGULATIONドロネー三角形分割でエッジまたはコーナーを共有するフィーチャが近接フィーチャとして含められます。 これは、ポイント フィーチャに対するデフォルトの設定です。
  • GET_SPATIAL_WEIGHTS_FROM_FILE近傍および加重は、指定した空間加重ファイルによって定義されます。 このファイルは weights_matrix_file パラメーターを使用して指定します。
String
distance_band
(オプション)

フィーチャを近傍として含める距離範囲。 値を指定しない場合、値は処理中に見積もられ、ジオプロセシング メッセージとして含められます。

Linear Unit
number_of_neighbors
(オプション)

近接フィーチャとして含まれる近傍数。 この数にフォーカル フィーチャは含まれません。 デフォルトは 8 です。

Long
weights_matrix_file
(オプション)

フィーチャ間の空間リレーションシップを定義する空間加重マトリックス ファイルのパスとファイル名。

File
local_weighting_scheme
(オプション)

近接フィーチャに適用される加重方式を指定します。 空間加重マトリックス ファイルが指定されていない場合、加重は必ず行で標準化されます。

  • UNWEIGHTED近接フィーチャには加重 1 が割り当てられます。これがデフォルトです。
  • BISQUARE近接フィーチャは Bisquare (四次) カーネルを使用して加重されます。
  • GAUSSIAN近接フィーチャはガウス (正規分布) カーネルを使用して加重されます。
String
kernel_bandwidth
(オプション)

加重カーネルのバンド幅。 値が指定されていない場合、適応カーネルが使用されます。 適応カーネルでは、近接フィーチャからフォーカル フィーチャまでの最大距離がバンド幅として使用されます。

Linear Unit

コードのサンプル

SAR の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、SAR 関数の使用方法を示しています。

# Fit SAR model and auto-detect the regression model.
arcpy.stats.SAR(
    in_features=r"C:\data\data.gdb\house_price",
    dependent_variable="price",
    explanatory_variables=["crime", "income", "school_rate"],
    out_features=r"C:\data\data.gdb\house_price_SAR",
    model_type="AUTO",
    neighborhood_type="DELAUNAY_TRIANGULATION",
    distance_band=None,
    number_of_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None
)
SAR の例 2 (スタンドアロン スクリプト)

次のスタンドアロン スクリプトで、SAR 関数を使用する方法を示します。

# Fit SAR model using SLM.  

# Import modules
import arcpy

# Set the current workspace
arcpy.env.workspace = r"C:\data\data.gdb"


# Run SAR tool with Spatial Lag model
arcpy.stats.SAR(
    in_features=r"health_factors_CA",
    dependent_variable="Diabetes",
    explanatory_variables=["Drink", "Inactivity"],
    out_features=r"Diabetes_SAR",
    model_type="LAG",
    neighborhood_type="CONTIGUITY_EDGES_CORNERS",
    distance_band=None,
    number_of_neighbors=None,
    weights_matrix_file=None,
    local_weighting_scheme="UNWEIGHTED",
    kernel_bandwidth=None
)

関連トピック