インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation) (空間統計)

サマリー

一連の距離の空間的自己相関を計測し、必要に応じて、これらの距離とそれに対応する Z スコアの折れ線グラフを作成します。 Z スコアは、空間クラスタリングの強度を表し、統計的に有意な Z スコアのピークは、クラスタリングを促進する空間プロセスが最も顕著である距離を表します。 これらのピーク距離は、多くの場合、[距離バンド] または [距離半径] パラメーターを持つツールで使用する際に適した値となります。

インクリメンタル空間的自己相関ツールの図
Z スコアのピークは、クラスタリングを促進する空間プロセスが最も顕著である距離を表します。

使用法

  • このツールを使用すると、[ホット スポット分析 (Hot Spot Analysis)] ツールや [点密度 (Point Density)] ツールなど、[距離の閾値] または [半径] パラメーターを含むツールで、これらのパラメーターに適切な値を指定できます。

  • [インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールは、一連の距離の増分の空間的自己相関を計測して、レポートします。それぞれの距離の増分、関連付けられた Moran インデックス、期待されるインデックス、分散、Z スコア、p 値に対して実行されます。 このツールを実行すると、これらの値がメッセージとして書き込まれます。 このメッセージには、各距離の Z スコアを示す距離による空間的自己相関ライン チャートも含まれています。

  • 統計的に有意なピークが複数存在する場合、クラスタリングはそれぞれの距離で顕著に表れます。 対象となる分析のスケールに最適な距離のピークを選択します。これは多くの場合、最初の統計的に有意なピークになります。

  • [入力フィールド] パラメーターには、さまざまな値を入力する必要があります。 この統計計算では、分析する変数に変異が存在する必要があります。たとえば、入力値がすべて 1 の場合、解は存在しません。 このツールを使用してインシデント データの空間パターンを分析する場合は、インシデント データの集約を検討してください。

  • [入力フィーチャクラス] パラメーターの値が投影されていない場合 (つまり、座標が度、分、秒で示されている場合) または出力座標系地理座標系に設定されている場合は、弦の測定値を使用して距離が計算されます。 弦距離の測定値が使用されるのは、少なくとも互いに約 30° の範囲内のポイントに対して、すばやく算出され、実際の測地距離に近い推定値が得られるという理由からです。 弦距離は、扁平回転楕円体に基づいています。 地球の表面上の 2 点が与えられた場合、2 点間の弦の距離は、3 次元の地球内部を通過して 2 点を接続するラインの長さになります。 弦距離は、メートル単位でレポートされます。

    注意:

    分析範囲が 30°を超えて広がっている場合は、必ずデータを投影してください。 30°を超える場合、弦距離は測地距離の良好な推定値にはなりません。

  • 弦距離を分析で使用する場合は、[開始距離] パラメーターと [距離の増分] パラメーターの値をメートル単位で指定する必要があります。

  • ライン フィーチャとポリゴン フィーチャの場合は、距離の計算にフィーチャの重心が使用されます。マルチポイント、ポリライン、または複数のパートを持つポリゴンの場合は、すべてのフィーチャ パートの加重平均中心を使用して重心が計算されます。加重は、ポイント フィーチャの場合は 1、ライン フィーチャの場合は長さ、ポリゴン フィーチャの場合は面積です。

  • マップ レイヤーを使用して、入力フィーチャクラスを指定できます。解析対象として指定したレイヤーの中で何らかのフィーチャが選択されている場合、選択されているフィーチャだけが解析の対象となります。

  • ポリゴン フィーチャでは、ほとんどの場合に [行を標準化] パラメーターに [行] を指定する必要があります。 [行の標準化] を行うと、解析対象の変数の実際の空間分布を反映するのではなく、各フィーチャの近接フィーチャの数が集約方式またはサンプリング プロセスの関数になる場合に偏りが緩和されます。

  • [開始距離] パラメーターの値を指定しないと、デフォルト値は、データセット内の各フィーチャが少なくとも 1 つの近隣フィーチャを持てるのに必要な最小距離 (すべてのフィーチャ内での最大最近隣距離) になります。 データセットに地理的な外れ値が含まれている場合は、これが最も適切な開始距離にならない可能性があります。

  • [距離の増分] パラメーターの値を指定しないと、平均最近隣距離または (Td - B) / I のどちらか短い方の距離が使用されます。ここで、Td は最大閾値距離、B[開始距離] パラメーターの値、I[距離バンド数] パラメーターの値を表します。 このアルゴリズムでは、[距離バンド数] に指定した値に対して常に計算が実行され、一部のフィーチャで、それ以外のすべてのフィーチャまたはほとんどすべてのフィーチャが近隣フィーチャとして考慮されてしまうほど、最大距離バンドが大きくなるのを防ぐことができます。

  • [開始距離] パラメーターまたは [距離の増分] パラメーターの値によって最大閾値距離よりも長い距離バンドが生成される場合は、[距離の増分] の値が自動的に小さくなります。 この調整を避けるには、[距離の増分] の値を小さくするか、[距離バンド数] の値を小さくします。

  • このツールを実行すると、メモリ不足が発生する可能性があります。 この状況は通常、[開始距離] パラメーターまたは [距離の増分] パラメーターに指定した値によって、数千もの近隣フィーチャを持つフィーチャが生成された場合に発生します。 フィーチャが数千もの近隣フィーチャを持つような空間リレーションシップを作成しないことが最善策です。 [距離の増分] の値を小さくし、一時的に地理的な外れ値を削除して、より小さい [開始距離] の値から開始できるようにします。

  • このツールで [開始距離] パラメーターと [距離の増分] パラメーターの値を計算する場合でも、データセットのサイズが大きいと、処理時間が長くなることがあります。 次の操作を実行すると、パフォーマンスを向上させることができます。

    • (上記のとおりに) 地理的な外れ値を一時的に削除する。
    • すべてのフィーチャに対して分析を実行するのではなく、分析範囲の代表的な部分で選択したフィーチャに対して分析を実行する。
    • データセットからフィーチャのサンプルをランダムに選択し、これらのサンプル フィーチャに対して分析を実行する。

  • 距離は常に、[出力データの座標系] 環境設定に基づきます。 出力データの座標系環境のデフォルト オプションは [入力と同様] です。 分析が実行される前に、入力フィーチャが出力データの座標系に投影変換されます。

  • オプションの [出力テーブル] パラメーターの値には、各反復での距離値、Moran's I インデックス値、期待される Moran's I インデックス値、分散、Z スコア、p 値が含まれます。 ピークでは Z スコア値が増加し、その後 Z スコア値が減少します。 たとえば、このツールで 50、100、150 メートルの距離に対して Z スコアがそれぞれ 2.95、3.68、3.12 として検出された場合、ピークは 100 メートルになります。 この出力テーブルには、各距離の Z スコアを示す距離による空間的自己相関ライン チャートも含まれています。このライン チャートを使用して、ピークを特定することができます。

  • このツールを Python から使用すると、このツールの実行によって返される結果オブジェクトの出力は次のようになります。

    位置説明データ タイプ

    0

    最初のピーク

    Double

    1 キー

    最大ピーク

    Double

パラメーター

ラベル説明データ タイプ
入力フィーチャ

空間的自己相関が一連の距離に対して計測されるフィーチャクラスです。

Feature Layer
入力フィールド

空間的自己相関の評価で使用される数値フィールド。

Field
距離バンド数

近傍サイズが増分され、空間的自己相関でデータセットが分析される回数。 開始ポイントと増分サイズは、それぞれ [開始距離] パラメーターと [距離の増分] パラメーターで指定します。

Long
開始距離
(オプション)

空間的自己相関分析を開始する距離であり、ここを起点として距離が増分されます。 このパラメーターの値は、出力座標系環境設定の単位で指定する必要があります。

Double
距離の増分
(オプション)

繰り返し実行ごとに増分する距離。 分析で使用する距離は [開始距離] パラメーターの値から始まり、[距離の増分] パラメーターで指定した値だけ増分します。 このパラメーターの値は、出力座標系環境設定の単位で指定する必要があります。

Double
距離計算の方法
(オプション)

各フィーチャから隣接フィーチャまでの距離の計算方法を指定します。

  • ユークリッド2 つのポイント間の直線距離を (最短距離として) 使用して距離が算出されます。 これがデフォルトです。
  • マンハッタン直角の軸 (街区) に沿って計測した 2 つのポイント間の距離を使用して距離が算出されます。つまり、X 座標と Y 座標間の (絶対) 距離を合計して算出されます。
String
行の標準化
(オプション)

空間加重を標準化するかどうかを指定します。 行の標準化が推奨されるのは、サンプリングの設計や指定された集約方式によってフィーチャの分布が偏る可能性がある場合です。

  • オン - 空間加重が標準化されます。 それぞれの加重がその行の合計 (すべての近隣フィーチャの加重の合計) で除算されます。 これがデフォルトです。
  • オフ - 空間加重が標準化されません。
Boolean
出力テーブル
(オプション)

作成されるテーブルであり、各距離バンドと関連付けられた Z スコアの結果が記入されます。

Table
出力レポート ファイル
(オプション)

作成される .pdf ファイルには、結果をまとめた折れ線グラフが含まれます。

File

派生した出力

ラベル説明データ タイプ
最初のピーク

最初のピークの Z スコア。

Double
最大のピーク

最大のピークの Z スコア。

Double

arcpy.stats.IncrementalSpatialAutocorrelation(Input_Features, Input_Field, Number_of_Distance_Bands, {Beginning_Distance}, {Distance_Increment}, {Distance_Method}, {Row_Standardization}, {Output_Table}, {Output_Report_File})
名前説明データ タイプ
Input_Features

空間的自己相関が一連の距離に対して計測されるフィーチャクラスです。

Feature Layer
Input_Field

空間的自己相関の評価で使用される数値フィールド。

Field
Number_of_Distance_Bands

近傍サイズが増分され、空間的自己相関でデータセットが分析される回数。 開始ポイントと増分サイズは、それぞれ Beginning_Distance パラメーターと Distance_Increment パラメーターで指定します。

Long
Beginning_Distance
(オプション)

空間的自己相関分析を開始する距離であり、ここを起点として距離が増分されます。 このパラメーターの値は、出力座標系環境設定の単位で指定する必要があります。

Double
Distance_Increment
(オプション)

繰り返し実行ごとに増分する距離。 分析で使用する距離は Beginning_Distance パラメーターの値から始まり、Distance_Increment パラメーターで指定した値だけ増分します。 このパラメーターの値は、出力座標系環境設定の単位で指定する必要があります。

Double
Distance_Method
(オプション)

各フィーチャから隣接フィーチャまでの距離の計算方法を指定します。

  • EUCLIDEAN2 つのポイント間の直線距離を (最短距離として) 使用して距離が算出されます。 これがデフォルトです。
  • MANHATTAN直角の軸 (街区) に沿って計測した 2 つのポイント間の距離を使用して距離が算出されます。つまり、X 座標と Y 座標間の (絶対) 距離を合計して算出されます。
String
Row_Standardization
(オプション)

空間加重を標準化するかどうかを指定します。 行の標準化が推奨されるのは、サンプリングの設計や指定された集約方式によってフィーチャの分布が偏る可能性がある場合です。

  • ROW_STANDARDIZATION空間加重が標準化されます。 それぞれの加重がその行の合計 (すべての近隣フィーチャの加重の合計) で除算されます。 これがデフォルトです。
  • NO_STANDARDIZATION空間加重が標準化されません。
Boolean
Output_Table
(オプション)

作成されるテーブルであり、各距離バンドと関連付けられた Z スコアの結果が記入されます。

Table
Output_Report_File
(オプション)

作成される .pdf ファイルには、結果をまとめた折れ線グラフが含まれます。

File

派生した出力

名前説明データ タイプ
First_Peak

最初のピークの Z スコア。

Double
Max_Peak

最大のピークの Z スコア。

Double

コードのサンプル

IncrementalSpatialAutocorrelation の例 1 (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、IncrementalSpatialAutocorrelation 関数の使用方法を示しています。

import arcpy
arcpy.env.workspace = r"C:\ISA"
arcpy.stats.IncrementalSpatialAutocorrelation("911CallsCount.shp", "ICOUNT", 
                                              "20", "", "", "EUCLIDEAN",
                                              "ROW_STANDARDIZATION", 
                                              "outTable.dbf")
IncrementalSpatialAutocorrelation の例 2 (スタンドアロン スクリプト)

次のスタンドアロン Python スクリプトで、IncrementalSpatialAutocorrelation 関数を使用する方法を示します。

# Hot Spot Analysis of 911 calls in a metropolitan area
# using the Incremental Spatial Autocorrelation and Hot Spot Analysis Tools

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables
workspace = r"C:\ISA"

try:
    # Set the current workspace (to avoid having to specify the full path to 
    # the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap together at 
    # 30 feet
    # Process: Copy Features and Integrate
    cf = arcpy.management.CopyFeatures("911Calls.shp", "911Copied.shp")
    integrate = arcpy.management.Integrate("911Copied.shp #", "30 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.stats.CollectEvents("911Copied.shp", "911Count.shp")

    # Use Incremental Spatial Autocorrelation to get the peak distance
    # Process: Incremental Spatial Autocorrelation
    isa = arcpy.stats.IncrementalSpatialAutocorrelation(ce, "ICOUNT", "20", "", 
                     "", "EUCLIDEAN", "ROW_STANDARDIZATION", "outTable.dbf", 
                     "outReport.pdf")

    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    distance = isa.getOutput(2)
    hs = arcpy.stats.HotSpots(ce, "ICOUNT", "911HotSpots.shp", "Fixed Distance Band",
                     "Euclidean Distance", "None",  distance, "", "")

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

環境

特殊なケース

出力座標系

フィーチャ ジオメトリは、解析の前に、出力データの座標系に投影変換されます。 すべての数学的演算は、出力座標系の空間参照に基づいて実行されます。 出力データの座標系が度、分、および秒に基づく場合、測地距離は弦距離を使用して推定されます。