固定距離バンドの値を選択するためのベスト プラクティス

固定距離バンドは、一時的に各フィーチャ上に固定され、そのフィーチャをその隣接フィーチャのコンテキスト内で表示する変動解析ウィンドウと考えることができます。次のガイドラインとベスト プラクティスは、解析に適切な距離バンドを特定するのに役立ちます。

  • 調査対象の空間的現象について、既知のことに基づいた距離を選択します。この情報を把握していることはまれですが、把握している場合は、この知識を使用して距離の値を選択するようにしてください。たとえば、平均通勤距離が 15 km であることがわかっているとします。この場合、距離バンドを 15 km に設定すると、通勤データが適切に分析されるでしょう。
  • すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在することを確保するために十分な距離バンドを使用します。そうでない場合、結果が無効になります。
  • 入力データに歪みがある (値をヒストグラムとしてプロットした場合に釣鐘曲線が生成されない) 場合は、距離バンドが小さすぎないか (ほとんどのフィーチャに 1 つか 2 つの隣接フィーチャしかない)、大きすぎないか (いくつかのフィーチャにその他のすべてのフィーチャが隣接フィーチャとして含まれている) を確認します。小さすぎる場合、または大きすぎる場合は、結果として生成される Z スコアが信頼性の低いものになるためです。
  • Z スコアは、距離バンドが各フィーチャにいくつかの (およそ 8 つの) 隣接フィーチャが存在することを確保するために十分な大きさである限り、信頼できます。フィーチャが数千個の近傍を持つ距離バンドを作成した場合、どのフィーチャも他のすべてのフィーチャを近傍として持たない場合でも、パフォーマンスの問題やメモリの制限を招く可能性があります。
  • すべてのフィーチャが少なくとも 1 つの近傍を持つようにすると、数千もの近傍を持ついくつかのフィーチャが作成される場合があり、これは理想的ではありません。これは、一部のフィーチャが空間的な外れ値である場合に発生することがあります。この問題を解決するには、空間的な外れ値以外のすべてについて適切な距離バンドを探して、[空間ウェイト マトリックスの生成 (Generate_Spatial_Weights_Matrix)] ツールを使用し、その距離を使用して空間ウェイト マトリックス ファイルを作成します。ただし、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを実行するときに、[近傍数] パラメーターに最小近傍数を指定してください。例: 国勢調査データを使用してロサンゼルス カウンティの健康的な食品へのアクセス性を評価しているとします。買い物ができる場所の 3 マイル以内に人口の 90 % 以上が住んでいることがわかっています。国勢統計区の分析により、中心エリアの (国勢統計区の重心に基づく) 統計区間の距離は約 1,000 メートルですが、中心を離れたエリアの統計区間の距離は 18,000 メートル以上であることがわかります。すべてのフィーチャが少なくとも 1 つの隣接フィーチャを持つようにするには、距離バンドが 18,000 メートル以上である必要があります。この分析用縮尺 (距離) は、質問の内容に適していません。この解決策として、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して国勢調査地区フィーチャクラスの空間ウェイト マトリックス ファイルを作成します。空間的な外れ値を除くすべてに適切な [距離バンドまたは距離の閾値] の値 (たとえば、4800 メートル (約 3 マイル)) と、[近傍数] パラメーターの最小近傍数 (たとえば 2) を指定します。これにより、この距離を使用して少なくとも 2 つの近傍を持たないフィーチャを除くすべてのフィーチャに 4,800 メートルの固定距離近傍を適用します。外れ値フィーチャの場合 (外れ値フィーチャのみ)、すべてのフィーチャが少なくとも 2 つの近傍を持つように距離を拡大します。
  • 最大空間的自己相関を反映する距離バンドを使用します。地形上に空間クラスタリングが見られる場合は、内在する空間プロセスがアクティブであることを示します。[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールで測定される最大のクラスタリングを示す距離バンドは、これらの空間プロセスが最もアクティブであるか、最も明確な距離です。[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールを実行し、得られる Z スコアがピークを示す場所を確認します。ピーク値に関連付けられている距離を分析に使用します。
    注意:

    レイヤーの空間参照または [出力データの座標系] ジオプロセシング環境で指定されているのと同じ単位を使用して距離の値を入力します。

    • 各ピークは、空間クラスタリングを促進するプロセスが顕著である距離を表します。通常、ピークは複数あります。一般的に、より長い距離に関連付けられているピークは、広範なトレンド (たとえば、西が巨大なホット スポットであり、東が巨大なコールド スポットである広範な東から西へのトレンド) を反映します。一般的に、より短い距離に関連付けられているピーク (多くの場合、最初のピーク) のほうが重要です。
    • 目立たないピークは、多くの場合、多数の異なる空間プロセスがさまざまな空間尺度で作用していることを意味します。この場合、分析にどの固定距離を使用するかを判断するためには、一般的に、他の基準を使用します (通常は、改善のために最も効果的な距離)。
    • 集約データ (たとえば、郡など) を使用している場合に、Z スコアのピークがない (つまり、増え続けている) 場合は、集約スキーマが粗すぎることを意味します。つまり、対象の空間プロセスは、集約単位の尺度よりも小さい尺度で作用しています。分析をより小さい尺度に変更できる場合は (たとえば、郡から区域に移行するなど)、ピーク距離を見つけることができる場合があります。ポイント データでの作業中に Z スコアにピークが生じない場合は、多様な空間尺度で多数の異なる空間プロセスが実行されており、分析で使用する固定距離を決定するための別の基準を考えなければならないことを示しています。また、[インクリメンタル空間自己相関 (Incremental Spatial Autocorrelation)] ツールを使用するときに、[開始距離] の値が大きすぎないことを確認します。
    • 開始距離を指定しない場合、[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールはすべてのフィーチャが少なくとも 1 つの近傍を持つようにする距離を使用します。ところが、データに空間的な外れ値が含まれていると、その距離は分析の目的とは不釣合いに膨れ上がる可能性があります。これが [出力レポート ファイル] に明らかなピークが表示されない理由である可能性があります。解決するには、一時的にすべての空間的な外れ値を除外する選択セットを [インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールで実行します。外れ値を除外してピークが見つかった場合は、すべてのフィーチャ (空間的な外れ値を含む) にそのピーク距離を適用して先に示した方法を使用し、各フィーチャが少なくとも 1 つまたは 2 つの近傍を持つようにします。いずれかのフィーチャが空間的な外れ値であるかどうか不明な場合、以下の操作を行ってください。
      • ポリゴン データの場合は、標準偏差レンダリング方式を使用してポリゴン エリアをレンダリングし、3 標準偏差よりも大きいエリアを持つポリゴンを空間的な外れ値と見なします。まだフィールドがない場合は、[フィールド演算 (Calculate Field)] ツールを使用してポリゴン エリアのフィールドを作成します。
      • ポイント データの場合は、[最近接] ツールを使用して各フィーチャの最近隣距離を計算します。これを行うには、ポイント データセットに対して [最近接 (Near)] ツールの [入力フィーチャ][最近接フィーチャ] を設定します。最近隣距離のフィールドを準備したら、標準偏差レンダリング方式を使用してこれらの値をレンダリングし、3 標準偏差よりも大きい距離を空間的な外れ値と見なします。
    [インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] のグラフ
    クラスタリングを促進するプロセスが最も顕著である距離を特定します。
  • 正しい距離バンドは 1 つしかないということに固執しないようにしてください。現実は、それほどシンプルではありません。ほとんどの場合、観測されたクラスタリングを促進する空間プロセスは複数あり、相互に作用しています。1 つの距離バンドが必要であると考えるよりも、パターン分析ツールは複数の空間尺度で空間リレーションシップを調べるための効果的な方法であると考えるようにしてください。(距離バンドの値を変更して) 分析用縮尺を変更すると、分析の目的が変わることがあることに注意してください。たとえば、所得データを処理しているとします。距離バンドが小さいと、近傍の所得パターンを調べることができ、距離の尺度が中程度であれば、1 つのコミュニティまたは都市の所得パターンが反映され、最大距離バンドの場合は、広範な領域の所得パターンが示されます。