空間データ分析では、多くの場合、分析のスケールが重要です。 多くの密度ツールでは、半径値を指定するよう求められます。選択する距離は、対応している問題のスケールまたは検討している解決法のスケールを基準としなければなりません。たとえば、小児肥満について調査する場合を考えます。分析のスケールは何でしょうか。個々の世帯レベルでしょうか。それとも地域レベルでしょうか。そのような場合、分析のスケールを定義するために使用する距離を小さくし、1 ブロックか 2 ブロック以内の数軒の範囲にします。一方、解決法のスケールは何でしょうか。おそらく、小児肥満を減らす可能性のある方法として、放課後のフィットネスプログラムを増やす場所などが問題となります。この場合、距離は校区を表す可能性が高くなります。適切な分析のスケールを決定するのが非常に簡単な場合もあります。たとえば、通勤パターンを分析するのに、職場までの平均距離が 12 マイルとわかった場合、分析に使用する適切な距離は 12 マイルとなります。一方、特定の分析距離を決定するのが難しい場合もあります。この場合、[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールが非常に役立ちます。
地形上に空間クラスタリングが見られる場合は、内在する空間プロセスがアクティブであることを示します。プロセスの実施対象となる空間的な規模について理解していると、適切な分析距離を選択できます。[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールにより、距離を徐々に増やして [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールを実行し、各距離の空間クラスター化の強度を計測します。クラスタリングの強度は、返される Z スコアによって決定されます。通常、距離が増えると Z スコアも増え、クラスタリングの強度が増していることを示します。ただし、通常、ある特定の距離で Z スコアはピークになります。ピークが複数ある場合もあります。
ピークは、クラスタリングを促進する空間プロセスが最も顕著である距離を表します。グラフ上の各ポイントの色は、Z スコア値の統計的な有意性に対応しています。
分析の適切なスケールを特定する方法の 1 つは、問題のスケールを最適に表す統計的に有意なピークに関連付けられている距離を選択することです。多くの場合、これは、最初の統計的に有意なピークです。
開始距離と距離の増分の値の選択方法
すべての距離の計測値は、フィーチャの重心に基づいています。デフォルトの [開始距離] は、すべてのフィーチャが少なくとも 1 つの近隣フィーチャを持つようにする最小距離です。データセットに地理的な外れ値がない限り、通常これが適切な選択です。地理的な外れ値があるかどうかを判断してから、外れ値のフィーチャを除くすべてのフィーチャを選択し、選択したフィーチャに [インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] を実行します。選択したフィーチャのピーク距離を発見したら、その距離を使用し、すべてのフィーチャ (外れ値も含む) に基づいて空間ウェイト マトリックス ファイルを作成します。[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを実行して空間ウェイト マトリックス ファイルを作成する場合、[近傍数] パラメーターには、すべてのフィーチャができるだけ多くの近隣フィーチャを持てるような値を設定します。
デフォルトの [距離の増分] は、各フィーチャから最近隣フィーチャまでの平均距離です。上記の方法を使用して適切な開始距離を決定したが、それでもピーク距離がわからない場合、距離の増分を増減させてみてください。
グラフにピークがない場合
[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールを使用すると、距離が増えるにつれて Z スコアが上昇し続ける、すなわち、ピークがないグラフになる場合があります。これは多くの場合、データが集約され、[入力フィールド] 変数に影響を与えるプロセスのスケールが集約方式よりも小さい場合に発生します。[距離の増分] を小さくして、わずかなピークが得られるかどうか確認することができます。ただし、分析範囲に複数の空間プロセスがあり、それぞれが異なる距離で稼働しているためにピークが得られない場合もあります。これは多くの場合、ノイズの多い大規模ポイント データセットで発生します (分析しているポイント データ値に対するクリアでない空間パターン)。この場合、他の基準を使用した分析のスケールを検討する必要があります。
結果の解析
ただし、一般的には、距離のピークは、オプションの [出力レポート] ファイルのグラフを見ることによって特定します。レポートは 3 ページあります。レポートの最初のページの例を以下に示します。このグラフには、5000、9000、13000 フィートの距離に関連付けられた 3 つの Z スコアのピークがあります。最初のピークと最大ピークをハイライト表示するためにハローが使用されています。すべてのピークが、クラスタリングを促進する空間プロセスが最も顕著である距離を表しています。分析対象のスケールを最適に表すピークを選択できます。場合によっては、最初のピークと最大ピークが同じ距離になるため、ハローが 1 つだけになることもあります。Z スコアのピークのいずれも統計的に有意でない場合、ライトブルーのハローはどのピークにも使用されません。プロットされた Z スコアの色は、統計的な有意性の基準値を示す凡例に対応しています。
レポートの 2 ページには、距離と Z スコアの値が表形式で表示されます。最後のページには、ツールを実行したときに使用されたパラメーター設定が記録されます。レポート ファイルを入手するには、[出力レポート] パラメーターにパスを指定します。
参考資料
- ホット スポット分析を実行するためのベスト プラクティスを説明したビデオ:
- 空間パターン分析チュートリアルは、[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールを使用したデング熱データの分析を説明しています。
- 「空間リレーションシップのモデリング」の「固定距離バンドの選択」をご参照ください。
- 「ホット スポット分析 (Hot Spot Analysis) の詳細」には、分析の適切なスケールを見つける方法についての説明があります。
- 利用可能な空間統計リソースの最新リストについては、https://esriurl.com/spatialstats にアクセスしてください。