多くの空間データ分析では、分析のスケールが重要となります。 たとえば、[ホット スポット分析 (Hot Spot Analysis)] ツールの [空間リレーションシップのコンセプト] パラメーターのデフォルト値は固定距離バンドになっています。 多くの密度ツールでは、半径値を指定する必要があります。 指定する距離は、解決しようとしている問題のスケールまたは検討している改善のスケールに関連していなければなりません。 たとえば、小児肥満症について把握するとします。 分析のスケールはどれくらいですか? 個々の世帯レベルまたは地域レベルですか? 該当する場合は、分析のスケールの定義に使用する距離が短くなり、1 つの区画内の住宅または隣接し合う 2 つの区画内の住宅が含まれます。 また、改善のスケールはどれくらいですか? おそらく、小児肥満症の危険性を下げる方法である放課後のフィットネス プログラムを増やす場所が問題です。 この場合は、距離がスクール ゾーンを反映する可能性があります。 適切な分析のスケールを非常に簡単に特定できる場合があります。たとえば、通勤パターンを分析する際に、平均通勤距離が 12 マイルであることが判明している場合、分析に使用するのに適した距離は 12 マイルになります。 一方で、特定の分析距離を正当化することが非常に困難な場合もあります。 この場合は、[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールが役立ちます。
地形上に空間クラスタリングが見られる場合は、内在する空間プロセスがアクティブであることを示します。 これらの基になるプロセスが実行される空間的なスケールに関してある程度理解しておくと、適切な分析距離を選択する際に役立ちます。 [インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールにより、距離を徐々に増やして [空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツールを実行し、各距離の空間クラスター化の強度を計測します。 クラスタリングの強度は、返される Z スコアによって決定されます。 通常、距離が増えると Z スコアも増え、クラスタリングの強度が増していることを示します。 ただし、通常、ある特定の距離で Z スコアはピークになります。 ピークが複数存在する場合もあります。
ピークは、クラスタリングを促進する空間プロセスが最も顕著である距離を表します。 グラフ上の各ポイントの色は、Z スコア値の統計的な有意性に対応しています。
適切な分析のスケールを特定する方法の 1 つは、問題のスケールを最適に表す統計的に有意なピークに関連付けられている距離を選択することです。 多くの場合、これは、最初の統計的に有意なピークです。
開始距離と距離の増分の値を決定
すべての距離の計測値は、フィーチャの重心に基づいています。[開始距離] パラメーターのデフォルト値は、各フィーチャが少なくとも 1 つの近隣フィーチャを持つようにする最小距離です。 データセットに地理的な外れ値が含まれている場合を除いて、通常、これが適切な選択肢になります。 地理的な外れ値があるかどうかを確認した後、外れ値のフィーチャを除くすべてのフィーチャを選択し、選択したフィーチャに対してのみ [インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] を実行します。 選択した一連のフィーチャのピーク距離を検出したら、その距離を使用して、すべてのフィーチャ (外れ値も含む) に基づいて空間加重マトリックス ファイルを作成します。 [空間加重マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを実行して空間加重マトリックス ファイルを作成する場合、[近傍数] パラメーターには、すべてのフィーチャができるだけ多くの近隣フィーチャを持てるような値を設定します。
[距離の増分] パラメーターのデフォルト値は、各フィーチャから最近隣フィーチャまでの平均距離です。 上記の方法を使用して適切な開始距離を決定しても、ピーク距離が表示されない場合は、増分距離を短くしたり長くしたりすることを試してみてください。
ピーク距離なし
[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールを使用すると、距離が長くなるにつれて Z スコアが上昇し続ける (つまり、ピークがない) グラフになる場合があります。 これは、データが集約された際に、[入力フィールド] 変数に影響を与えるプロセスのスケールが集約方式よりも小さい場合に発生することがよくあります。 [距離の増分] の値を小さくして、ピークがもっと細かくキャプチャされるかどうかを確認することができます。 ただし、それぞれが異なる距離で実行される複数の空間プロセスが分析範囲内に存在するため、ピークがない場合もあります。 これは多くの場合、ノイズの多い大規模ポイント データセットで発生します (分析しているポイント データ値に対するクリアでない空間パターン)。 この場合は、他の基準を使用して分析のスケールを正当化する必要があります。
結果の解釈
[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールを実行すると、各距離の Z スコアの結果がメッセージとして書き込まれます。 このメッセージにアクセスするには、[ジオプロセシング] ウィンドウで、進行状況バーにポインターを合わせるか、ポップアップ ボタンをクリックするか、メッセージ セクションを展開します。 ジオプロセシング履歴から、以前に実行したツールのメッセージにアクセスすることもできます。 オプションの [出力テーブル] パラメーターにパスを指定すると、[距離]、[Morans I]、[Expected I]、[分散]、[Z スコア]、および [p 値] のフィールドを持つテーブルが作成されます。
距離による空間的自己相関ライン チャートとメッセージとして書き込まれた Z スコア値を調査して、ピーク距離の有無を確認できます。 次の画像では、8100 フィートと 11500 フィートの距離に関連付けられた 2 つのピーク Z スコアがチャートに示されています。
[出力テーブル] パラメーターを使用して自己相関値のテーブルを作成すると、そのテーブルに距離による空間的自己相関ライン チャートが含まれます。 このチャートは、メッセージに表示されるチャートと同じです。
参考資料
詳細については、次のリソースをご参照ください。
- ホット スポット分析を実行するためのベスト プラクティスを説明したビデオ:
- 空間パターン分析チュートリアルは、[インクリメンタル空間的自己相関 (Incremental Spatial Autocorrelation)] ツールを使用したデング熱データの分析を説明しています。
- 「空間リレーションシップのモデリング」の「固定距離バンドの選択」をご参照ください。
- 「ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*)) の詳細」には、適切な分析のスケールを特定する方法が記載されています。
- 利用可能な空間統計リソースの最新リストについては、空間統計リソース ページにアクセスしてください。