ここでは、ツールのパラメーターに関する追加情報を提供し、[空間統計] のツールを使用してデータを分析するときに重要な基本的な用語および概念を紹介します。 ツールのパラメーターの詳細については、このトピックをご参照ください。
注意:
- [空間統計] ツールボックスのツールは、XY イベント レイヤーでは直接使用できません。 分析を実行する前に、[フィーチャのコピー (Copy Features)] ツールを使用して XY イベント データをフィーチャクラスに変換してください。
- シェープファイルを使用するときは、NULL 値を格納できないため、注意が必要です。 シェープファイル以外の入力からシェープファイルを作成するツールまたはその他の方法では、NULL 値がゼロとして格納または解釈される場合があります。 場合によっては、NULL 値はシェープファイルに非常に大きな負の値として格納されます。 この場合、予期せぬ結果に至ることがあります。 詳細については、「ジオプロセシングでのシェープファイル出力の注意事項」をご参照ください。
空間リレーションシップのコンセプト
空間統計と従来の (非空間的な) 統計の重要な違いは、空間統計では空間と空間リレーションシップが直接その算術演算に統合されることです。 したがって、[空間統計] ツールボックスのツールの多くで、分析を実行する前に [空間リレーションシップのコンセプト] パラメーターの値を選択する必要があります。 一般的なコンセプトには、逆距離、走行時間、固定距離、K 近傍、近接性などがあります。 使用する空間リレーションシップのコンセプトは、計測する内容によって決定されます。 たとえば、ある特定の種子植物の群生状態を計測する場合は、逆距離が最も適切です。 しかし、地域の通勤客の地理的分布を評価する場合は、通勤時間または通勤費用を選択するほうが、空間リレーションシップをよりよく説明できます。 分析によっては、空間と時間が、親近度 (あるものをよく知っていれば知っているほど、それは機能的により近くにある) や空間相互作用 (たとえば、東京都と大阪市の間の電話通話数が大阪市と京都市の間の電話通話数よりも多い場合、東京都と大阪市は機能的により近くにある) などのより抽象的なコンセプトよりも重要ではない場合があります。
空間的に制限された多変量クラスター分析 ツールは、[空間的制限] というパラメーターを含んでおり、パラメーター オプションは [空間リレーションシップのコンセプト] パラメーターで説明されているものと同様ですが、使用方法が異なります。 空間的制限を適用すると、少なくとも 1 つの近隣 (隣接、最近隣リレーション、または三角形分割法により定義) を共有しているフィーチャのみが同じグループに属することができます。 その他の詳細および例については、「空間的に制限された多変量クラスター分析 (Spatially Constrained Multivariate Clustering) ツールの詳細」をご参照ください。
[空間リレーションシップのコンセプト] パラメーターのオプションについては、後で説明します。 選択するオプションによって、隣接フィーチャのコンテキスト内の各フィーチャを評価するツールの隣接リレーションシップが決定されます。 これらのツールには、[空間的自己相関分析 (Spatial Autocorrelation (Global Moran's I))] ツール、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツール、および [クラスター/外れ値分析 (Cluster and Outlier Analysis (Anselin Local Moran's I))] ツールがあります。 これらのオプションの一部は、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用する場合にのみ使用できることに注意してください。
逆距離、距離の逆二乗 (インピーダンス)
逆距離のオプションを使用する場合、その空間リレーションシップの概念モデルは、インピーダンスの 1 つ (距離減衰) です。 すべてのフィーチャがその他のすべてのフィーチャに影響をおよぼしますが、距離が遠ければ遠いほど、影響は小さくなります。 一般的に、逆距離のコンセプトを使用して必要な計算の数を減らすには (特に大規模なデータセットの場合)、[距離バンドまたは距離の閾値] パラメーター値を指定します。 距離バンドまたは距離の閾値が指定されていなければ、デフォルトの閾値が自動的に計算されます。 [距離バンドまたは距離の閾値] パラメーター値を 0 に設定することで、強制的にすべてのフィーチャをその他のすべてのフィーチャの隣接フィーチャにすることができます。
[逆ユークリッド] 距離は、気温の変化などの連続的なデータをモデリングするために適切です。 [逆マンハッタン] 距離は、道路網データが使用できないときなど、ホームセンターなどの固定されている都市施設のロケーションが分析で使用される場合に最適です。 距離の逆二乗オプションを使用する場合の概念モデルは、逆距離を使用する場合と同じですが、距離の逆二乗オプションを使用する場合は、傾斜がより急であるため、隣接フィーチャの影響がより急激に低下し、ターゲット フィーチャに最も近い隣接フィーチャのみがそのフィーチャの計算に多大な影響をおよぼします。
距離バンド (影響圏)
[ホット スポット分析 (Hot Spot Analysis)] ツールなどの一部のツールでは、固定距離バンドはデフォルトの [空間リレーションシップのコンセプト] パラメーター値です。 [固定距離バンド] オプションを使用して、「影響圏」 (データに対する空間相互作用の変動ウィンドウ形式の概念モデル) を適用します。 各フィーチャは、[距離バンドまたは距離の閾値] パラメーターで指定した距離内にある隣接フィーチャのコンテキスト内で分析されます。 指定した距離内の隣接フィーチャは、均等に重み付けされます。 指定した距離外のフィーチャは、計算に影響をおよぼしません (その重みは 0 です)。 [固定距離バンド] オプションは、特定の (固定された) 空間尺度のデータの統計的なプロパティを評価するときに使用します。 たとえば、通勤パターンを調査しているときに、職場までの平均移動距離が 15 km であることが判明している場合は、15 km の固定距離を分析に使用します。 分析に適切な尺度距離を特定するために役立つガイドラインについては、「固定距離バンドの値を選択するためのベスト プラクティス」をご参照ください。
無関心領域
[空間リレーションシップのコンセプト] パラメーターの [無関心領域] オプションは、[固定距離バンド] モデルと [逆距離] オプションを組み合わせたものです。 距離バンド内または距離の閾値内のフィーチャは、ターゲット フィーチャの分析に含まれます。 臨界距離を超えると、影響のレベル (重み付け) が急激に低下します。 就職先を探しているときに、5 km 先の会社と 6 km 先の会社のどちらかを選ぶとします。 この場合、通勤距離を重視して会社を選ぶことはないでしょう。 ここで、5 km 先の会社と 20 km 先の会社のどちらかを選ぶとします。 この場合、通勤距離は一種のインピーダンスとなり、会社を選ぶうえで考慮する必要があるでしょう。 このオプションは、分析の尺度を固定したままにすると同時に、ターゲット フィーチャの計算に含まれる隣接フィーチャに明確な境界を適用したくない場合に使用します。
ポリゴン隣接 (一次)
ポリゴン フィーチャクラスの場合は、[隣接エッジのみ] (Rook's Case とも呼ばれます) オプション、または [隣接エッジ コーナー] (Queen's Case とも呼ばれます) オプションを選択できます。 [隣接エッジのみ] オプションの場合、エッジを共有する (一致する境界線を持つ) ポリゴンは、ターゲット ポリゴンの計算に含まれます。 エッジを共有しないポリゴンは、ターゲット フィーチャの計算から除外されます。 [隣接エッジ コーナー] オプションの場合、エッジとコーナーまたはそのいずれかを共有するポリゴンは、ターゲット ポリゴンの計算に含まれます。 2 つのポリゴンのいずれかの部分が重なっている場合、これらは近接と見なされ、互いの計算に含まれます。 ある種の伝播プロセスをモデリングする場合、またはポリゴンとして表される連続的なデータを処理する場合に、ポリゴン フィーチャでこれらの隣接コンセプトのいずれかを使用します。
K 近傍
各フィーチャがそれに最も近い指定された定数の隣接フィーチャの空間的な関連性内で評価されるようにするために、隣接リレーションシップが構成されることもあります。 K (隣接フィーチャの数) が 8 であれば、ターゲット フィーチャに最も近い 8 つの隣接フィーチャがそのフィーチャの計算に含められます。 フィーチャ密度が高いロケーションでは、分析の空間的な関連性は小さくなります。 フィーチャ密度が低いロケーションでは、分析の空間的な関連性は大きくなります。 この空間リレーションシップのモデルの利点は、フィーチャ密度がスタディ エリア全体でロケーションによって大幅に異なる場合でも、すべてのターゲット フィーチャに必ずいくつかの隣接フィーチャが存在するようになることです。 このオプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用する場合に使用することができます。 [近傍数] パラメーターが [8] の [K 近傍] オプションは回帰残差を評価するために予備回帰分析で使用されるデフォルトのコンセプトです。
ドローネ三角形分割 (Natural Neighbors)
[ドローネ三角形分割] オプションは、ポイント フィーチャまたはフィーチャの重心から各ポイントまたは重心が三角形ノードになるようにボロノイ三角形を作成することで、隣接フィーチャを構成します。 三角形のエッジで接続されているノードは、隣接フィーチャと見なされます。 [ドローネ三角形分割] を使用すると、データにアイランドや大幅に異なるフィーチャ密度が含まれていても、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在することが確保されます。 一致するフィーチャがあるときは、[ドローネ三角形分割] オプションを使用しないでください。 このオプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用する場合に使用することができます。
時空間ウィンドウ
このオプションを使用して、空間 (固定距離) と時間 (固定時間間隔) の両方についてフィーチャの関係を定義します。 このオプションは、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して空間ウェイト マトリックス ファイルを作成するときに使用できます。 [時空間ウィンドウ] オプションを選択した場合、[日付/時間フィールド]、[日付/時間の間隔タイプ] (例: 時間、日、月)、および [日付/時間の間隔値] パラメーター値も指定する必要があります。 間隔値は整数です。 間隔のタイプに [時間] オプションを選択し、間隔値に [3] を選択すると、2 つのフィーチャの日付/時間フィールドの値が互いに 3 時間以内である場合、これらのフィーチャは近接と見なされます。 このコンセプトの場合、フィーチャが指定された距離内にあり、かつターゲット フィーチャの指定された時間内に収まっている場合、これらのフィーチャは近接フィーチャです。 可能性のある 1 つの例を挙げると、時空間ホット スポットを特定するために、[ホット スポット分析 (Hot Spot Analysis)] で使用する空間ウェイト マトリックス ファイルを作成したい場合は、[空間リレーションシップのコンセプト] パラメーターから [時空間ウィンドウ] を選択します。 結果を表示する方法などの詳細については、「時空間分析」をご参照ください。 その他の機会は、3D の netCDF 時空間キューブで可視化するときに使用できます。
空間加重をファイルから取得 (ユーザー定義の空間リレーションシップ)
[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して、フィーチャの近接関係を格納するファイルを作成できます。 フィーチャの空間リレーションシップがテーブルで定義されている場合は、空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix) ツールを使用して、そのテーブルを空間ウェイト マトリックス (.swm) ファイルに変換できます。 SWM ファイルを使用するために [変換テーブル] オプションを使用するには、テーブルに特定のフィールドを含める必要があります。 独自の空間リレーションシップのカスタム コンセプトを定義する (たとえば、空間相互作用に基づいて)書式設定された ASCII テキスト ファイルへのパスを指定することもできます。
空間リレーションシップのコンセプトの選択におけるベスト プラクティス
フィーチャの空間相互作用をより現実的にモデリングできればできるほど、結果はより正確になります。 [空間リレーションシップのコンセプト] パラメーターの選択には、解析対象のフィーチャ間の固有のリレーションシップが反映されている必要があります。 データの特性に考慮して選択する必要がある場合もあります。
たとえば、逆距離を使用する方法 ([逆距離] および [距離の逆二乗] オプション) は、連続的なデータを使用する場合や、2 つのフィーチャが空間内で近ければ近いほど相互に作用する確率が高くなるプロセスをモデリングする場合に最適です。 この空間リレーションシップのコンセプトを使用する場合、すべてのフィーチャがその他のすべてのフィーチャの隣接フィーチャとなる可能性があり、大規模なデータセットを使用する場合、実行される計算の数は膨大になります。 逆距離のコンセプトを使用する場合は、常に [距離バンドまたは距離の閾値] の値を含めるようにしてください。 これは、大規模なデータセットを使用する場合は特に重要です。 [距離バンドまたは距離の閾値] パラメーターを空白のままにした場合、閾値距離が計算されますが、この距離は分析に最適な距離ではない可能性があります。 デフォルトの距離閾値は最短距離であるため、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在するようになります。
この [固定距離バンド] 方法は、ポイント データで適切に機能します。 これは、[ホット スポット分析 (Hot Spot Analysis (Getis-Ord Gi*))] ツールで使用されるデフォルトのオプションです。 多くの場合、これは、大幅にサイズが異なるポリゴンが存在する (たとえば、スタディ エリアの周縁部ではポリゴンが非常に大きく、スタディ エリアの中央ではポリゴンが非常に小さいなど) 場合や、一貫した尺度の分析を確保したい場合のポリゴン データに適したオプションです。 分析に適切な距離バンド値を決定するために役立つガイドラインについては、「固定距離バンドの値を選択するためのベスト プラクティス」をご参照ください。
[無関心圏 (Zone of Indifference)] コンセプトを使用する方法は、固定距離を使用することが適切であっても、近傍リレーションシップに明確な境界が設定されるとデータが正確に表現されない場合に適しています。 無関心領域の概念モデルは、すべてのフィーチャをその他のすべてのフィーチャの隣接フィーチャと見なすことに注意してください。 このため、このオプションは大規模なデータセットには適切ではありません。[距離バンドまたは距離の閾値] に指定された値は、隣接フィーチャの数を制限せず、空間リレーションシップの濃度の減衰が始まる場所を指定するのみです。
ポリゴン隣接のコンセプト ([隣接エッジのみ] および [隣接エッジ コーナー] オプション) は、ポリゴンのサイズと分布が似ており、空間リレーションシップがポリゴンの近接の関数である (2 つのポリゴンが境界を共有する場合、その空間相互作用が増加する) 場合に効果的です。 ポリゴン隣接のコンセプトを選択する場合、一般的に、[行の標準化] パラメーターを持つツールの行の標準化を選択する必要があります。
[K 最近隣内挿 (K Nearest Neighbors)] オプションは、分析に最小数の隣接フィーチャが必要である場合に効果的です。 特に、フィーチャに関連付けられている値が歪んでいる (正規分布していない) 場合は、各フィーチャが少なくとも 8 つの隣接フィーチャのコンテキスト内で評価されることが重要です (これは一般的な方法です)。 データの分布がスタディ エリア全体で大幅に異なるため、一部のフィーチャがその他のすべてのフィーチャから遠くに離れている場合に、この方法は最適です。 ただし、分析の空間コンテキストは、フィーチャの分散度または密度の値変動に応じて変化することに注意してください。 K 最近隣内挿は、分析の尺度を固定することが隣接フィーチャの数を固定することよりも重要ではない場合に適しています。
[ドローネ三角形分割 (Delaunay Triangulation)] オプションは、一部の分析では、一連のフィーチャの Natural Neighbors を指定する方法として使用されます。 この方法は、データにアイランド ポリゴン (他のポリゴンと境界を共有しない分離したポリゴン) が含まれる場合、またはフィーチャの空間分布が非常に不均一である場合に適しています。 ただし、一致しているフィーチャがある場合には適切ではありません。 K 最近隣内挿法と同様、ドロネー三角形分割はすべてのフィーチャに 1 つ以上の近傍が存在することを保証しますが、データ自体の分布を使用して各フィーチャで取得する近傍を決定します。
[時空間ウィンドウ] オプションを使用すると、空間的近接と時間的近接の両方についてフィーチャ リレーションシップを定義できます。 時空間ホット スポットを特定したい場合、または空間および時間の近接性によりメンバーシップを低減したグループを構築したい場合はこのオプションを使用します。 時空間分析、およびこの種の分析により得られた結果の効果的なレンダリング方法の例については、「時空間分析」をご参照ください。
空間相互作用を移動時間または移動距離の観点からモデリングすると最も効果的である場合があります。 たとえば、都市サービスへのアクセス性をモデリングしたり、都市犯罪のホット スポットを見つけたりするには、ネットワークの観点から空間リレーションシップをモデリングすると効果的です。 [ネットワーク空間ウェイトの生成 (Generate Network Spatial Weights)] ツールを使用して、解析前に空間ウェイト マトリックス ファイル (.swm) を作成します。 [空間リレーションシップのコンセプト] 値に適した GET_SPATIAL_WEIGHTS_FROM_FILE を選択し、[ウェイト マトリックス ファイル] のパラメーターには、作成した SWM ファイルのフル パスを入力します。
ヒント:
多くの組織は、独自の道路ネットワーク データセットを保持していて、すでにアクセスできる場合があります。 また、StreetMap Premium for ArcGIS には、北米、中南米、ヨーロッパ、中東アフリカ、日本、オーストラリア、ニュージーランドをカバーする、SDC 形式であらかじめ作成されたネットワーク データセットが含まれています。 このツールでは、これらのネットワーク データセットを直接使用できます。
[空間リレーションシップのコンセプト] パラメーターのどのオプションも分析に適切ではない場合は、フィーチャ間のリレーションシップを定義する ASCII テキスト ファイルまたはテーブルを作成し、これらのファイルを使用して空間ウェイト マトリックス ファイルを作成することができます。 いずれかのオプションが目的に近いが完全ではない場合は、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して基本的な SWM ファイルを作成し、空間ウェイト マトリックス ファイルを編集します。
距離計算の方法
[空間統計] ツールボックスの多くのツールが、その計算に「距離」を使用します。 これらのツールでは、ユークリッド距離またはマンハッタン距離のいずれかを選択することができます。
- ユークリッド距離は、次のように算出されます。
D = sq root [(x1–x2)**2.0 + (y1–y2)**2.0]
ここで、(x1, y1) はポイント A の座標、(x2, y2) はポイント B の座標であり、D はポイント A とポイント B の間の直線距離です。
- マンハッタン距離は、次のように算出されます。
D = abs(x1–x2) + abs(y1–y2)
ここで、(x1, y1) はポイント A の座標、(x2, y2) はポイント B の座標であり、D はポイント A とポイント B の垂直距離および水平距離の和です。 これは、東西方向および南北方向の移動のみに制限されている場合に、移動する必要がある距離です。 この方法は、一般的に、移動が道路網に制限されており、実際の道路網の移動コストがわからない場合は、ユークリッド距離よりも適切です。
入力フィーチャが投影されない場合 (つまり、座標が度、分、および秒で与えられる場合) や出力座標系が地理座標系に設定された場合、または地理座標系の空間参照を持つフィーチャ データセットへの出力フィーチャクラスのパスを指定した場合、弦の測定値を使用して距離が計算され、[距離計算の方法] パラメーターが無効になります。 弦距離の測定値が使用されるのは、少なくとも互いに約 30° の範囲内のポイントに対して、すばやく算出され、実際の測地距離に非常に近い推定値が得られるという理由からです。 弦距離は、地球の真の扁平楕円体形状ではなく、球体に基づいて計算されます。 地球の表面上の 2 点が与えられた場合、2 点間の弦の距離は、3 次元の地球内部を通過して 2 点を接続するラインの長さになります。 弦距離は、メートル単位でレポートされます。
注意:
分析範囲が 30°を越えて広がる場合、必ずデータを投影してください。 30°を超える場合、弦距離は測地距離の良好な推定値にはなりません。
セルフ ポテンシャル (間帯重みを付けるフィールド)
[空間統計] ツールボックスの一部のツールでは、セルフ ポテンシャルに使用する重みを表すフィールドを指定できます。 セルフ ポテンシャルは、フィーチャとそれ自身の間の距離またはウェイトです。 この重みは、通常は 0 ですが、必要に応じて別の固定値またはフィーチャごとに異なる値を指定します。 たとえば、空間リレーションシップのコンセプトが国勢調査区域内または国勢調査区域間で移動する距離に基づいている場合は、以下のようにポリゴンのサイズに基づいて平均間帯移動コストを反映するようにセルフ ポテンシャルをモデリングします。
dii = 0.5*[(Ai / π)**0.5]
ここで、dii はポリゴン フィーチャ i の間帯移動に関連付けられている移動コストであり、Ai はポリゴン フィーチャ i に関連付けられているエリアです。
標準化
行の標準化が推奨されるのは、サンプリングの設計や指定された集約方式によってフィーチャの分布が偏る可能性があるときです。 [行の標準化] が選択されていると、それぞれの重みがその行の合計 (すべての隣接フィーチャの重みの合計) で分割されます。 行の標準化による重み付けは、固定距離の近傍でよく使用され、ポリゴン隣接に基づく近傍にはほぼ常に使用されます。 これは、フィーチャに異なる数の隣接フィーチャがあるために生じるバイアスを抑止するために行われます。 [行の標準化] は、すべての重みを 0 と 1 の間になるようにスケーリングして、絶対的ではなく相対的な重み付けスキーマを作成します。 管理区画を表すポリゴン フィーチャを操作する場合は常に、行の標準化オプションを選択できます。
以下に例を示します。
- すべての犯罪事件に関する情報があるとします。 調査区域のいくつかの部分には、犯罪が多発するために多数のポイントがあります。 他の部分には、犯罪があまり発生しないためにわずかなポイントしかありません。 ポイントの密度は、理解したい内容 (犯罪空間パターン) を非常によく反映しています (表現しています)。 たぶん、空間ウェイトの行の標準化は必要ないでしょう。
- 土壌サンプルを採取したとします。 何らかの理由 (天候がよかったか、フェンスに登ったり、沼地を泳いだり、山の頂上に登る必要がなかったなど) により、調査区域の一部の部分で多数のサンプルを採取し、他の区域ではあまり採取しませんでした。 つまり、ポイントの密度は慎重に計画されたランダム サンプルの忠実な結果ではありません。ユーザー独自の偏りがいくらか導入された可能性があります。 さらに、多くのポイントがある場所は分析しているデータの基盤の空間分布を必ずしも反映していません。 サンプリング プロセス中に導入された可能性がある偏りを最小化するために、空間ウェイトの行の標準化を行います。 行の標準化を行うときは、あるフィーチャが 2 個の近傍を持ち、別のフィーチャが 18 個の近傍を持っていても結果に大きな影響を及ぼしません。すべてのウェイトの合計は 1 になります。
- データを集約するときはいつでも、そのデータに構造を適用しています。 分析しているデータおよび質問の内容をその構造が適切に反映することはまれです。 たとえば、国勢調査ポリゴン (国勢統計区など) は人口に基づいて設計されており、分析に人口関連の質問が関係している場合でも、これらのポリゴンは可能な多数の描画方法のうちの 1 つを採用した結果にすぎないため、ウェイトの行の標準化を実行するのが適切です。 ポリゴン データの場合、ほぼ必ず空間ウェイトの行の標準化が必要になります。
距離バンドまたは距離の閾値
[距離バンドまたは距離の閾値] パラメーターでは、ほとんどの空間リレーションシップのコンセプト (たとえば、[逆距離]、[固定距離バンド] オプションなど) の分析の尺度を設定できます。 これは、カットオフ距離を表す正の数値です。 ターゲット フィーチャに対して指定したカットオフ外のフィーチャは、そのフィーチャの分析において無視されます。 ただし、[無関心領域] オプションを使用する場合、指定した距離外のフィーチャの影響は近接度に比例して弱くなりますが、距離の閾値内のフィーチャは同等に考慮されます。
適切な距離を選択することは重要です。 一部の空間統計では、分析を信頼できるものにするために、各フィーチャに少なくとも 1 つの隣接フィーチャが必要です。 [距離バンドまたは距離の閾値] パラメーターに設定した値が小さすぎると (一部のフィーチャに隣接フィーチャが存在しなくなる)、距離をより大きい値に設定して再試行することを提案する警告メッセージが表示されます。 [近接フィーチャへの距離を計算 (Calculate Distance Band from Neighbor Count)] ツールは、指定した数の隣接フィーチャへの最短、平均、および最長距離を評価します。これに基づいて、分析に使用する適切な距離バンドの値を決定できます。 詳細については、「固定距離バンドの値を選択するためのベスト プラクティス」をご参照ください。
この値を指定しなければ、デフォルトの距離の閾値が計算されます。 次の表は、3 つの使用可能な入力タイプごとに、[空間リレーションシップのコンセプト] の動作が指定する値によってどのように異なるかを示しています (負の値は無効です)。
逆距離、距離の逆二乗 | 固定距離バンド、無関心領域 | ポリゴン隣接、ドローネ三角形分割、K 近傍 | |
---|---|---|---|
0 | 閾値またはカットオフは適用されず、すべてのフィーチャがその他のすべてのフィーチャの隣接フィーチャになります。 | 無効です。 実行時エラーが生成されます。 | 無視されます。 |
空白 | デフォルトの距離が計算されます。 このデフォルトの距離は最短距離であるため、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在するようになります。 | デフォルトの距離が計算されます。 このデフォルトの距離は最短距離であるため、すべてのフィーチャに少なくとも 1 つの隣接フィーチャが存在するようになります。 | 無視されます。 |
正の値 | 指定された 0 より大きい正の値がカットオフ距離として使用され、隣接リレーションシップはこの距離内のフィーチャ間にのみ存在するようになります。 | 固定距離バンドを使用する場合、この指定されたカットオフ内のフィーチャのみが相互に隣接フィーチャになります。 [無関心領域] を使用する場合、この指定されたカットオフ内のフィーチャは相互に隣接フィーチャになり、カットオフ外のフィーチャも隣接フィーチャになりますが、これらには、距離が長くなるにつれ、より小さい重み (影響) が割り当てられます。 | 無視されます。 |
近傍数
各ターゲット フィーチャの分析に含める隣接フィーチャの数を表すには、正の整数を指定します。 [空間リレーションシップのコンセプト] パラメーターに選択した値が [K 近傍] であれば、各ターゲット フィーチャは最も近い K 個のフィーチャ (「K」は指定した隣接フィーチャの数) のコンテキスト内で評価されます。 [逆距離] または [固定距離バンド] オプションを使用する場合、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを実行するときに [近傍数] パラメーターの値を指定することで、各フィーチャに少なくとも K 個の隣接フィーチャが存在することが確保されます。 ポリゴン隣接の方法の場合、少なくとも [近傍数] パラメーター値が含まれていないフィーチャは、フィーチャの重心への近さに基づいて隣接フィーチャが追加されます。
ウェイト マトリックス ファイル
いくつかのツールでは、空間ウェイト マトリックス ファイルへのパスを指定することで、空間フィーチャ間の空間リレーションシップを定義できます。 空間ウェイトとは、データセットの各フィーチャとその他のすべてのフィーチャの間にある距離、時間、またはその他のコストを反映する数字です。 [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して空間ウェイト マトリックス ファイルを作成することも、単純な ASCII ファイルを使用することもできます。
空間ウェイト マトリックス ファイルが単純な ASCII テキスト ファイルである場合、最初の行は一意な ID フィールドの名前である必要があります。 これにより、このファイルを生成するときに、データセット内の任意の数値フィールドを ID として使用できます。ただし、この ID フィールドは、整数タイプ (Long または Short) である必要があり、すべてのフィーチャに対して一意な値である必要があります。 空間ウェイト ファイルの最初の行の後に続く内容は、3 つの列で構成される必要があります。
- ターゲット フィーチャ ID
- 隣接フィーチャ ID
- 加重
たとえば、3 軒のガソリンスタンドを所有しているとします。 ID フィールドとして使用するフィールドを StationID とし、フィーチャ ID を 1、2、および 3 として、 これらの 3 軒のガソリンスタンドの空間リレーションシップを分単位の移動時間を使用してモデリングするとします。 この場合、次のような ASCII ファイルを作成できます。
一般的に、重みが距離または時間を表す場合、より近いフィーチャに、より遠いフィーチャよりも大きい重みが割り当てられるように重みが転化されます (たとえば、距離が 10 km または 10 分であれば 1/10)。 上記の重みから、ガソリンスタンド 1 はガソリンスタンド 2 から 10 分の距離にあることがわかり、 この例では、移動時間は対称的ではないこともわかります (ガソリンスタンド 1 からガソリンスタンド 3 までの移動時間は 7 分ですが、ガソリンスタンド 3 からガソリンスタンド 1 までの移動時間は 6 分です)。 ガソリンスタンド 1 とそれ自身の間の重みは 0 であり、ガソリンスタンド 2 とそれ自身の間についてはエントリがありません。 エントリがなければ、重みは 0 であると想定されます。
空間ウェイト マトリックス ファイルの値を入力することは、データセットが小規模であっても、面倒な作業です。 [空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用するか、このタスクを自動的に実行する Python スクリプトを記述するほうが効率的な方法です。
空間ウェイト マトリックス ファイル (.swm)
[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールは、指定されたパラメーターに基づいてデータセット内のすべてのフィーチャの空間リレーションシップを定義するバイナリ形式の空間ウェイト マトリックス ファイル (.swm) を作成します。 このファイルはバイナリ ファイル形式で作成されるため、ファイル内の各値を直接表示することはできません。 SWM ファイルのフィーチャ リレーションシップを表示または編集するには、[空間ウェイト マトリックス → テーブル (Convert Spatial Weights Matrix to Table)] ツールを使用します。
フィーチャ間の空間リレーションシップをテーブルに保存したら、[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールを使用して、そのテーブルを .swm ファイルに変換できます。 このテーブルには、以下のフィールドが必要です。
フィールド名 | 説明 |
---|---|
<一意な ID フィールド名> | フィーチャごとに一意な ID がある入力フィーチャクラス内の整数フィールド。 これがターゲット フィーチャ ID です。 |
NID | 隣接フィーチャの ID を含んでいる整数フィールド。 これが隣接フィーチャ ID です。 |
WEIGHT | 対象フィーチャと隣接フィーチャの空間リレーションシップを数量化する数値の重み。 値が大きければ大きいほど、2 つのフィーチャ間の重みも大きくなり、相互作用も強くなります。 |
空間ウェイト マトリックス ファイルの共有
[空間ウェイト マトリックスの生成 (Generate Spatial Weights Matrix)] ツールの出力は、SWM ファイルです。 このファイルは、入力フィーチャクラス、一意の ID フィールド、および SWM ファイルが作成されたときの [出力データの座標系] の設定と関連付けられます。 他のユーザーは、作成された SWM ファイル、同じ入力フィーチャクラス、または一致する Unique ID フィールドにフィーチャ群のすべてまたは一部を関連付けているフィーチャクラスを使用して、分析用に定義された空間リレーションシップを複製できます。 特に、SWM ファイルを他のユーザーと共有する場合、出力データの座標系が入力フィーチャクラスに関連付けられている空間参照と異なる状況は回避するようにしてください。 入力フィーチャクラスを投影してから、SWM ファイルを作成する前に [出力データの座標系] を [入力フィーチャクラスに一致] に設定するほうが、複製よりも効果的な方法です。