ビッグ データ解析で使用できます。
[ホット スポット分析] ツール は、Getis-Ord Gi* 統計情報を使用して、データの空間パターンにおいて、統計的に有意なホット スポットおよびコールド スポットを識別します。
ワークフロー図
例
以下は、ホット スポット分析ツールの使用例です。
- ある警察は、凶悪犯罪と失業率の間に何らかの関係性があるかを判断する解析を実施しています。 凶悪犯罪の件数が多く、失業率が高い地域にある高校で夏季雇用プログラムの拡充を実施する予定です。 [ホット スポット分析] ツールを使用すると、統計的に有意な犯罪と失業のホットスポットがある地域を検索できます。
- ある自然保護担当官は、森林への保護対策が必要な地域に優先順位を設定したり、耐性のある地域を詳しく知るために、樹木の病害を調査しています。 [ホット スポット分析] ツールを使用すると、病害のある樹木 (ホット スポット) と健康な樹木 (コールド スポット) のクラスターを特定できます。
使用上の注意
ホット スポット分析ツールを操作する際には、以下の点に注意してください。
- 入力フィーチャはポイント レイヤーでなければなりません。 ポイントは、解析前に、指定したサイズの正方形グリッド (ビン) に集約されます。
- 出力レイヤーには、各フィーチャの統計的有意性、p 値、Z スコアなどの情報を含む追加フィールドがあります。
- 解析時に、入力ポイントが、指定されたサイズのビンに集約されます。 その後、ホット スポットを決定するために解析されます。 集約されるビンには、さまざまな値が含まれている必要があります (ビン内のポイントの数は高度に可変である必要があります)。
- Z スコアと p 値は統計的有意性の尺度で、観察された高い値または低い値の空間クラスタリングが、ランダム分布で同じ値に期待されるものより顕著かどうかを示します。 これにより、集約されるビンを使用した帰無仮説を受け入れるか棄却するかを判断できます。 Z スコアおよび p 値のフィールドは、どの種類の FDR (False Discovery Rate) 補正も反映しません。
- フィーチャの Z スコアが高く p 値が小さいことは、ポイント インシデントが集中して存在していることを示します。 Z スコアが負の低い値で p 値が小さいことは、ポイント インシデントが存在しないことを示します。 Z スコアが高く (または低く) なるほど、クラスタリングの程度は高くなります。 Z スコアがゼロに近いことは、明白な空間クラスタリングがないことを示します。
- Z スコアは、無作為化帰無仮説計算に基づいています。 スコアの詳細については、「Z スコアと p 値とは」をご参照ください。
- [ホット スポット分析] では、時間ステップを使用して解析することができます。 各時間ステップは、時間ステップ外のフィーチャとは切り離して解析されます。 時間ステップを使用するには、入力データを時間対応にし、任意の時点を時間で表す必要があります。 時間ステップを適用すると、出力フィーチャは StartTime および EndTime フィールドで表した時間間隔になります。
- [時間ステップの基準] パラメーターには、日時の値または日付のみの値を指定できますが、時間のみの値を指定することはできません。
パラメーター
以下は、ホット スポット分析ツールのパラメーターです。
パラメーター | 説明 | データ タイプ |
---|---|---|
入力レイヤー | ホット スポットが計算されるポイント フィーチャ。 | フィーチャ |
ビン タイプ | 規則的なビンを作成するために使用されるビンの形状。 デフォルトは [四角] です。 | String |
ビン サイズ | 入力ポイントが解析されるビン サイズを表す距離間隔。 | String |
近傍サイズ (オプション) | 分析対象の近傍の空間範囲。 この値は、ローカル クラスタリングを評価する場合に一緒に分析されるフィーチャを決定します。 | String |
時間ステップの間隔 (オプション) | 時間ステップの間隔。 このパラメーターは、入力ポイントのスキーマが [Start Time] キー フィールドでタグ付けされたフィールドを含んでいる場合にのみ使用されます。 | String |
時間ステップの配列 (オプション) | 時間ステップの調整方法を指定します。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。
| String |
時間ステップの基準 (オプション) | 時間ステップおよび時間間隔を揃えるために使用する基準時間。 このパラメーターは、[時間ステップの配列] パラメーターで [基準時間] を選択した場合にのみ表示されます。 | Date |
出力レイヤー
出力レイヤーは、元のフィールドの代わりに次のフィールドを含みます。
フィールド名 | 説明 | フィールド タイプ |
---|---|---|
値 | このビン内のフィーチャの数。 | Float64 |
GiZScore | このビン内のフィーチャの Z スコア。 | Float64 |
GiPValue | このビン内のフィーチャの p 値。 | Float64 |
Gi_Bin | 統計的に有意なホット スポットおよびコールド スポットを識別するために使用される信頼度。 +/-3 の Gi_Bin 値を持つフィーチャは、99% の信頼度で統計的有意性を反映します。+/-2 の Gi_Bin 値を持つフィーチャは、95% の信頼度を反映します。+/-1 の Gi_Bin 値を持つフィーチャは、90% の信頼度を反映します。0 の Gi_Bin 値を持つフィーチャのクラスターは、統計的に有意ではありません。 | Float64 |