ポイント クラスターの検索 (Find Point Clusters) (GeoAnalytics Desktop)

サマリー

時空間分布に基づき周辺ノイズ内でポイント フィーチャのクラスターを検索します。

[密度ベースのクラスター分析 (Density-based Clustering)] ツールの詳細

ポイント クラスターの検索ツールの図

使用法

  • [ポイント クラスターの検索 (Find Point Clusters)] の入力は、ポイント レイヤーです。このツールは、[入力ポイント レイヤー] からクラスターを抽出し、周辺ノイズを特定します。

  • [ポイント クラスターの検索] では、[入力ポイント レイヤー] が投影されているか、出力座標系投影座標系に設定されている必要があります。

  • 2 つの [クラスター分析方法] パラメーター オプションがあります。[指定距離 (DBSCAN)] は、DBSCAN アルゴリズムを使用し、指定された検索距離に基づいて最近接にあるポイントのクラスターを検索します。[自己調整 (HDBSCAN)] は、HDBSCAN アルゴリズムを使用して、DBSCAN と同様にポイントのクラスターを検索しますが、クラスターの可能性 (または安定性) に基づきさまざまな密度で、クラスターを考慮したさまざまな距離を使用します。[DBSCAN] を選択した場合、クラスターは 2 次元空間のみか、空間と時間の両方で検索できます。[時間を使ってクラスターを検索] をオンにし、入力レイヤーが時間対応かつ時間のタイプが瞬間である場合、DBSCAN は指定された検索距離および検索期間に基づいて最近接にあるポイントの時空間クラスターを検出します。

  • [クラスターあたりの最小フィーチャ数] パラメーターは、クラスター分析方法に応じて異なって使用されます。

    • [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから検索距離内にある必要があるフィーチャの数を指定します。結果は、この値よりも少ないフィーチャが含まれるクラスターを含むことができます。検索範囲の距離は、[検索距離] パラメーターを使用して設定されます。時間を使用してクラスターを検索する場合、[検索期間] が必要です。クラスター メンバーを検索する際、クラスターを形成するには、[検索距離] および [検索期間] 内に [クラスターあたりの最小フィーチャ数] が見つかる必要があります。この距離および期間は、検出されたポイント クラスターの直径または時間範囲には関連しません。
    • [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。

  • このツールは、各フィーチャが配置されるクラスターを特定する新しい整数フィールド CLUSTER_ID を持つ出力フィーチャクラスを生成します。デフォルトのレンダリングは COLOR_ID フィールドに基づきます。複数のクラスターに各色が割り当てられます。各色は、各クラスターが近傍のクラスターから視覚的に区別されるように割り当てられ、反復されます。

  • [指定距離 (DBSCAN)] クラスター分析手法を時間とともに使用し、時空間クラスターを検出する場合、結果には次のフィールドも含まれます。

    • FEAT_TIME - 各フィーチャの元となる瞬間の時間。
    • START_DATETIME - フィーチャが含まれるクラスターの時間範囲における開始時間。
    • END_DATETIME - フィーチャが含まれるクラスターの時間範囲における終了時間。

    生成されるレイヤーの時間プロパティは、START_DATETIME および END_DATETIME フィールドの間隔として設定され、時間スライダーで時空間クラスターを視覚化する際は、すべてのクラスター メンバーが一緒に描画されます。これらのフィールドは視覚化の目的でのみ使用されます。ノイズ フィーチャの場合、START_DATETIME および END_DATETIMEFEAT_TIME と等しくなります。

  • [クラスター分析方法][自動調整 (HDBSCAN)] の場合、出力フィーチャクラスには次のフィールドも含まれます。

    • PROB - フィーチャが、割り当てられたクラスターに存在する可能性。
    • OUTLIER - フィーチャが自身のクラスターの外れ値である可能性。値が高いほど、フィーチャが外れ値である可能性が高いことを示しています。
    • EXEMPLAR - 各クラスターの最も代表的なフィーチャです。これらのフィーチャは値が 1 であることで示されます。
    • STABILITY - さまざまな縮尺における各クラスターの持続性。値が大きいほど、より広範な距離縮尺においてクラスターが持続できることを示しています。

  • 次の 1 つまたは複数のヒントを使用して、[ポイント クラスターの検索 (Find Point Clusters)] ツールのパフォーマンスを向上させることができます。

    • 対象データのみが解析されるように、範囲環境を設定します。
    • 検索距離および期間は注意して選択してください。検索距離または半径は小さい方が、同じデータに対して優れたパフォーマンスを発揮する場合があります。
    • 解析が実行されている場所に対してローカルなデータを使用します。

  • ジオプロセシング ツールは、Spark を活用しています。 解析は、デスクトップ コンピューターで複数のコアを並列に使用して行われます。 解析の実行の詳細については、「GeoAnalytics Desktop ツールの考慮事項」をご参照ください。

  • GeoAnalytics Desktop ツールを実行する際、解析はデスクトップ コンピューターで行われます。 最適なパフォーマンスを得るために、データがデスクトップで利用できる必要があります。 ホスト フィーチャ レイヤーを使用している場合は、ArcGIS GeoAnalytics Server を使用することをお勧めします。 データがローカルではない場合は、ツールの実行時間は長くなります。 ArcGIS GeoAnalytics Server を使用して解析を実行する方法については、GeoAnalytics Tools をご参照ください。

パラメーター

ラベル説明データ タイプ
入力ポイント レイヤー

ポイント クラスターを含むポイント フィーチャクラス。

Feature Layer
出力フィーチャクラス

結果として生成されるポイント クラスターを含む新しいフィーチャクラス。

Feature Class
クラスター分析方法

クラスターの定義に使用する方法を指定します。

  • 指定距離 (DBSCAN)指定した距離を使用して、密度が低いノイズから密度の濃いクラスターを分離します。 DBSCAN は最速のクラスター分析方法ですが、存在する可能性があるすべてのクラスターを定義するための明確な距離がある場合にのみ適しています。 これにより、密度が同じクラスターが生成されます。 これがデフォルトです。
  • 自動調整 (HDBSCAN)さまざまな距離を使用して、密度が低いノイズからさまざまな密度のクラスターを分離します。 HDBSCAN は、最もデータを使用するクラスター分析方法で、最小のユーザー入力を必要とします。
String
クラスターあたりの最小フィーチャ数

このパラメーターは以下のように、選択したクラスター分析手法に応じて異なる方法で使用されます。

  • [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから特定の距離内にある必要があるフィーチャの数を指定します。この距離は、[検索距離] パラメーターを使用して設定されます。
  • [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。

Long
検索距離

考慮される最大距離。

指定される [クラスターあたりの最小フィーチャ数] 値はクラスター メンバーシップのこの距離内にある必要があります。 個別のクラスターは最小のこの距離で分離されます。 フィーチャがクラスター内で最近接するフィーチャからこの距離よりも離れて配置されている場合、クラスターには含められません。

Linear Unit
時間を使用したクラスター検出
(オプション)

DBSCAN でのクラスターの検出に、時間を使用するかどうかを指定します。

  • オン - 検索距離と検索期間の両方を使用して、時空間クラスターが検索されます。
  • オフ - 空間クラスターは検索距離を使用して検索され、時間は無視されます。これがデフォルトです。
Boolean
検索期間
(オプション)

クラスター メンバーを検索する際、クラスターを形成するには、この期間内に指定された最小ポイント数が見つかる必要があります。

Time Unit

arcpy.geoanalytics.FindPointClusters(input_points, out_feature_class, clustering_method, minimum_points, search_distance, {use_time}, {search_duration})
名前説明データ タイプ
input_points

ポイント クラスターを含むポイント フィーチャクラス。

Feature Layer
out_feature_class

結果として生成されるポイント クラスターを含む新しいフィーチャクラス。

Feature Class
clustering_method

クラスターの定義に使用する方法を指定します。

  • DBSCAN指定した距離を使用して、密度が低いノイズから密度の濃いクラスターを分離します。 DBSCAN は最速のクラスター分析方法ですが、存在する可能性があるすべてのクラスターを定義するための明確な距離がある場合にのみ適しています。 これにより、密度が同じクラスターが生成されます。 これがデフォルトです。
  • HDBSCANさまざまな距離を使用して、密度が低いノイズからさまざまな密度のクラスターを分離します。 HDBSCAN は、最もデータを使用するクラスター分析方法で、最小のユーザー入力を必要とします。
String
minimum_points

このパラメーターは以下のように、選択したクラスター分析手法に応じて異なる方法で使用されます。

  • [指定距離 (DBSCAN)] - あるポイントからクラスターの形成を開始するには、そのポイントから特定の距離内にある必要があるフィーチャの数を指定します。この距離は、[検索距離] パラメーターを使用して設定されます。
  • [自己調整 (HDBSCAN)] - 密度の推定時に考慮される各ポイントに隣接するフィーチャの数 (そのポイントを含む) を指定します。この数は、クラスターの抽出時に許容される最小クラスター サイズでもあります。

Long
search_distance

考慮される最大距離。

指定される [クラスターあたりの最小フィーチャ数] 値はクラスター メンバーシップのこの距離内にある必要があります。 個別のクラスターは最小のこの距離で分離されます。 フィーチャがクラスター内で最近接するフィーチャからこの距離よりも離れて配置されている場合、クラスターには含められません。

Linear Unit
use_time
(オプション)

DBSCAN でのクラスターの検出に、時間を使用するかどうかを指定します。

  • TIME検索距離と検索期間の両方を使用して、時空間クラスターが検索されます。
  • NO_TIME空間クラスターは検索距離を使用して検索され、時間は無視されます。これがデフォルトです。
Boolean
search_duration
(オプション)

クラスター メンバーを検索する際、クラスターを形成するには、この期間内に指定された最小ポイント数が見つかる必要があります。

Time Unit

コードのサンプル

FindPointClusters の例 (スタンドアロン スクリプト)

次の Python ウィンドウ スクリプトは、FindPointClusters 関数の使用方法を示しています。

#-------------------------------------------------------------------------------
# Name: FindPointClusters.py
# Description: Finds Point Clusters of rodent infestations

# Import system modules
import arcpy

arcpy.env.workspace = "C:/data/CountyData.gdb"

# Set local variables
inputPoints = "rat_sightings"
minimumPoints = 10
outputName = "RodentClusters"
searchDistance = "1 Kilometers"
clusterMethod = "DBSCAN"

# Run Find Point Clusters
arcpy.gapro.FindPointClusters(inputPoints, outputName, clusterMethod, 
                              minimumPoints, searchDistance)