中心と分散の集計 (Summarize Center And Dispersion) (GeoAnalytics Desktop)

サマリー

中心フィーチャと分布指向性を検出し、入力から平均値と中央値の位置を計算します。

中心と分散の集計ツールの図

使用法

  • このツールを使用すると、フィーチャの中心性と分散を把握できます。 以下の例は、このツールの使用が有益な状況を示したものです。

    • 地方自治体は、サービスが不十分な地域に新たに図書館を開く計画を立てています。 適切に区画された利用可能な土地からなるブロック グループから重心が集計されました。 人口のウェイトで中心フィーチャを計算することにより、地域に最善のサービスを提供する中心ブロック グループを特定できます。
    • GIS 解析は、緊急時電話 (911) の位置と緊急時対応局 (警察、消防、救急車) の位置を解析しています。 地理的中心を計算することで、緊急時電話の地理的中心と緊急時対応局の地理的中心を比較し、応答時間を最適化できます。
    • 犯罪分析者は、空き巣の地理的中間地点が、日中のインシデントを評価するときと、夜間のインシデントを評価するときで、異なるかどうかを確認したいと考えています。 1 日の時間別のグループで地理的中間地点を計算することで、犯罪が日中と夜間にどこで発生しているかを特定できます。
    • 非政府組織の GIS アナリストは、感染症の拡大を分析しています。 楕円を使用すると、発生の分散をモデル化できます。

  • 入力ライン フィーチャとポリゴン フィーチャの場合は、距離の計算にフィーチャの重心が使用されます。

  • [加重フィールド] パラメーターを使用して、相対的重要性に応じ、位置にウェイトを付けます。 たとえば、小売りチェーンの店舗に総売上高で重み付けしたり、ポリゴン フィーチャに面積で重み付けしたりできます。 解析でのウェイトの適用方法については、「ウェイトの使用」をご参照ください。

  • [フィールドでグループ化] パラメーターを使用して、中心フィーチャまたは分散を個別に計算するためにフィーチャをグループ化します。 たとえば、年間を通して行われる野生生物の観測を季節または月別にグループ化できます。 フィールドは、整数型、日付型、または文字列型です。 NULL 値を含むレコードはグループ化されます。

  • 中心フィーチャは、データセット内の他のすべてのフィーチャに対する累積距離が最小となるフィーチャです。 このフィーチャは識別されると、[中心フィーチャ レイヤー] 出力に含まれます。 他のすべてのフィーチャに対する最短の累積距離を共有する複数のフィーチャが存在することがあります。 その場合、最も中心に位置するフィーチャが、すべて [中心フィーチャ レイヤー] 出力に含まれます。 [フィールドでグループ化] パラメーター値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに中心フィーチャが識別されます。 出力中心フィーチャのジオメトリ タイプは、入力フィーチャと同じになります。

  • 地理的中心とは、X および Y 座標で構築されるポイントのことです。 地理的中心フィーチャは [地理的中心レイヤー] 出力に含まれます。 [フィールドでグループ化] 値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに地理的中心が計算されます。

  • 地理的中間地点の算出では、反復アルゴリズムを使用して、データセット内のすべてのフィーチャに対するユークリッド距離が最小となる地理的な中間点を検出します。 地理的中間地点フィーチャは [地理的中間地点レイヤー] 出力に含まれます。 [フィールドでグループ化] 値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに地理的中間地点が計算されます。 地理的中心の算出操作の結果とは異なり、地理的中間地点の算出結果は、外れ値フィーチャの影響をあまり受けません。

  • 標準偏差楕円を作成して、中心傾向、分散、指向性傾向といった、地理フィーチャの空間特性をまとめます。 楕円のサイズは、1、2、または 3 の標準偏差です。 楕円フィーチャは [楕円レイヤー] 出力に含まれます。 [フィールドでグループ化] 値を指定した場合、フィールド値に基づいて、まず入力フィーチャがグループ化され、次にそのグループごとに楕円が計算されます。

  • 1 つまたは複数の集計タイプを指定して出力できます。 各集計タイプは、一意のフィーチャ レイヤーに出力されます。

  • 時間またはジオメトリに NULL 値を含むフィーチャが入力レイヤーに存在する場合、そのフィーチャは解析に使用されません。

  • [出力中心フィーチャ] パラメーターの結果には、入力レイヤー内のフィールドだけでなく、次のフィールドも含まれます。

    フィールド名説明

    CoordX

    中心フィーチャの X 座標。 フィーチャがラインまたはポリゴンの場合、値はフィーチャの重心を表します。

    CoordY

    中心フィーチャの Y 座標。 フィーチャがラインまたはポリゴンの場合、値はフィーチャの重心を表します。

    date

    入力レイヤーが時間対応かつ時間タイプが「インスタント」の場合、出力結果には出力フィーチャの時間を表す instant date フィールドが含まれます。

    start_date

    入力レイヤーが時間対応かつ時間タイプが「間隔」の場合、出力結果には出力フィーチャの開始時間を表す start date フィールドが含まれます。

    end_date

    入力レイヤーが時間対応かつ時間タイプが「間隔」の場合、出力結果には出力フィーチャの終了時間を表す end date フィールドが含まれます。

  • [出力地理的中心] および [出力地理的中間地点] パラメーターの結果には、解析で使用されるオプションの [フィールドでグループ化] パラメーター値に加えて次のフィールドも含まれます。

    フィールド名説明

    CoordX

    中心または中間地点フィーチャの X 座標。

    CoordY

    中心または中間地点フィーチャの Y 座標。

    date

    入力レイヤーが時間対応の場合、出力結果には入力フィーチャの時間の平均値または中央値を表す instant date フィールドが含まれます。 これは、時間タイプが間隔および即時の両方の入力レイヤーに該当します。

  • 出力の [楕円] サマリー タイプには、解析で使用されるオプションの [フィールドでグループ化] パラメーター値に加えて次のフィールドも含まれます。

    フィールド名説明

    CenterX

    楕円の地理的中心の X 座標。

    CenterY

    楕円の地理的中心の Y 座標。

    CenterT

    楕円の地理的中心の時間値。

    Rotation

    時計回りに正午の位置から計測される長軸の回転。 回転は、入力の空間参照の単位で計測されます。 たとえば、投影変換されたデータセットはメートル単位で計測され、地理データセットは度単位で計測されます。

    MajStdDist

    長軸の標準距離。 回転は、入力の空間参照の単位で計測されます。 たとえば、投影空間参照を含むデータセットはメートル単位で計測され、地理空間参照を含むデータセットは度単位で計測されます。

    MinStdDist

    短軸の標準距離。 回転は、入力の空間参照の単位で計測されます。 たとえば、投影空間参照を含むデータセットはメートル単位で計測され、地理空間参照を含むデータセットは度単位で計測されます。

    TmStdDist

    時間的標準距離。 この値はミリ秒単位の時間として計測されます。

  • すべての出力座標値は、解析の空間参照を使用して計算されます。 デフォルトでは、解析の空間参照は入力レイヤーと同じになります。 必要に応じて、出力座標系環境変数を使用して、解析で使用する空間参照を指定することができます。

  • 次の操作を 1 つ以上実行すると、[中心と分散の集計 (Summarize Center and Dispersion)] ツールのパフォーマンスを上げることができます。

    • 対象データのみが解析されるように、範囲環境を設定します。
    • 解析が実行されている場所に対してローカルなデータを使用します。
    • [フィールドでグループ化] パラメーターを使用してデータをグループ化します。
    • 大きなデータセットの場合、[生成タイプ][地理的中間地点] を使用しますが、このオプションでは反復的な計算が行われるため、集計タイプの中で最もパフォーマンスが低くなる可能性があります。

  • 次の空間統計ツールを使用して、同様の解析を実行することもできます。

  • ジオプロセシング ツールは、Spark を活用しています。 解析は、複数のコアを並列に使用して、デスクトップ コンピューター上で実行されます。 解析の実行方法の詳細については、「GeoAnalytics Desktop ツールに関する考慮事項」をご参照ください。

  • GeoAnalytics Desktop ツールを実行する場合、解析はデスクトップ コンピューター上で実行されます。 最適なパフォーマンスを実現するには、データがデスクトップ上で使用可能である必要があります。 ホスト フィーチャ レイヤーを使用している場合は、ArcGIS GeoAnalytics Server を使用することをお勧めします。 データがローカルに存在していない場合、ツールの実行時間が長くなります。 ArcGIS GeoAnalytics Server を使用して解析を実行する方法については、GeoAnalytics Tools をご参照ください。

パラメーター

ラベル説明データ タイプ
入力レイヤー

集計するポイント レイヤー、ライン レイヤー、またはポリゴン レイヤー。

Feature Layer
出力中心フィーチャ

入力レイヤー内で最も中心に位置するフィーチャの格納先となる出力フィーチャクラス。

Feature Class
出力地理的中心
(オプション)

入力レイヤーの地理的中心を表すフィーチャの格納先となる出力ポイント フィーチャクラス。

Feature Class
出力地理的中間地点
(オプション)

入力レイヤーの地理的中間地点を表すフィーチャの格納先となる出力ポイント フィーチャクラス。

Feature Class
出力楕円
(オプション)

入力レイヤーの指向性楕円のリプレゼンテーションの格納先となる出力ポリゴン フィーチャクラス。

Feature Class
楕円サイズ
(オプション)

標準偏差における出力楕円のサイズを指定します。

  • 1 つの標準偏差出力楕円は入力フィーチャの 1 標準偏差をカバーします。 これがデフォルトです。
  • 2 標準偏差出力楕円は入力フィーチャの 2 標準偏差をカバーします。
  • 3 標準偏差出力楕円は入力フィーチャの 3 標準偏差をカバーします。
String
加重フィールド
(オプション)

相対的重要性に応じて位置にウェイトを付けるために使用される数値フィールドです。 これはすべての集計タイプに適用されます。

Field
フィールドでグループ化
(オプション)

類似するフィーチャをグループ化するために使用されるフィールド。 これはすべての集計タイプに適用されます。 たとえば、樹木、灌木、草原の値を含む PlantType という名前のフィールドを選択した場合、値が樹木であるすべてのフィーチャに対して中心または分散が解析されます。 この例では、樹木、灌木、草原の各グループで 1 つずつ、計 3 つのフィーチャが出力されます。

Field

arcpy.geoanalytics.SummarizeCenterAndDispersion(input_layer, out_central_feature, {out_mean_center}, {out_median_center}, {out_ellipse}, {ellipse_size}, {weight_field}, {group_by_field})
名前説明データ タイプ
input_layer

集計するポイント レイヤー、ライン レイヤー、またはポリゴン レイヤー。

Feature Layer
out_central_feature

入力レイヤー内で最も中心に位置するフィーチャの格納先となる出力フィーチャクラス。

Feature Class
out_mean_center
(オプション)

入力レイヤーの地理的中心を表すフィーチャの格納先となる出力ポイント フィーチャクラス。

Feature Class
out_median_center
(オプション)

入力レイヤーの地理的中間地点を表すフィーチャの格納先となる出力ポイント フィーチャクラス。

Feature Class
out_ellipse
(オプション)

入力レイヤーの指向性楕円のリプレゼンテーションの格納先となる出力ポリゴン フィーチャクラス。

Feature Class
ellipse_size
(オプション)

標準偏差における出力楕円のサイズを指定します。

  • 1_STANDARD_DEVIATION出力楕円は入力フィーチャの 1 標準偏差をカバーします。 これがデフォルトです。
  • 2_STANDARD_DEVIATIONS出力楕円は入力フィーチャの 2 標準偏差をカバーします。
  • 3_STANDARD_DEVIATIONS出力楕円は入力フィーチャの 3 標準偏差をカバーします。
String
weight_field
(オプション)

相対的重要性に応じて位置にウェイトを付けるために使用される数値フィールドです。 これはすべての集計タイプに適用されます。

Field
group_by_field
(オプション)

類似するフィーチャをグループ化するために使用されるフィールド。 これはすべての集計タイプに適用されます。 たとえば、樹木、灌木、草原の値を含む PlantType という名前のフィールドを選択した場合、値が樹木であるすべてのフィーチャに対して中心または分散が解析されます。 この例では、樹木、灌木、草原の各グループで 1 つずつ、計 3 つのフィーチャが出力されます。

Field

コードのサンプル

SummarizeCenterAndDispersion (スタンドアロンのスクリプト)

次のスタンドアロン スクリプトで、SummarizeCenterAndDispersion 関数を使用する方法を示します。

# Name: SummarizeCenterAndDispersion.py
# Description: Calculate the directionality and movement of fire occurrences 
#              over time. This sample calculates a mean center and a standard 
#              deviational ellipse.
# Requirements: ArcGIS Pro Advanced license 

# Import system modules
import arcpy

# Set local variables
inFeatures = r"c:\data\MyBigDataConnection.bdc\fire_incidents"
outMeanCenter = r"c:\data\FireIncidents.gdb\fires_meancenter"
outEllipse = r"c:\data\FireIncidents.gdb\fires_ellipse"


# Run SummarizeCenterAndDispersion
arcpy.gapro.SummarizeCenterAndDispersion(inFeatures, "", outMeanCenter, "", 
                                         outEllipse, "2_STANDARD_DEVIATIONS")