属性の集計 (Summarize Attributes) (GeoAnalytics Desktop)

サマリー

フィーチャクラス内のフィールドの要約統計量を計算します。

使用法

  • [属性の集計 (Summarize Attributes)] は空間解析ツールではなく、表形式の解析ツールです。 表形式のレイヤーか、ジオメトリを持つレイヤー (ポイント、ライン、ポリゴン) を入力として使用できます。

  • 1 つ以上のフィールドを指定して集計するか、すべてのフィーチャを集計できます。フィールドで集計する場合、統計情報は、属性値の一意の組み合わせごとに計算されます。

  • [出力テーブル] は、統計演算の結果を含むフィールドで構成されます。

  • 次の命名規則を使用して、指定した各統計情報タイプのフィールドが作成されます。sum_<field>max_<field>min_<field>range_<field>std_<field>count_<field>var_<field>、および any_<field> (ここで、<field> は、統計情報が計算される入力フィールドの名前です)。統計情報は、各グループで個別に計算されます。

  • このツールを空間データに適用すると、表形式の結果を得ることができます。[フィーチャの結合] を使用し、空間データに結果を結合することができます。

  • 入力で時間が有効化されている場合、時間ステップを解析に適用できます。 各タイム ステップは、タイム ステップ外のフィーチャとは切り離して解析されます。 時間ステップを使用するには、入力データを時間対応にし、任意の時点を時間で表す必要があります。 時間ステップを適用すると、出力フィーチャは START_DATETIME および END_DATETIME フィールドで表した時間間隔になります。

    時間ステップの詳細

  • 次のテーブルでは、類似したフィールド値を使用して集計されたレイヤーの統計計算を示します。レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差]、および [分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数][すべて]) の計算には、[Rating] フィールドを使用しています。

    集計する入力レイヤー
    集計される入力レイヤーを示します。

    上記のテーブルは [Designation] フィールドで集計されており、レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差][分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数][すべて]) の計算には、[Rating] フィールドを使用しています。これにより、異なる [Designation] 値を表す、2 つのフィーチャを持つテーブルが生成されます。

    [Designation] フィールドを使用して集計された入力レイヤー
    [Designation] フィールドを使用して集計された入力レイヤーを示します。

    次のテーブルでは、[Designation] フィールドと [Age Group] フィールドを使用してレイヤーを集計したときの、最初のいくつかのフィールドを示します。統計は、前の例と同じ方法で計算されます。

    [Designation] フィールドと [Age Group] フィールドを使用して集計された入力レイヤー
    [Designation] フィールドと [Age Group] フィールドを使用して集計された入力レイヤーを示します。
  • 次のヒントを使用することで、[属性の集計 (Summarize Attributes)] ツールのパフォーマンスを向上させることができます。

    • 対象データのみを解析するように、範囲環境を設定します。
    • 解析が実行されている場所に対してローカルなデータを使用します。

  • ジオプロセシング ツールは、Spark を活用しています。 解析は、デスクトップ コンピューターで複数のコアを並列に使用して行われます。 解析の実行の詳細については、「GeoAnalytics Desktop ツールの考慮事項」をご参照ください。

  • GeoAnalytics Desktop ツールを実行する際、解析はデスクトップ コンピューターで行われます。 最適なパフォーマンスを得るために、データがデスクトップで利用できる必要があります。 ホスト フィーチャ レイヤーを使用している場合は、ArcGIS GeoAnalytics Server を使用することをお勧めします。 データがローカルではない場合は、ツールの実行時間は長くなります。 ArcGIS GeoAnalytics Server を使用して解析を実行する方法については、GeoAnalytics Tools をご参照ください。

  • [解析] ツールボックスの [要約統計量 (Summary Statistics)] ツールを使用して、同様の解析を実行することもできます。

パラメーター

ラベル説明データ タイプ
入力レイヤー

集計するポイント レイヤー、ポリライン レイヤー、またはポリゴン レイヤー。

Table View
出力テーブル

集計された属性を使用した新しいテーブル。

Table
フィールド

同様なフィーチャの集計に使用する 1 つまたは複数のフィールド。たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、住宅地の値を持つすべてのフィールドが集計されて統計情報のサマリーが算出され、商業地の値を持つすべてのフィールドが集計されます。この例では、商業地と住宅地のサマリー値の 2 行が出力に作成されます。

オプションで、どのフィールドも選択せずに、すべてのフィーチャを単一の集計結果としてまとめることもできます。

Field
サマリー フィールド
(オプション)

指定されたフィールドに関して計算される統計情報。

Value Table
時間ステップの間隔
(オプション)

時間ステップの期間を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

時間ステップは、入力が時間対応である場合にのみ適用できます。

Time Unit
時間ステップの反復
(オプション)

時間ステップの間隔が発生する頻度を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Time Unit
時間ステップの基準
(オプション)

時間ステップを揃える基準時間を指定する日付。 デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Date

arcpy.geoanalytics.SummarizeAttributes(input_layer, out_table, fields, {summary_fields}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
名前説明データ タイプ
input_layer

集計するポイント レイヤー、ポリライン レイヤー、またはポリゴン レイヤー。

Table View
out_table

集計された属性を使用した新しいテーブル。

Table
fields
[fields,...]

同様なフィーチャの集計に使用する 1 つまたは複数のフィールド。たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、住宅地の値を持つすべてのフィールドが集計されて統計情報のサマリーが算出され、商業地の値を持つすべてのフィールドが集計されます。この例では、商業地と住宅地のサマリー値の 2 行が出力に作成されます。

オプションで、どのフィールドも選択せずに、すべてのフィーチャを単一の集計結果としてまとめることもできます。

Field
summary_fields
[summary_fields,...]
(オプション)

指定されたフィールドに関して計算される統計情報。

  • COUNT - NULL 値でない値の数。 数値フィールドまたは文字列に使用できます。 [null, 0, 2] の個数は 2 です。
  • SUM - フィールド内の数値の合計。 [null, null, 3] の合計は 3 です。
  • MEAN - 数値の平均。 [0,2, null] の平均は 1 です。
  • MIN - 数値フィールドの最小値。 [0, 2, null] の最小値は 0 です。
  • MAX - 数値フィールドの最大値。 [0, 2, null] の最大値は 2 です。
  • STDDEV - 数値フィールドの標準偏差。 [1] の標準偏差は null です。 [null, 1,1,1] の標準偏差は null です。
  • VAR - トラッキング内の数値フィールドの分散。 [1] の分散は null です。 [null, 1,1,1] の分散は null です。
  • RANGE - 数値フィールドの範囲。 これは、最大値から最小値を減算して計算されます。 [0, null, 1] の範囲は 1 です。 [null, 4] の範囲は 0 です。
  • ANY - 文字列型のフィールドのサンプル文字列。

Value Table
time_step_interval
(オプション)

時間ステップの期間を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

時間ステップは、入力が時間対応である場合にのみ適用できます。

Time Unit
time_step_repeat
(オプション)

時間ステップの間隔が発生する頻度を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Time Unit
time_step_reference
(オプション)

時間ステップを揃える基準時間を指定する日付。 デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。

Date

コードのサンプル

SummarizeAttributes の例 (スタンドアロン スクリプト)

次のスタンドアロン スクリプトで、SummarizeAttributes 関数を使用する方法を示します。


# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.

# Import system modules
import arcpy

arcpy.env.workspace = "C:/data/CityData.gdb"

# Set local variables
inFeatures = "ChicagoCrimes"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
out = 'SummarizeCrimes'

# Run SummarizeAttributes
arcpy.gapro.SummarizeAttributes(inFeatures, out, summaryFields, 
                                summaryStatistics)