ラベル | 説明 | データ タイプ |
入力レイヤー | 集計するポイント レイヤー、ポリライン レイヤー、またはポリゴン レイヤー。 | Table View |
出力テーブル | 集計された属性を使用した新しいテーブル。 | Table |
フィールド | 同様なフィーチャの集計に使用する 1 つまたは複数のフィールド。たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、住宅地の値を持つすべてのフィールドが集計されて統計情報のサマリーが算出され、商業地の値を持つすべてのフィールドが集計されます。この例では、商業地と住宅地のサマリー値の 2 行が出力に作成されます。 オプションで、どのフィールドも選択せずに、すべてのフィーチャを単一の集計結果としてまとめることもできます。 | Field |
サマリー フィールド (オプション) | 指定されたフィールドに関して計算される統計情報。 | Value Table |
時間ステップの間隔 (オプション) | 時間ステップの期間を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。 時間ステップは、入力が時間対応である場合にのみ適用できます。 | Time Unit |
時間ステップの反復 (オプション) | 時間ステップの間隔が発生する頻度を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。 | Time Unit |
時間ステップの基準 (オプション) | 時間ステップを揃える基準時間を指定する日付。 デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。 | Date |
サマリー
フィーチャクラス内のフィールドの要約統計量を計算します。
使用法
[属性の集計 (Summarize Attributes)] は空間解析ツールではなく、表形式の解析ツールです。 表形式のレイヤーか、ジオメトリを持つレイヤー (ポイント、ライン、ポリゴン) を入力として使用できます。
1 つ以上のフィールドを指定して集計するか、すべてのフィーチャを集計できます。フィールドで集計する場合、統計情報は、属性値の一意の組み合わせごとに計算されます。
[出力テーブル] は、統計演算の結果を含むフィールドで構成されます。
次の命名規則を使用して、指定した各統計情報タイプのフィールドが作成されます。sum_<field>、max_<field>、min_<field>、range_<field>、std_<field>、count_<field>、var_<field>、および any_<field> (ここで、<field> は、統計情報が計算される入力フィールドの名前です)。統計情報は、各グループで個別に計算されます。
このツールを空間データに適用すると、表形式の結果を得ることができます。[フィーチャの結合] を使用し、空間データに結果を結合することができます。
入力で時間が有効化されている場合、時間ステップを解析に適用できます。 各タイム ステップは、タイム ステップ外のフィーチャとは切り離して解析されます。 時間ステップを使用するには、入力データを時間対応にし、任意の時点を時間で表す必要があります。 時間ステップを適用すると、出力フィーチャは START_DATETIME および END_DATETIME フィールドで表した時間間隔になります。
次のテーブルでは、類似したフィールド値を使用して集計されたレイヤーの統計計算を示します。レイヤーの数値統計情報 ([個数]、[合計]、[最小]、[最大]、[範囲]、[平均]、[標準偏差]、および [分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数] と [すべて]) の計算には、[Rating] フィールドを使用しています。
上記のテーブルは [Designation] フィールドで集計されており、レイヤーの数値統計情報 ([個数]、[合計]、[最小]、[最大]、[範囲]、[平均]、[標準偏差]、[分散]) の計算には、[VO2] フィールドを使用しています。レイヤーの文字列統計情報 ([個数] と [すべて]) の計算には、[Rating] フィールドを使用しています。これにより、異なる [Designation] 値を表す、2 つのフィーチャを持つテーブルが生成されます。
次のテーブルでは、[Designation] フィールドと [Age Group] フィールドを使用してレイヤーを集計したときの、最初のいくつかのフィールドを示します。統計は、前の例と同じ方法で計算されます。
次のヒントを使用することで、[属性の集計 (Summarize Attributes)] ツールのパフォーマンスを向上させることができます。
- 対象データのみを解析するように、範囲環境を設定します。
- 解析が実行されている場所に対してローカルなデータを使用します。
ジオプロセシング ツールは、Spark を活用しています。 解析は、デスクトップ コンピューターで複数のコアを並列に使用して行われます。 解析の実行の詳細については、「GeoAnalytics Desktop ツールの考慮事項」をご参照ください。
GeoAnalytics Desktop ツールを実行する際、解析はデスクトップ コンピューターで行われます。 最適なパフォーマンスを得るために、データがデスクトップで利用できる必要があります。 ホスト フィーチャ レイヤーを使用している場合は、ArcGIS GeoAnalytics Server を使用することをお勧めします。 データがローカルではない場合は、ツールの実行時間は長くなります。 ArcGIS GeoAnalytics Server を使用して解析を実行する方法については、GeoAnalytics Tools をご参照ください。
[解析] ツールボックスの [要約統計量 (Summary Statistics)] ツールを使用して、同様の解析を実行することもできます。
パラメーター
arcpy.geoanalytics.SummarizeAttributes(input_layer, out_table, fields, {summary_fields}, {time_step_interval}, {time_step_repeat}, {time_step_reference})
名前 | 説明 | データ タイプ |
input_layer | 集計するポイント レイヤー、ポリライン レイヤー、またはポリゴン レイヤー。 | Table View |
out_table | 集計された属性を使用した新しいテーブル。 | Table |
fields [fields,...] | 同様なフィーチャの集計に使用する 1 つまたは複数のフィールド。たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、住宅地の値を持つすべてのフィールドが集計されて統計情報のサマリーが算出され、商業地の値を持つすべてのフィールドが集計されます。この例では、商業地と住宅地のサマリー値の 2 行が出力に作成されます。 オプションで、どのフィールドも選択せずに、すべてのフィーチャを単一の集計結果としてまとめることもできます。 | Field |
summary_fields [summary_fields,...] (オプション) | 指定されたフィールドに関して計算される統計情報。
| Value Table |
time_step_interval (オプション) | 時間ステップの期間を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。 時間ステップは、入力が時間対応である場合にのみ適用できます。 | Time Unit |
time_step_repeat (オプション) | 時間ステップの間隔が発生する頻度を指定する値。 このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。 | Time Unit |
time_step_reference (オプション) | 時間ステップを揃える基準時間を指定する日付。 デフォルト値は、1970 年 1 月 1 日 12:00 a.m. です。このパラメーターは、入力ポイントが時間対応であり、特定時点を表す場合にのみ使用できます。 | Date |
コードのサンプル
次のスタンドアロン スクリプトで、SummarizeAttributes 関数を使用する方法を示します。
# Name: Summarize Attributes.py
# Description: Summarize Crime Data by year and beat.
# Import system modules
import arcpy
arcpy.env.workspace = "C:/data/CityData.gdb"
# Set local variables
inFeatures = "ChicagoCrimes"
summaryFields = ["Year", "Beat"]
summaryStatistics = [["Arrest", "COUNT"], ["District", "COUNT"]]
out = 'SummarizeCrimes'
# Run SummarizeAttributes
arcpy.gapro.SummarizeAttributes(inFeatures, out, summaryFields,
summaryStatistics)