属性の集計 (Summarize Attributes)

ツール アイコン ビッグ データ解析で使用できます。

[属性の集計] ツール は、類似のフィールド値を集計し、集計テーブルを作成します。 生成される出力テーブルには、集計されたフィーチャの個数に加え、指定されたその他の統計情報も表示されます。

ワークフロー図

[属性の集計] ツールのワークフロー図

次に、[属性の集計] ツールの使用例を示します。

トルネードとハリケーンは、米国で発生する嵐の中でも特に破壊的な嵐です。 その影響の違いを理解するために、トルネードとハリケーンの両方が及ぼした物的および金銭的損害を解析しようと思っています。 そこで、1 つのデータセットにまとめた米国全土のトルネードとハリケーンのデータにアクセスします。すべての情報を集計し、すべてのハリケーンおよびトルネードの集計値を確認します。 台風の種類を使用してデータを集計し、台風のタイプごとに統計情報をまとめます。

使用上の注意

[属性の集計] ツールを操作する際には、以下の点に注意してください。

  • 表形式のレイヤーか、ジオメトリを持つレイヤー (ポイント、ライン、エリア) を入力として使用できます。
  • このツールは空間データと一緒に使用できます。 ただし、結果は表形式になります。 その後、[フィーチャの結合] ツールを使用して、結果を空間データに結合できます。
  • このツールは、空間解析ツールではなく表形式の解析ツールです。 出力テーブルは、統計演算の結果を含むフィールドで構成されます。
  • [フィールド] パラメーターを使用し、1 つ以上のフィールドを指定して集計するか、すべてのフィーチャを集計することができます。 単一のフィールドで集計する場合、統計情報は、一意の属性値ごとに計算されます。 複数のフィールドで集計する場合、統計情報は、属性値の一意の組み合わせごとに計算されます。
  • このツールの出力テーブルは、集計されたフィーチャの個数を常に含みます。
  • [集計フィールド] パラメーターを使用して、追加の統計情報を計算できます。 使用可能な集計フィールドの統計情報は、集計するフィールド タイプによって決まります。
    • 文字列属性フィールドは、統計情報 [すべて][個数]、および [重複を除いたカウント] を使用できます。
    • 数値属性フィールドは、[すべて][個数][重複を除いたカウント][合計][平方和][最小][最大][範囲][分散][標準偏差] の統計情報を使用できます。
    • 日付属性フィールドは、[すべて][個数][最小][最大][範囲] の統計情報を使用できます。

属性の集計ツールの仕組み

[属性の集計] ツールは、分散を計算し、フィールド値が一致するグループに入力レイヤーを集計します。 次のセクションでは、数式、計算、パラメーター、出力テーブルについて説明します。

方程式

分散は以下の方程式で算出されます。

分散の方程式
分散の変数

標準偏差は、分散の平方根として算出されます。

計算

入力レイヤーは、一致するフィールド値を持つグループに集計されます。 結果は表形式なので、マップ上で視覚化することはできません。 フィーチャ レイヤーを含む出力タイプを使用できます。 フィーチャ レイヤーによって生成される出力テーブルの詳細については、このページの出力テーブル セクションをご参照ください。

次のテーブルでは、類似したフィールド値を使用して集計されたレイヤーの統計計算を示します。 レイヤーの数値統計 ([個数][合計][最小][最大][範囲][平均][標準偏差][分散]) の計算には、VO2 フィールドを使用しています。 レイヤーの文字列統計 ([個数][すべて]) の計算には、Rating フィールドを使用しています。

集計される入力レイヤーのメタデータ フィールド

上記のテーブルは Designation フィールドで集計されており、レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差][分散]) の計算には、VO2 フィールドを使用しています。 レイヤーの文字列統計情報 ([個数][すべて]) の計算には、Rating フィールドを使用しています。 これにより、異なる Designation 値を表す、2 つのフィーチャを持つテーブルが生成されます。

Designation フィールドを使用した集計レイヤーのデータの集約
入力レイヤーが Designation フィールドを使用して集計される場合、合計、最小値、最大値が提供されます。

次のテーブルでは、Designation フィールドと Age Group フィールドを使用してレイヤーを集計したときの、最初のいくつかのフィールドを示します。 統計は、前の例と同じ方法で計算されます。

Designation フィールドと AgeGroup フィールドの表形式のサマリー
入力レイヤーは、Designation フィールドと Age Group フィールドを使用して集計されます。

文字列フィールドと数値フィールドの個数統計は、非 NULL の値を数えます。 次の値の数は 5 です: [0, 1, 10, 5, null, 6] = 5。 この値セットの数は 3 です: [Primary, Primary, Secondary, null] = 3。

パラメーター

次に、[属性の集計] ツールのパラメーターについて説明します。

パラメーター説明データ タイプ

入力レイヤー

密度が計算されるポイント フィーチャ。

フィーチャ

フィールド (オプション)

類似するフィーチャを集計するために使用されるフィールド。 単一のフィールドまたは複数のフィールドを使用できます。 たとえば、PropertyType という単一のフィールドを選択し、そのフィールドに「Commercial」(商業地) と「Residential」(住宅地) の値が含まれている場合、すべての住宅地のフィールドが集計され、商業地のフィールドは個別に集計され、各グループの要約統計が計算されます。

複数のフィールドを選択すると、値の一意の各組み合わせが集計され、それらの組み合わせの要約統計が計算されます。 たとえば、「Commercial」(商業地) と「Residential」(住宅地) の値を含む 1 番目のフィールド PropertyType、および「Yes」または「No」の値を含む 2 番目のフィールド Occupied について考えます。 集計できる組み合わせは 4 つあり、要約統計はこれらの 4 つのグループごとに個別に計算されます。

String

集計フィールド (オプション)

指定したフィールドに対して計算される統計情報。 利用可能な統計情報は、フィールドが文字列フィールド、数値フィールド、または日付フィールドのいずれであるかによって異なります。

使用可能な統計情報のタイプは以下のとおりです。

  • [すべて] - 文字列値を含むフィールドから取得したサンプル文字列。
  • [個数] - 非 NULL 値の数を計算します。 数値または文字列値を含むフィールドで使用できます。 [null, 0, 2] の個数は 2 です。
  • [重複を除いたカウント] - 重複を除いた NULL 値でない値の数を計算します。 数値または文字列値を含むフィールドで使用できます。 [null, 4, 3, 4] の結果の重複を除いた個数は 2 です。
  • [合計] - フィールド内の数値の合計。 [null, 1, 3] の合計は 4 です。
  • [平方和] - 全体平均からの各観測データの自乗差の合計を計算します。 [null, 2.2, 3.1, 4.7] の平方和は 3.206 です。
  • [最小] - 数値フィールドの最小値。 [0, 2, null] の最小値は 0 です。
  • [最大] - 数値フィールドの最大値。 [0, 2, null] の最大値は 2 です。
  • [平均] - 数値の平均。 [0, 2, null] の平均値は 1 です。
  • [範囲] - 数値フィールドの範囲。 これは、最大値から最小値を減算して計算されます。 [0, null, 1] の範囲は 1、[null, 4] の範囲は 0 です。
  • [分散] - トラッキング内の数値フィールドの分散。 [1] の分散は NULL、[null, 1,1,1] の分散は 1 です。
  • [標準偏差] - 数値フィールドの標準偏差。 [1] の標準偏差は NULL、[null, 1,1,1] の標準偏差は 1 です。

String

出力テーブル

このツールの出力は、[フィールド] パラメーターで指定したフィールド、そのレコードで集計されたフィーチャの数の個数属性、[集計フィールド] パラメーターで指定した集計された属性を含むテーブルになります。

出力タイプとして時空間フィーチャ レイヤーが使用された場合、時空間フィーチャ レイヤーとマップ イメージ レイヤーの両方が作成されます出力タイプとして ArcGIS Online ホスト フィーチャ レイヤーが使用された場合、出力テーブルはテーブル (ホスト) になります。