属性の集計

ツール アイコン ビッグ データ解析で使用できます。

[属性の集計] ツール [属性の集計] ツール アイコン は、類似のフィールド値を集計し、集計テーブルを作成します。 生成されるレイヤーには、集計されたフィーチャの個数に加え、指定されたその他の統計情報も表示されます。

ワークフロー図

[属性の集計] ツールのワークフロー図

トルネードとハリケーンは、米国で発生する嵐の中でも特に破壊的な嵐です。 トルネードとハリケーンが及ぼした物的および金銭的損害を解析し、その影響の違いを比較しようと思っています。 そこで、1 つのデータセットにまとめた米国全土のトルネードとハリケーンのデータにアクセスします。すべての情報を集計し、すべてのハリケーンおよびトルネードの集計値を確認します。 台風の種類を使用してデータを集計し、台風のタイプごとに統計情報をまとめます。

使用上の注意

属性の集計ツールを操作する際には、以下の点に注意してください。

  • 表形式のレイヤーか、ジオメトリを持つレイヤー (ポイント、ライン、エリア) を入力として使用できます。
  • このツールを空間データと共に使用できますが、結果は表形式になります。 その後、[フィーチャの結合] ツールを使用して、結果を空間データに結合できます。
  • ツールは、空間解析ツールではなく表形式の解析ツールです。 出力テーブルは、統計演算の結果を含むフィールドで構成されます。
  • [フィールド] パラメーターを使用し、必要に応じて 1 つ以上のフィールドを指定して集計するか、すべてのフィーチャを集計することができます。 単一のフィールドで集計する場合、統計情報は、一意の属性値ごとに計算されます。 複数のフィールドで集計する場合、統計情報は、属性値の一意の組み合わせごとに計算されます。
  • このツールの出力は、集計されたフィーチャの個数を常に含みます。
  • [集計フィールド] パラメーターを使用して、追加の統計情報を計算できます。 使用可能な集計フィールドの統計情報は、集計するフィールド タイプによって決まります。 文字列属性フィールドは、統計情報 [すべて]、[個数]、および [重複を除いたカウント] を使用できます。 数値属性フィールドは、統計情報 [すべて]、[個数]、[重複を除いたカウント]、[合計]、[平方和]、[最小]、[最大]、[範囲]、[分散]、[標準偏差] を使用できます。 日付属性フィールドは、統計情報 [すべて]、[個数]、[最小]、[最大]、および [範囲] を使用できます。

属性の集計ツールの仕組み

以下では、[属性の集計] ツールの機能について説明します。

方程式

分散は以下の方程式で算出されます。

分散の方程式
分散の変数

標準偏差は、分散の平方根として算出されます。

計算

入力レイヤーは、一致するフィールド値を持つグループに集計されます。 結果は表形式なので、マップ上で視覚化することはできません。

次のテーブルでは、類似したフィールド値を使用して集計されたレイヤーの統計計算を示します。 レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差]、および [分散]) の計算には、VO2 フィールドを使用しています。 レイヤーの文字列統計情報 ([個数][すべて]) の計算には、Rating フィールドを使用しています。

集計する入力レイヤー

上記のテーブルは Designation フィールドで集計されており、レイヤーの数値統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差][分散]) の計算には、VO2 フィールドを使用しています。 レイヤーの文字列統計情報 ([個数][すべて]) の計算には、Rating フィールドを使用しています。 これにより、異なる Designation 値を表す、2 つのフィーチャを持つテーブルが生成されます。

[Designation] フィールドを使用して集計された入力レイヤー
[Designation] フィールドを使用して集計された入力レイヤーを示します。

次のテーブルでは、Designation フィールドと Age Group フィールドを使用してレイヤーを集計したときの、最初のいくつかのフィールドを示します。 統計は、前の例と同じ方法で計算されます。

[Designation] フィールドと [Age Group] フィールドを使用して集計された入力レイヤー
Designation フィールドと Age Group フィールドを使用して集計された入力レイヤーを示します。

計数統計 (文字列フィールドと数値フィールド) は、非 NULL の値を数えます。 次の値の数は 5 です: [0, 1, 10, 5, null, 6] = 5。 このセットの値の数は 3 です: [Primary, Primary, Secondary, null] = 3。

パラメーター

以下は、属性の集計ツールのパラメーターです。

パラメーター説明データ タイプ

入力レイヤー

密度が計算されるポイント フィーチャ。

フィーチャ

フィールド (オプション)

同様なフィーチャの集計に使用する 1 つ以上のフィールド。 たとえば、商業地と住宅地の値を含む PropertyType フィールドを選択すると、すべての住宅地のフィールドが集計されて統計情報のサマリーが算出され、すべての商業地のフィールドが集計されます。

複数のフィールドを選択すると、値の一意の各組み合わせが、計算された統計情報のサマリーと共に集計されます。 たとえば、商業地と住宅地の値を含む 1 番目のフィールド PropertyType、および「はい」または「いいえ」の値を含む 2 番目のフィールド Occupied について考えます。 計算された統計情報のサマリーと共に集計できる可能な 4 つの組み合わせがあります。

String

集計フィールド (オプション)

指定したフィールドに関して計算される統計情報。 指定したフィールドが文字列フィールド、数値フィールド、または日付フィールドのいずれであるかに応じて、異なる統計情報を使用できます。

使用可能な統計情報のタイプは以下のとおりです。

  • [任意] - これは、文字列型のフィールドのサンプル文字列です。
  • [個数] - NULL 値でない値の数を計算します。 数値フィールドまたは文字列に使用できます。 [null, 0, 2] のデータの個数は 2 です。
  • [重複を除いたカウント] - 重複を除いた NULL 値でない値の数を計算します。 数値フィールドまたは文字列に使用できます。 [null, 4, 3, 4] の結果の重複を除いた個数は 2 です。
  • [合計] - フィールド内の数値の合計。 [null, 1, 3] の合計は 4 です。
  • [平方和] - 全体平均からの各観測データの自乗差の、全観測データにわたる合計。 [null, 2.2, 3.1, 4.7] の平方和は 3.206 です。
  • [最小] - 数値フィールドの最小値。 [0, 2, null] の最小値は 0 です。
  • [最大] - 数値フィールドの最大値。 [0, 2, null] の最大値は 2 です。
  • [平均] - 数値の平均。 [0,2, null] の平均値は 1 です。
  • [範囲] - 数値フィールドの範囲。 これは、最大値から最小値を減算して計算されます。 [0, null, 1] の範囲は 1 です。 [null, 4] の範囲は 0 です。
  • [分散] - トラック内の数値フィールドの分散。 [1] の分散は NULL です。 [null, 1,1,1] の分散は 1 です。
  • [標準偏差] - 数値フィールドの標準偏差。 [1] の標準偏差は NULL です。 [null, 1,1,1] の標準偏差は 1 です。

String

出力レイヤー

出力レイヤーは、[フィールド] パラメーターで指定したフィールド、そのレコードで集計されたフィーチャの数のカウント属性、および [集計フィールド] パラメーターで指定した集計された属性を含んでいるテーブルになります。