エリア内での集計

ツール アイコン ビッグ データ解析で使用できます。

[エリア内での集計] ツール [エリア内での集計] ツール では、入力レイヤーが境界レイヤー内にあるか、境界レイヤーとオーバーラップしているエリア内の統計情報を計算できます。 集計対象のエリアは、エリア レイヤー、六角形のビン、または四角形のビンです。

ワークフロー図

エリア内での集計のワークフロー図

  • あるケーブル テレビのプロバイダーは、低コストのインターネット接続を低所得地域の大学生に提供する試験的プログラムを開始しています。 ビン別の [エリア内での集計] を使用すると、定義されたサイズの正方形のビン内の低所得の学生の数を決定できるため、ケーブル テレビのプロバイダーは試験的プログラムに適した地域を判断できます。
  • ある都市では、定期整備計画を効率よく実施するために、整備計画のそれぞれの評価対象地区内の街灯の数と自転車専用道路の総距離の計算に [エリア内での集計] を使用しています。 このツールを使用すると、各地区での作業の実施に必要な人員の数を概算することができます。

使用上の注意

  • 集計される入力レイヤーには、ポイント レイヤー、ライン レイヤー、またはエリア レイヤーを使用できます。
  • 出力レイヤーは常にポリゴン エリアまたはビン レイヤーであり、集計されたフィーチャが発生しているエリア フィーチャまたはビン フィーチャのみが返されます。
  • [エリア内での集計] の処理は、2 つのレイヤー、エリア フィーチャ、および入力集計フィーチャを受け取って、それらを積み重ねることと考えられます。 各レイヤーを積み重ねてから、そのスタックを見下ろして、エリア内にある入力集計フィーチャの数をカウントします。 フィーチャの数に加えて、入力集計フィーチャの属性に関する合計、平均、最小、最大などの単純な統計情報を計算できます。
  • [エリア内での集計] を使用して、標準の統計情報と地理空間的に加重した統計情報を計算できます。 標準の統計情報は、加重なしで統計値を集計したものです。 加重統計情報では、ポリゴン内のラインの割合、またはポリゴン内のポリゴンの割合を地理空間的に加重した値を使用して、値を計算します。 加重統計情報は、ポリゴン内のポイントには適用されません。

エリア内での集計の詳細

方程式

集計対象のライン フィーチャとエリア フィーチャでは、加重統計情報に [集計エリア] の重みが加えられます。 ポイント フィーチャの統計情報は重み付けされません。 分散、加重平均、および加重標準偏差の計算に使用される方程式を次の表に示します。

統計イクエーション変数機能

分散

分散の方程式分散の変数

ポイント

加重平均

加重平均の方程式

加重平均の変数

加重は、集計エリア内のフィーチャ の割合として算出されます。

ラインとエリア

加重標準偏差

加重標準偏差の方程式

加重標準偏差の変数

加重は、集計エリア内のフィーチャ の割合として算出されます。

ラインとエリア

ポイント

ポイント レイヤーの集計には、[集計エリア] 内にあるポイント フィーチャのみを使用します。 ポイントを集計する場合は、加重統計情報を適用できません。

仮想的なエリア内にあるポイント [集計対象レイヤー] の統計計算を次の図と表に示します。 このレイヤーの統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差]、および [分散]) の計算には、Population フィールドを使用しています。

ポイント レイヤーの集計
エリア レイヤー内にあるポイントのみを使用して、ポイント レイヤーが集計されています。 サンプル属性テーブルには、仮想的な統計計算に使用される値が表示されます。

数値統計情報地区 A の結果

次の個数:

[280, 408, 356, 361, 450, 713] = 6

合計値

280 + 408 + 356 + 361 + 450 + 713 = 2,568

最小

次のうちの最小:

[280, 408, 356, 361, 450, 713] = 280

最大

次のうちの最大:

[280, 408, 356, 361, 450, 713] = 713

範囲

713 - 280 = 433

平均

2568/6 = 428

分散

ポイントの分散
= 22737.2

標準偏差

ポイントの標準偏差
= 150.7886

文字列の統計情報地区 A の結果

= 6

任意

= 中学校

注意:

計数統計 (文字列フィールドと数値フィールド) は、非 NULL の値を数えます。 たとえば、[0, 1, 10, 5, null, 6] の個数は 5 です。 [Primary, Primary, Secondary, null] の個数は 3 です。

この解析の実用例は、それぞれの学区内の学生の合計人数を調べる場合です。 各ポイントは 1 つの学校を表します。 Type フィールドには、学校の種類 (小学校、中学校、または高校) が示され、学生人口のフィールドには、各学校に入学した学生の人数が示されています。 上記の表に示されているのは、地区 A の計算と結果です。 この結果から、地区 A には 2,568 人の学生が存在していることがわかります。 [エリア内での集計] ツールを実行すると、地区 B の結果も示されます。

ライン

加重統計情報では、ライン レイヤーの集計に、 [集計エリア] 内にあるライン フィーチャの割合のみを使用します。 標準 (非加重) 統計情報では、[集計エリア] と交差しているラインが集計されます。 加重統計情報でラインを集計する場合は、数や量 (比率や指数ではなく) を使用して、比率計算が解析で論理的な意味を持つようにします。

仮想的な [集計エリア] 内にあるライン [集計対象レイヤー] の統計計算を次の図と表に示します。 このレイヤーの統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差]、および [分散]) の計算には、Volume フィールドを使用しています。 標準統計情報の計算には、境界と交差しているラインが使用され、加重統計情報の計算には、[集計エリア] 内にあるラインの割合が使用されます。

ライン レイヤーの集計
ライン レイヤーの集計には、標準統計情報と加重統計情報が使用されます。

数値統計情報標準統計情報加重統計情報

加重計算

該当なし

茶色のラインの加重 (値 = 600):

2/3 = .6667

青色のラインの加重 (値 = 1000):

3/6 = .5

次の個数:

[1000, 600] = 2

次の個数:

1 x (3/6) + 1 x (2/3) = 1.1667

合計値

1000 + 600 = 1600
1000 x (3/6) + 600 x (2/3) = 900

最小

次のうちの最小:

[1000, 600] = 600

次のうちの最小:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 400

最大

次のうちの最大:

[1000, 600] = 1000

次のうちの最大:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 500

範囲

1000 - 600 = 600
500 - 400 = 100

平均

(1000 + 600)/2 = 800
(1000 x (3/6) + 600 x (2/3))/(3/6 + 2/3)
(500 + 400)/(7/6) = 771.4286

分散

ラインの分散
= 80000
ラインの加重分散
= 1268571.4286

標準偏差

ラインの標準偏差
= 282.8427
ラインの加重標準偏差
= 1126.3088

この解析の実用例は、州立公園の境界内にある河川の合計水量を算出する場合です。 各ラインは、公園内に流域の一部が存在する河川を表しています。 この結果から、公園内の河川の流域は 5 マイルであり、合計水量は 900 単位であることがわかります。

エリア

エリア レイヤーの集計には、入力境界内にあるエリア フィーチャの比率のみを使用します。 エリアを集計する際には、絶対数を含むフィールドを使用して、比率計算が解析で論理的な意味を持つようにします。

集計対象エリア レイヤーの加重統計情報は、[集計対象レイヤー] 内にある [集計エリア] フィーチャの割合に基づいています。 エリアを集計する場合は、数や量 (比率や指数ではなく) を使用して、比率計算が解析で論理的な意味を持つようにします。

仮想的な集計エリア内にあるエリア レイヤーの統計計算を次の図と表に示します。 このレイヤーの統計情報 ([個数][合計][最小][最大][範囲][平均][標準偏差]、および [分散]) の計算には、[Population] フィールドを使用しています。 標準統計情報の計算には、[集計エリア] と交差しているエリアが使用され、加重統計情報の計算には、各 [集計対象レイヤー] に含まれている集計エリアの割合に基づく比例加重が使用されます。

エリア レイヤーの集計
統計情報のサマリーは、集計エリアと交差している集計対象レイヤー内のエリアに関して算出されます。 重みは、集計エリアが集計対象レイヤーのフィーチャと重なっている割合に基づいています。

数値統計情報標準統計情報: 地域 1 の結果加重統計情報 地域 1 の結果

加重計算

黄色のエリアの加重 (値 = 3200):

4/(2+4) = 4/6

緑色のエリアの加重 (値 = 4700):

4/(2+4) = 2/3

ピンク色のエリアの加重 (値 = 1000):

1/(1+1.5) = 2/5

青色のエリアの加重 (値 = 4500):

6/(2+6) = 3/4

オレンジ色のエリアの加重 (値 = 3600):

2/(2+2) = 1/2

次の個数:

[3200, 4700, 1000, 4500, 3600] = 5

次の個数:

(2/3) + (2/3) + (2/5) + (3/4) + (1/2) = 2.98

合計値

3200 + 4700 + 1000 + 4500 + 3600 = 17000
(3/4) x 3200 + (2/3) x 4700 + (2/5) x 1000 +(3/4) x 4500 + (1/2) x 3600 = 10841.67

最小

次のうちの最小:

[3200, 4700, 1000, 4500, 3600] = 1000

次のうちの最小:

[(2/3) x 3200, (2/3) x 4700, (2/5) x 1000, (3/4) x 4500, (1/2) x 3600]
[2133.33, 3133.33, 400, 3375, 1800] = 400

最大

次のうちの最大:

3200, 4700, 1000, 4500, 3600] = 4700

次のうちの最大:

[2133.33, 3133.33, 400, 3375, 1800] = 3375

範囲

4700 - 1000 = 3700
3375 - 400 = 2,975

平均

(17000)/5 = 3400
(10841.67)/[2.9833] = 3634.12

分散

エリアの分散
= 2185000
エリアの加重分散
= 1727137.5112

標準偏差

エリアの標準偏差
= 1478.175
エリアの加重標準偏差
= 1314.2060

パラメーター

パラメーター説明データ タイプ

入力レイヤー

エリア フィーチャ内で集計されるポイント フィーチャ、ライン フィーチャ、またはポリゴン フィーチャ。

フィーチャ

ビン タイプ

規則的なビンを作成するために使用されるビンの形状。 オプションは、[四角] および [六角形] です。

ポリゴン ソースがこのツールの結合ポートに接続された場合、このパラメーターは表示されないか、必須になります。

文字列

ビン サイズ

入力ポイントが集約されるビン サイズを表す距離間隔。 四角形のビンの場合、ビン サイズはその四角形の高さを表します。 これがデフォルトです。 六角形のビンの場合、ビン サイズは、2 つの並行辺間の高さを表します。

ポリゴン ソースがこのツールの結合ポートに接続された場合、このパラメーターは表示されないか、必須になります。

文字列

形状の集計

解析の一部として形状情報 (ラインの長さまたはポリゴンの面積) を集計するかどうかを指定します。 入力集計フィーチャがポイントである場合、集計する形状情報はありません。 各エリア フィーチャ内のポイントの数のみが追加されます。

Boolean

形状の単位

シェープ サマリー集計で使用する単位。 入力集計フィーチャがラインである場合は、距離単位を指定します。 入力サマリー フィーチャがポリゴンである場合は、面積単位を指定します。

文字列

サマリー フィールド

指定したフィールドに関して計算される統計情報。 指定したフィールドが文字列フィールド、数値フィールド、または日付フィールドのいずれであるかに応じて、異なる統計情報を使用できます。

  • [任意] - 文字列型のフィールドのサンプル文字列。
  • [個数] - NULL 値でない値の数を計算します。 数値フィールドまたは文字列に使用できます。 [null, 0, 2] のデータの個数は 2 です。
  • [重複を除いたカウント] - 重複を除いた NULL 値でない値の数を計算します。 数値フィールドまたは文字列に使用できます。 [null, 4, 3, 4] の結果の重複を除いた個数は 2 です。
  • [合計] - フィールド内の数値の合計。 [null, 1, 3] の合計は 4 です。
  • [平方和] - 全体平均からの各観測データの自乗差の、全観測データにわたる合計。 [null, 2.2, 3.1, 4.7] の平方和は 3.206 です。
  • [最小] - 数値フィールドの最小値。 [0, 2, null] の最小値は 0 です。
  • [最大] - 数値フィールドの最大値。 [0, 2, null] の最大値は 2 です。
  • [平均] - 数値の平均。 [0, 2, null] の平均値は 1 です。
  • [範囲] - 数値フィールドの範囲。 これは、最大値から最小値を減算して計算されます。 [0, null, 1] の範囲は 1 です。 [null, 4] の範囲は 0 です。
  • [分散] - トラック内の数値フィールドの分散。 [1] の分散は NULL です。 [null, 1,1,1] の分散は 1 です。
  • [標準偏差] - 数値フィールドの標準偏差。 [1] の標準偏差は NULL です。 [null, 1,1,1] の標準偏差は 1 です。

文字列

加重統計情報

指定したフィールドに関して計算される、地理空間的に加重した統計情報。 加重統計情報では、ポリゴン内のラインの割合、またはポリゴン内のポリゴンの割合を地理空間的に加重した値を使用して、値を計算します。 加重統計情報は、ポリゴン内のポイントには適用されません。 指定したフィールドが文字列フィールド、数値フィールド、または日付フィールドのいずれであるかに応じて、異なる統計情報を使用できます。

  • [個数] - NULL 値でない値の数を計算します。 数値フィールドまたは文字列に使用できます。 [null, 0, 2] のデータの個数は 2 です。
  • [合計] - フィールド内の数値の合計。 [null, 1, 3] の合計は 4 です。
  • [最小] - 数値フィールドの最小値。 [0, 2, null] の最小値は 0 です。
  • [最大] - 数値フィールドの最大値。 [0, 2, null] の最大値は 2 です。
  • [平均] - 数値の平均。 [0, 2, null] の平均値は 1 です。
  • [範囲] - 数値フィールドの範囲。 これは、最大値から最小値を減算して計算されます。 [0, null, 1] の範囲は 1 です。 [null, 4] の範囲は 0 です。

文字列

出力レイヤー

出力レイヤーは、元のフィールドの代わりに次のフィールドを含みます。 サマリー フィールドを構成した場合、それらのフィールドが出力レイヤーでも計算されます。

フィールド名説明フィールド タイプ

COUNT

このポリゴン ビンに集計された入力レイヤーのフィーチャの数。

Float64

sum_length_<単位>

入力レイヤーがポリライン フィーチャであり、[形状の集計] パラメーターを [はい] に設定した場合、出力には、[形状の単位] パラメーターで指定された単位で各ビン内のポリライン フィーチャの全長を報告するこのフィールドが生成されます。

Float64

sum_area_<単位>

入力レイヤーがポリゴン フィーチャであり、[形状の集計] パラメーターを [はい] に設定した場合、出力には、[形状の単位] パラメーターで指定された単位で各ビン内のポリゴン フィーチャの合計面積を報告するこのフィールドが生成されます。

Float64

検討事項および制限事項

ラインとエリアの集計には、比率が使用されます。このため、ラインまたはエリアを集計する際には、相対データ (平均所得など) ではなく、絶対データ (人口など) の集計が最適です。