范围内汇总

大数据分析中的可用工具图标

“范围内汇总”工具 “范围内汇总”工具 可计算输入图层位于边界图层内或者与边界图层重叠的区域的统计数据。 要进行汇总的区域可以是面图层、六边形图格或方形图格。

工作流示意图

范围内汇总工作流示意图

示例

以下是“范围内汇总”工具的用例:

  • 一家有线电视提供商即将启动一项试点工程,该工程可使收入较低的社区大学的学生以较低的成本访问互联网。 借助“范围内按图格汇总”,可以确定已定义大小的正方形图格内低收入学生的数量,以便有线电视提供商确定合适的区域来实施其试点工程。
  • 为高效完成例行维护项目,市政府将使用“范围内汇总”工具计算各维护评估地区内的街灯数量并得出自行车车道的总英里数。 然后即可据其估算出各地区完成该项工作所需的材料和人员情况。

用法说明

使用“范围内汇总”工具时,请谨记以下信息:

  • 要汇总的输入图层可以是点、线或面图层。
  • 输出图层始终为面区域或图格图层,并且系统仅会返回汇总要素的区域或图格要素。
  • 您可以将“范围内汇总”视为使用两个图层(区域要素和输入汇总要素),并将其堆叠在彼此上方。 堆叠这些图层后,您可以向下查看堆叠,并计算落在该区域范围内的输入汇总要素的数量。 除了要素数量之外,您也可以计算关于输入汇总要素(和、平均值、最小值、最大值等)属性的简单统计数据。
  • 可以使用“范围内汇总”工具来计算标准统计数据和地理加权统计数据。 标准统计数据用于汇总统计值,而无需进行加权。 加权统计数据可使用面内线的比例或面内面的比例的地理加权值来计算值。 加权统计数据不适用于面内的点。

“范围内汇总”工具的工作原理

下文介绍了“范围内汇总”工具的工作原理。

等式

对于经汇总的线和面要素,加权统计数据将整合汇总区域权重。 点要素的统计数据不进行加权。 下表显示了用于计算方差、加权平均数和加权标准差的等式。

统计数据等式变量要素

方差

方差方程方差变量

加权平均数

加权平均数等式

加权平均数变量

权重是作为汇总区域内要素的百分比进行计算的。

线与面

加权标准差

加权标准差等式

加权标准差变量

权重是作为汇总区域内要素的百分比进行计算的。

线与面

点图层仅使用汇总区域内的点要素进行汇总。 汇总点时无法应用加权统计数据。

以下图表解释了假设区域内点汇总图层的统计计算过程。 Population 字段用于计算图层的统计数据(计数总和最小值最大值范围平均值标准差方差)。

汇总点图层
点图层仅使用位于面图层范围内的点进行汇总。 示例属性表显示了要在假设统计计算中使用的值。

数值统计数据结果区 A

计数

计数:

[280, 408, 356, 361, 450, 713] = 6

总和

280 + 408 + 356 + 361 + 450 + 713 = 2,568

最小值

最小值:

[280, 408, 356, 361, 450, 713] = 280

最大值

最大值:

[280, 408, 356, 361, 450, 713] = 713

范围

713 - 280 = 433

平均值

2568/6 = 428

方差

点的方差
= 22737.2

标准差

点的标准差
= 150.7886

字符串统计数据结果区 A

计数

= 6

任何

= 中学

注:

计数统计数据(针对字符串和数值字段)用于计算非空值的数量。 例如,[0, 1, 10, 5, null, 6] 的计数为 5. [Primary, Primary, Secondary, null] 的计数为 3。

在现实场景中,可使用此分析确定每个学区中学生的总数。 每个点表示一所学校。 Type 字段给出了学校类型(小学、中学或高中),学生人数字段给出了每所学校招收的学生人数。 上表给出了针对区域 A 的运算和结果。 从结果中,您可以看到区域 A 中有 2568 名学生。 运行范围内汇总工具时,也会给出区域 B 的结果。

线

对于加权统计数据,线图层仅使用汇总区域内线要素的比例进行汇总。 标准(非加权)统计数据将汇总一切与汇总区域相交的线。 当使用加权统计数据汇总线时,请使用计数和数量(而非比率或指数),这样分析中的比例计算才能符合逻辑。

以下图表解释了假设汇总区域内线汇总图层的统计计算过程。 Volume 字段用于计算图层的统计数据(计数总和最小值最大值范围平均值标准差方差)。 标准统计数据使用与边界相交的线进行计算,而加权统计数据使用汇总区域内线的比例进行计算。

汇总线图层
线图层将使用标准统计数据和加权统计数据进行汇总。

数值统计数据标准统计数据加权统计数据

正在计算权重

不适用

褐色线权重(值 = 600):

2/3 = .6667

蓝色线权重(值 = 1000):

3/6 = .5

计数

计数:

[1000, 600] = 2

计数:

1 x (3/6) + 1 x (2/3) = 1.1667

总和

1000 + 600 = 1600
1000 x (3/6) + 600 x (2/3) = 900

最小值

最小值:

[1000, 600] = 600

最小值:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 400

最大值

最大值:

[1000, 600] = 1000

最大值:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 500

范围

1000 - 600 = 600
500 - 400 = 100

平均值

(1000 + 600)/2 = 800
(1000 x (3/6) + 600 x (2/3))/(3/6 + 2/3)
(500 + 400)/(7/6) = 771.4286

方差

线的方差
= 80000
线的加权方差
= 1268571.4286

标准差

线的标准差
= 282.8427
线的加权标准差
= 1126.3088

在现实场景中,可使用此分析确定州立公园边界范围内河流的总水量。 每条线表示一条部分位于公园内的河。 从结果中可以看到在公园内有 5 英里长的河,河水总量为 900 个单位。

面图层仅使用输入边界内面要素的比例进行汇总。 请使用含有绝对数值的字段对面进行汇总,这样分析中的比例计算才能符合逻辑。

汇总面图层的加权统计数据基于汇总图层内的汇总区域要素。 当汇总面时,使用计数或数量(而非比率或指数),这样分析中的比例计算才能符合逻辑。

以下图表解释了假设汇总区域内面图层的统计计算过程。 人口字段用于计算图层的统计数据(计数总和最小值最大值范围平均值标准差方差)。 标准统计数据使用与汇总区域相交的面进行计算,而加权统计数据使用基于各汇总图层内所含的汇总区域部分的比例权重进行计算。

汇总区域图层
汇总统计数据针对汇总图层中与汇总区域相交的面进行计算。 权重将基于汇总区域与汇总图层要素重叠的比例。

数值统计数据标准统计数据:结果邻域 1加权统计数据:结果邻域 1

正在计算权重

黄色区域权重(值 = 3200):

4/(2+4) = 4/6

绿色区域权重(值 = 4700):

4/(2+4) = 2/3

粉色区域权重(值 = 1000):

1/(1+1.5) = 2/5

蓝色区域权重(值 = 4500):

6/(2+6) = 3/4

橙色区域权重(值 = 3600):

2/(2+2) = 1/2

计数

计数:

[3200, 4700, 1000, 4500, 3600] = 5

计数:

(2/3)+(2/3)+ (2/5)+(3/4)+ (1/2) = 2.98

总和

3200 + 4700 + 1000 + 4500 + 3600 = 17000
(3/4) x 3200 +(2/3) x 4700 + (2/5) x 1000 +(3/4) x 4500 + (1/2) x 3600 = 10841.67

最小值

最小值:

[3200, 4700, 1000, 4500, 3600] = 1000

最小值:

[(2/3) x 3200, (2/3) x 4700, (2/5) x 1000, (3/4) x 4500, (1/2) x 3600]
[2133.33, 3133.33, 400, 3375, 1800] = 400

最大值

最大值:

3200, 4700, 1000, 4500, 3600] = 4700

最大值:

[2133.33, 3133.33, 400, 3375, 1800] = 3375

范围

4700 - 1000 = 3700
3375 - 400 = 2,975

平均值

(17000)/5 = 3400
(10841.67)/[2.9833] = 3634.12

方差

面的方差
= 2185000
面的加权方差
= 1727137.5112

标准差

面的标准差
= 1478.175
面的加权标准差
= 1314.2060

参数

以下是“范围内汇总”工具的参数:

参数描述数据类型

输入图层

将要在区域要素中汇总的点、线或面要素。

要素

图格类型

将用于创建常规图格的图格形状。 选项为正方形六边形

如果将面源连接到此工具的连接端口,则该参数将不再显示或不再需要。

字符串

图格大小

表示由输入点聚合而成的图格大小的距离间隔。 对于正方形图格,图格大小表示正方形的高度。 这是默认设置。 对于六边形图格,图格大小表示两条平行边之间的高度。

如果将面源连接到此工具的连接端口,则该参数将不再显示或不再需要。

字符串

汇总形状

指定是否将形状信息汇总为分析的一部分(线的长度或面的面积)。 如果输入汇总要素为点,则不存在要汇总的形状信息。 仅添加每个区域要素内的点计数。

布尔

形状单位

用以计算形状汇总属性的单位。 如果输入汇总要素为线,则指定一个线性单位。 如果输入汇总要素为面,则指定一个面积单位。

字符串

汇总字段

将根据指定字段进行计算的统计数据。 可以使用不同的统计数据,具体取决于指定字段是字符串、数值还是日期字段。

  • 任何 - 字符串型字段中的示例字符串。
  • 计数 - 计算非空值的数目。 可用于数值字段或字符串。 [null, 0, 2] 的计数为 2。
  • 计数不同 - 计算不同的非空值的数量。 可用于数值字段或字符串。 [null, 4, 3, 4] 的计数不同结果为 2。
  • 总和 - 字段内数值的总和。 [null, 1, 3] 的总和为 4。
  • 平方和 - 在所有观测值中,每个观测值与总体平均值的平方差的总和。 [null, 2.2, 3.1, 4.7] 的平方和为 3.206。
  • 最小值 - 数值字段的最小值。 [0, 2, null] 的最小值为 0。
  • 最大值 - 数值字段的最大值。 [0, 2, null] 的最大值为 2。
  • 平均值 - 数值的平均值。 [0, 2, null] 的平均值为 1。
  • 范围 - 数值字段的范围。 其计算方法为最大值减去最小值。 [0, null, 1] 的范围为 1。 [null, 4] 的范围为 0。
  • 方差 - 轨迹中数值字段内数值的方差。 [1] 的方差为空。 [null, 1, 1, 1] 的方差为 1。
  • 标准差 - 数值字段的标准差。 [1] 的标准差为空。 [null, 1, 1, 1] 的标准差为 1。

字符串

加权统计数据

将根据指定字段进行计算的地理加权统计数据。 加权统计数据可使用面内线的比例或面内面的比例的地理加权值来计算值。 加权统计数据不适用于面内的点。 可以使用不同的统计数据,具体取决于指定字段是字符串、数值还是日期字段。

  • 计数 - 计算非空值的数目。 可用于数值字段或字符串。 [null, 0, 2] 的计数为 2。
  • 总和 - 字段内数值的总和。 [null, 1, 3] 的总和为 4。
  • 最小值 - 数值字段的最小值。 [0, 2, null] 的最小值为 0。
  • 最大值 - 数值字段的最大值。 [0, 2, null] 的最大值为 2。
  • 平均值 - 数值的平均值。 [0, 2, null] 的平均值为 1。
  • 范围 - 数值字段的范围。 其计算方法为最大值减去最小值。 [0, null, 1] 的范围为 1。 [null, 4] 的范围为 0。

字符串

输出图层

输出图层将包含以下字段以代替原始字段。 如果已配置汇总字段,则还将为输出图层计算这些字段。

字段名描述字段类型

计数

输入图层中已汇总为此面图格的要素的数量。

Float64

sum_length_<units>

如果输入图层为折线要素,并且将汇总形状参数设置为,则输出将生成该字段,该字段可报告每个图格中折线要素的总长度(以形状单位参数定义的单位为单位)。

Float64

sum_area_<units>

如果输入图层为面要素,并且将汇总形状参数设置为,则输出将生成该字段,该字段可报告每个图格中面要素的总面积(以形状单位参数定义的单位为单位)。

Float64

注意事项和限制

线和面是按比例进行汇总的;因此,汇总线或面时,最好汇总绝对数据(如人口)而非相对数据(如平均收入)。