大数据分析中的可用。
“范围内汇总”工具 可计算输入图层位于边界图层内或者与边界图层重叠的区域的统计数据。 要进行汇总的区域可以是面图层、六边形图格或方形图格。
工作流示意图
示例
以下是“范围内汇总”工具的用例:
- 一家有线电视提供商即将启动一项试点工程,该工程可使收入较低的社区大学的学生以较低的成本访问互联网。 借助“范围内按图格汇总”,可以确定已定义大小的正方形图格内低收入学生的数量,以便有线电视提供商确定合适的区域来实施其试点工程。
- 为高效完成例行维护项目,市政府将使用“范围内汇总”工具计算各维护评估地区内的街灯数量并得出自行车车道的总英里数。 然后即可据其估算出各地区完成该项工作所需的材料和人员情况。
用法说明
使用“范围内汇总”工具时,请谨记以下信息:
- 要汇总的输入图层可以是点、线或面图层。
- 输出图层始终为面区域或图格图层,并且系统仅会返回汇总要素的区域或图格要素。
- 您可以将“范围内汇总”视为使用两个图层(区域要素和输入汇总要素),并将其堆叠在彼此上方。 堆叠这些图层后,您可以向下查看堆叠,并计算落在该区域范围内的输入汇总要素的数量。 除了要素数量之外,您也可以计算关于输入汇总要素(和、平均值、最小值、最大值等)属性的简单统计数据。
- 可以使用“范围内汇总”工具来计算标准统计数据和地理加权统计数据。 标准统计数据用于汇总统计值,而无需进行加权。 加权统计数据可使用面内线的比例或面内面的比例的地理加权值来计算值。 加权统计数据不适用于面内的点。
“范围内汇总”工具的工作原理
下文介绍了“范围内汇总”工具的工作原理。
等式
对于经汇总的线和面要素,加权统计数据将整合汇总区域权重。 点要素的统计数据不进行加权。 下表显示了用于计算方差、加权平均数和加权标准差的等式。
统计数据 | 等式 | 变量 | 要素 |
---|---|---|---|
方差 | 点 | ||
加权平均数 | 权重是作为汇总区域内要素的百分比进行计算的。 | 线与面 | |
加权标准差 | 权重是作为汇总区域内要素的百分比进行计算的。 | 线与面 |
点
点图层仅使用汇总区域内的点要素进行汇总。 汇总点时无法应用加权统计数据。
以下图表解释了假设区域内点汇总图层的统计计算过程。 Population 字段用于计算图层的统计数据(计数、总和、最小值、最大值、范围、平均值、标准差和方差)。
数值统计数据 | 结果区 A |
---|---|
计数 | 计数:
|
总和 |
|
最小值 | 最小值:
|
最大值 | 最大值:
|
范围 |
|
平均值 |
|
方差 |
|
标准差 |
|
字符串统计数据 | 结果区 A |
---|---|
计数 |
|
任何 | = 中学 |
注:
计数统计数据(针对字符串和数值字段)用于计算非空值的数量。 例如,[0, 1, 10, 5, null, 6] 的计数为 5. [Primary, Primary, Secondary, null] 的计数为 3。
在现实场景中,可使用此分析确定每个学区中学生的总数。 每个点表示一所学校。 Type 字段给出了学校类型(小学、中学或高中),学生人数字段给出了每所学校招收的学生人数。 上表给出了针对区域 A 的运算和结果。 从结果中,您可以看到区域 A 中有 2568 名学生。 运行范围内汇总工具时,也会给出区域 B 的结果。
线
对于加权统计数据,线图层仅使用汇总区域内线要素的比例进行汇总。 标准(非加权)统计数据将汇总一切与汇总区域相交的线。 当使用加权统计数据汇总线时,请使用计数和数量(而非比率或指数),这样分析中的比例计算才能符合逻辑。
以下图表解释了假设汇总区域内线汇总图层的统计计算过程。 Volume 字段用于计算图层的统计数据(计数、总和、最小值、最大值、范围、平均值、标准差和方差)。 标准统计数据使用与边界相交的线进行计算,而加权统计数据使用汇总区域内线的比例进行计算。
数值统计数据 | 标准统计数据 | 加权统计数据 |
---|---|---|
正在计算权重 | 不适用 | 褐色线权重(值 = 600):
蓝色线权重(值 = 1000):
|
计数 | 计数:
| 计数:
|
总和 |
|
|
最小值 | 最小值:
| 最小值:
|
最大值 | 最大值:
| 最大值:
|
范围 |
|
|
平均值 |
|
|
方差 |
|
|
标准差 |
|
|
在现实场景中,可使用此分析确定州立公园边界范围内河流的总水量。 每条线表示一条部分位于公园内的河。 从结果中可以看到在公园内有 5 英里长的河,河水总量为 900 个单位。
面
面图层仅使用输入边界内面要素的比例进行汇总。 请使用含有绝对数值的字段对面进行汇总,这样分析中的比例计算才能符合逻辑。
汇总面图层的加权统计数据基于汇总图层内的汇总区域要素。 当汇总面时,使用计数或数量(而非比率或指数),这样分析中的比例计算才能符合逻辑。
以下图表解释了假设汇总区域内面图层的统计计算过程。 人口字段用于计算图层的统计数据(计数、总和、最小值、最大值、范围、平均值、标准差和方差)。 标准统计数据使用与汇总区域相交的面进行计算,而加权统计数据使用基于各汇总图层内所含的汇总区域部分的比例权重进行计算。
数值统计数据 | 标准统计数据:结果邻域 1 | 加权统计数据:结果邻域 1 |
---|---|---|
正在计算权重 | 黄色区域权重(值 = 3200):
绿色区域权重(值 = 4700):
粉色区域权重(值 = 1000):
蓝色区域权重(值 = 4500):
橙色区域权重(值 = 3600):
| |
计数 | 计数:
| 计数:
|
总和 |
|
|
最小值 | 最小值:
| 最小值:
|
最大值 | 最大值:
| 最大值:
|
范围 |
|
|
平均值 |
|
|
方差 |
|
|
标准差 |
|
|
参数
以下是“范围内汇总”工具的参数:
参数 | 描述 | 数据类型 |
---|---|---|
输入图层 | 将要在区域要素中汇总的点、线或面要素。 | 要素 |
图格类型 | 将用于创建常规图格的图格形状。 选项为正方形和六边形。 如果将面源连接到此工具的连接端口,则该参数将不再显示或不再需要。 | 字符串 |
图格大小 | 表示由输入点聚合而成的图格大小的距离间隔。 对于正方形图格,图格大小表示正方形的高度。 这是默认设置。 对于六边形图格,图格大小表示两条平行边之间的高度。 如果将面源连接到此工具的连接端口,则该参数将不再显示或不再需要。 | 字符串 |
汇总形状 | 指定是否将形状信息汇总为分析的一部分(线的长度或面的面积)。 如果输入汇总要素为点,则不存在要汇总的形状信息。 仅添加每个区域要素内的点计数。 | 布尔 |
形状单位 | 用以计算形状汇总属性的单位。 如果输入汇总要素为线,则指定一个线性单位。 如果输入汇总要素为面,则指定一个面积单位。 | 字符串 |
汇总字段 | 将根据指定字段进行计算的统计数据。 可以使用不同的统计数据,具体取决于指定字段是字符串、数值还是日期字段。
| 字符串 |
加权统计数据 | 将根据指定字段进行计算的地理加权统计数据。 加权统计数据可使用面内线的比例或面内面的比例的地理加权值来计算值。 加权统计数据不适用于面内的点。 可以使用不同的统计数据,具体取决于指定字段是字符串、数值还是日期字段。
| 字符串 |
输出图层
输出图层将包含以下字段以代替原始字段。 如果已配置汇总字段,则还将为输出图层计算这些字段。
字段名 | 描述 | 字段类型 |
---|---|---|
计数 | 输入图层中已汇总为此面图格的要素的数量。 | Float64 |
sum_length_<units> | 如果输入图层为折线要素,并且将汇总形状参数设置为是,则输出将生成该字段,该字段可报告每个图格中折线要素的总长度(以形状单位参数定义的单位为单位)。 | Float64 |
sum_area_<units> | 如果输入图层为面要素,并且将汇总形状参数设置为是,则输出将生成该字段,该字段可报告每个图格中面要素的总面积(以形状单位参数定义的单位为单位)。 | Float64 |
注意事项和限制
线和面是按比例进行汇总的;因此,汇总线或面时,最好汇总绝对数据(如人口)而非相对数据(如平均收入)。