“空间聚合”可计算输入图层与边界图层重叠区域的统计数据。
示例
一个高校联盟的商业分析师正在具有高价值院校的州中进行市场营销活动的研究,并希望了解哪个州拥有的高投资回报率 (ROI) 院校最多。 “空间聚合”可用于将院校聚合到州,以查找具有高于平均 ROI 的院校的数量。
使用空间聚合
空间聚合可以在具有两个图层的地图上运行:一个为具有将用于聚合的边界的区域图层(例如,县、人口普查区或警务区),另一个为要聚合的图层。
完成以下步骤以运行“空间聚合”:
- 如有必要,请单击地图卡片将其激活。 工具栏和操作按钮 出现时,卡片处于活动状态。
- 单击操作按钮,然后选择空间聚合。
- 对于选择区域图层,选择边界图层。 对于选择汇总图层,选择要聚合的图层。
- 对于样式设置依据,选择要计算和显示的字段或统计数据。 如有必要,使用其他选项选择其他字段和统计数据。
- 单击运行。
提示:
通过将数据集拖动到现有地图上的空间聚合放置区来运行“空间聚合”。
用法说明
选择区域图层和选择汇总图层参数可用于选择边界图层和要汇总的图层。 对于选择面图层参数,仅具有面要素的图层可用。
样式设置依据参数可用于更改正在进行计算的统计数据。 默认统计数据取决于要汇总的图层类型。 下拉菜单可用于选择不同的样式选项。 下表汇总了每个图层类型的样式设置依据选项:
汇总图层类型 | 默认样式选项 | 其他样式选项 |
---|---|---|
点 | 计数 | 数值或比率/比例字段(总和、最小值、最大值、平均值或模式) 字符串字段(模式) |
线 | 数值(总和)或比率/比例(平均值)字段 | 数值或比率/比例字段(总和、最小值、最大值、平均值或模式) 字符串字段(模式) 长度总和(米、公里、英尺或英里) |
区域 | 数值(总和)或比率/比例(平均值)字段 | 数值或比率/比例字段(总和、最小值、最大值、平均值或模式) 字符串字段(模式) 面积总和(平方米、平方公里、平方英尺或平方英里) |
注:
在计算线和面积的统计数据时,最好使用数值而不是比率/比例,从而使比例计算具有逻辑意义。 有关详细信息,请参阅空间聚合的工作原理。
可以展开其他选项参数并分配额外统计数据。 每次向汇总统计数据列表添加字段后,将在其下方显示新字段。
局限性
通过同一数据库连接对数据执行空间聚合或空间过滤时,必须确保所有数据存储在同一空间参考系统中。 对于 SQL Server 的数据集,数据还必须具有同一数据类型(地理或几何)。
以下限制适用于 Google BigQuery、Snowflake 以及不支持开箱即用的数据库平台。
- 只读连接不支持使用线要素和面要素作为选择一个要汇总的图层参数的“空间聚合”。
- 两个输入图层必须来自同一数据库连接。
Google BigQuery 不支持模式计算。
空间聚合的工作原理
平均统计数据通过使用线和面积要素的加权平均数计算得出。 以下等式用于计算加权平均数:
其中:N = 观测值个数 xi = 观测值 Wi = 权重
点
点图层仅使用输入边界内的点要素进行汇总。 因此,计算均未进行加权。
下图和下表阐明了假设边界内点图层的统计计算过程。 Population 字段用于计算数值统计数据(计数、总和、最小值、最大值和平均值),Type 字段用于计算模式。
字段 | 统计数据 | 结果区 A | 结果区 B |
---|---|---|---|
Population | 计数 | 6 | 6 |
总和 |
|
| |
最小值 | 最小值:
| 最小值:
| |
最大值 | 最大值:
| 最大值:
| |
平均值 |
|
| |
Type | 模式 | 小学 | 小学 |
在现实场景中,可使用此分析确定每个学区中学生的总数。 每个点表示一所学校。 Type 字段给出了学校类型(小学、中学或高中),学生人数字段给出了每所学校招收的学生人数。 上表给出了计算和结果。 从结果可以看出,A 区有 2,568 名学生,B 区有 3,400 名学生。
线
线图层仅使用输入边界内线要素的比例进行数字汇总。 汇总线时,使用带计数或数量(而非比率或比例)的字段,这样分析中的比例计算才能符合逻辑。 结果将使用分级符号进行显示。
线图层的模式基于与边界相交的要素数量。 线不必完全包含在要计入模式的边界之内,并且无论边界中所占的比例如何,每条线均被视为一个要素。 结果将使用唯一符号进行显示。
以下图表解释了假设边界内线图层的统计计算过程。 体积用于计算图层的统计数据(面积、总和、最小值、最大值和平均值)。 统计数据仅使用边界范围内线的比例进行计算。 该模式是针对水要素的类型计算的。
统计数据 | 字段 | 结果 |
---|---|---|
长度的总和 | 长度 |
注:长度也可以采用英尺、米和公里单位计算。 |
总和 | 体积 |
|
最小值 | 最小值:
| |
最大值 | 最大值:
| |
平均值 |
| |
模式 | 类型 | 河流 |
在现实场景中,可使用此分析确定州立公园边界范围内河流的总水量。 每条线表示一条部分位于公园内的河。 从结果中可以看到在公园内有 6.5 英里长的河,河水总量为 1,200 个单位。
Areas
面图层仅使用输入边界内面要素的比例进行汇总。 汇总面时,使用带计数或数量(而非比率或比例)的字段,这样分析中的比例计算才能符合逻辑。 结果将使用分级色彩进行显示。
面图层的模式基于与边界相交的要素数量。 面不必完全包含在要计入模式的边界之内,并且无论边界中所占的比例如何,每个面均被视为一个要素。 结果将使用唯一符号进行显示。
以下图表解释了假设边界内面图层的统计计算过程。 人口用于计算图层的统计数据(总和、最小值、最大值和平均值)。 统计数据仅使用边界范围内面的比例进行计算。 使用为每个面指定的 Tapestry 细分数据来计算模式。
统计数据 | 字段 | 结果 |
---|---|---|
面积的总和 | 区域 |
注:面积也可以采用平方英尺、平方米和平方公里单位计算。 |
总和 | 人口 |
|
最小值 | 最小值:
| |
最大值 | 最大值:
| |
平均值 |
| |
模式 | 路段 | 细分 2 |
在现实场景中,可使用此分析确定城市周边的人口数。 蓝色轮廓表示周边的边界,较小的区域表示人口普查区块。 从结果中可以看到周边有 10,841 人,每个人口普查区块平均大约有 2,666 人。