汇总中心和离差 (GeoAnalytics Desktop)

摘要

用于查找中心要素和方向分布,并根据输入计算平均和中位数位置。

插图

“汇总中心和离差”工具图示

使用情况

  • 该工具可用于要素的中心性和离差。 以下示例是使用此工具非常有用的情况:

    • 某当地政府计划为某服务匮乏的社区开设新图书馆。 目前已从分区恰当且具有可用地块的区块组中采集了质心。 计算具有人口权重的中心要素可用于确定最适合社区的中心区块组。
    • 某 GIS 分析师希望分析 911 呼叫地点和紧急响应站(匪警、火警和急救)的位置。 计算平均中心可用于对紧急呼叫的平均中心和响应站的平均中心进行比较,以优化响应时间。
    • 某犯罪分析师在对白天事件点与夜间事件点进行对比评估时,希望确定盗窃行为的中位数中心是否发生变化。 使用一天中的小时分组计算的中位数中心可用于确定白天与夜间发生犯罪的位置。
    • 某非政府组织的 GIS 分析师在分析某种传染病的传播情况。 椭圆可用于创建疾病爆发模型。

  • 对于输入线和面要素,距离计算中会使用要素的质心。

  • 权重字段参数可根据各位置的相对重要性对它们进行加权。 例如,可根据总销售额对零售连锁店进行加权,或者根据面要素的面积对面要素进行加权。 有关如何在分析中应用权重的详细信息,请参阅使用权重

  • 分组依据字段参数可将要素分组,以便单独计算中心要素或者离差。 例如,全年的野生动物观测值可按照季节或月份进行分组。 该字段可以为整型、日期或字符串类型。 具有空值的记录将被分组在一起。

  • 中心要素是与数据集中所有其他要素的最小累积距离相关联的要素。 将标识此要素并将其包含在中心要素图层输出中。 多个要素可以共享与所有其他要素的最小累积距离。 如果出现此情况,则所有处于最中央位置的要素都将包含在中心要素图层输出中。 如果指定分组依据字段参数,则将首先根据该字段值对输入要素进行分组;然后标识每个组的中心要素。 输出中心要素的几何类型将与输入要素相同。

  • 平均中心是一个根据平均 x 和 y 坐标构造的点。 平均中心要素包含在平均中心图层输出中。 如果指定分组依据字段值,则将首先根据该字段值对输入要素进行分组,然后计算每个组的平均中心。

  • 中位数中心将使用迭代算法来查找可使数据集中所有要素间的欧氏距离达到最小的点。 中位数中心要素包含在中位数中心图层输出中。 如果指定分组依据字段值,则将首先根据该字段值对输入要素进行分组,然后计算每个组的中位数中心。 与平均中心运算的结果不同,中位数中心结果受异常值要素的影响较小。

  • 将创建标准差椭圆来汇总地理要素的空间特征:中心趋势、离散和方向趋势。 可将椭圆大小设置为 1、2 或 3 个标准差。 椭圆要素包含在椭圆图层输出中。 如果指定分组依据字段值,则将首先根据该字段值对输入要素进行分组,然后计算每个组的椭圆。

  • 可以指定要输出的一种或多种汇总类型。 每种汇总类型都将输出到唯一的要素图层。

  • 如果输入图层包含时间值或几何值为空的要素,则将不会在分析中使用这些要素。

  • 除了输入图层中的字段之外,输出中心要素参数结果还将包含以下字段:

    字段名描述

    CoordX

    中心要素的 x 坐标。 如果要素为线或面,则该值将表示要素的质心。

    CoordY

    中心要素的 y 坐标。 如果要素为线或面,则该值将表示要素的质心。

    date

    如果输入图层启用了时间且时间类型为时刻,则输出结果将包含表示输出要素时间的时刻日期字段。

    start_date

    如果输入图层启用了时间且时间类型为间隔,则输出结果将包含表示输出要素开始时间的开始日期字段。

    end_date

    如果输入图层启用了时间且时间类型为间隔,则输出结果将包含表示输出要素结束时间的结束日期字段。

  • 除了分析中使用的可选按字段分组参数值之外,输出平均中心输出中位数中心参数结果还将包含以下字段:

    字段名描述

    CoordX

    平均或中位数要素的 x 坐标。

    CoordY

    平均或中位数要素的 y 坐标。

    date

    如果输入图层启用了时间,则输出结果将包含表示输入要素平均时间或中位数时间的时刻日期字段。 这适用于间隔时间类型和时刻时间类型的输入图层。

  • 除了分析中使用的可选按字段分组参数值之外,输出椭圆汇总类型还将包含以下字段:

    字段名描述

    CenterX

    椭圆平均中心的 x 坐标。

    CenterY

    椭圆平均中心的 y 坐标。

    CenterT

    椭圆平均中心的时间值。

    Rotation

    从顶点开始按顺时针进行测量的长轴的旋转。 旋转以输入的空间参考为单位进行测量。 例如,投影数据集可以以米为单位进行测量,而地理数据集可以以度为单位进行测量度量。

    MajStdDist

    长轴的标准距离。 旋转以输入的空间参考为单位进行测量。 例如,具有投影空间参考的数据集可以以米为单位进行测量,而具有地理空间参考的数据集可以以度为单位进行测量。

    MinStdDist

    短轴的标准距离。 旋转以输入的空间参考为单位进行测量。 例如,具有投影空间参考的数据集可以以米为单位进行测量,而具有地理空间参考的数据集可以以度为单位进行测量。

    TmStdDist

    时态标准距离。 该值是以毫秒为单位进行测量的持续时间。

  • 将使用分析的空间参考来计算所有输出坐标值。 默认情况下,分析的空间参考将与输入图层相同。 或者,可以使用“输出坐标系”环境变量来指定分析中使用的空间参考。

  • 您可以通过以下一个或多个操作来提升汇总中心和离差工具的性能:

    • 设置范围环境,以便仅分析感兴趣的数据。
    • 本地数据用于分析运行的位置。
    • 可以使用按字段分组参数来分组数据。
    • 对于较大的数据集,由于中位数中心为迭代计算,它可能是性能最低的汇总类型,因此需要在生成类型参数中使用中位数中心

  • 还可使用以下空间统计工具完成类似分析:

  • 此地理处理工具由 Spark 作为支持。 可在台式计算机上并行使用多个核来完成分析。 要了解有关运行分析的详细信息,请参阅 GeoAnalytics Desktop 工具的注意事项

  • 运行 GeoAnalytics Desktop 工具时,将在台式计算机上完成分析。 为获得最佳性能,应在桌面上提供数据。 如果使用的是托管要素图层,则建议您使用 ArcGIS GeoAnalytics Server。 如果您的数据不是本地数据,则运行工具需要更长时间。 要使用 ArcGIS GeoAnalytics Server 执行分析,请参阅 GeoAnalytics Tools

参数

标注说明数据类型
输入图层

要进行汇总的点、线或面图层。

Feature Layer
输出中心要素

将包含位于输入图层最中心的要素的输出要素类。

Feature Class
输出平均中心
(可选)

将包含用于表示输入图层的平均中心的要素的输出点要素类。

Feature Class
输出中位数中心
(可选)

将包含用于表示输入图层的中位数中心的要素的输出点要素类。

Feature Class
输出椭圆
(可选)

将包含输入图层的方向椭圆表示的输出面要素类。

Feature Class
椭圆大小
(可选)

指定标准差中输出椭圆的大小。

  • 一个标准差输出椭圆将覆盖输入要素的一个标准差。 这是默认设置。
  • 两个标准差输出椭圆将覆盖输入要素的两个标准差。
  • 三个标准差输出椭圆将覆盖输入要素的三个标准差。
String
权重字段
(可选)

根据各位置的相对重要性对它们进行加权的数值型字段。 这适用于所有汇总类型。

Field
分组条件字段
(可选)

该字段用于分组类似要素。 这适用于所有汇总类型。 例如,如果选择字段 PlantType,其中包含树木、矮树丛和草地的值,则将对值为树木的所有要素进行分析以获取其自已的中心或离差。 此示例将产生三个要素,针对每组树木、矮树丛和草地各产生一个要素。

Field

arcpy.geoanalytics.SummarizeCenterAndDispersion(input_layer, out_central_feature, {out_mean_center}, {out_median_center}, {out_ellipse}, {ellipse_size}, {weight_field}, {group_by_field})
名称说明数据类型
input_layer

要进行汇总的点、线或面图层。

Feature Layer
out_central_feature

将包含位于输入图层最中心的要素的输出要素类。

Feature Class
out_mean_center
(可选)

将包含用于表示输入图层的平均中心的要素的输出点要素类。

Feature Class
out_median_center
(可选)

将包含用于表示输入图层的中位数中心的要素的输出点要素类。

Feature Class
out_ellipse
(可选)

将包含输入图层的方向椭圆表示的输出面要素类。

Feature Class
ellipse_size
(可选)

指定标准差中输出椭圆的大小。

  • 1_STANDARD_DEVIATION输出椭圆将覆盖输入要素的一个标准差。 这是默认设置。
  • 2_STANDARD_DEVIATIONS输出椭圆将覆盖输入要素的两个标准差。
  • 3_STANDARD_DEVIATIONS输出椭圆将覆盖输入要素的三个标准差。
String
weight_field
(可选)

根据各位置的相对重要性对它们进行加权的数值型字段。 这适用于所有汇总类型。

Field
group_by_field
(可选)

该字段用于分组类似要素。 这适用于所有汇总类型。 例如,如果选择字段 PlantType,其中包含树木、矮树丛和草地的值,则将对值为树木的所有要素进行分析以获取其自已的中心或离差。 此示例将产生三个要素,针对每组树木、矮树丛和草地各产生一个要素。

Field

代码示例

SummarizeCenterAndDispersion(独立脚本)

以下独立脚本演示了如何使用 SummarizeCenterAndDispersion 函数。

# Name: SummarizeCenterAndDispersion.py
# Description: Calculate the directionality and movement of fire occurrences 
#              over time. This sample calculates a mean center and a standard 
#              deviational ellipse.
# Requirements: ArcGIS Pro Advanced license 

# Import system modules
import arcpy

# Set local variables
inFeatures = r"c:\data\MyBigDataConnection.bdc\fire_incidents"
outMeanCenter = r"c:\data\FireIncidents.gdb\fires_meancenter"
outEllipse = r"c:\data\FireIncidents.gdb\fires_ellipse"


# Run SummarizeCenterAndDispersion
arcpy.gapro.SummarizeCenterAndDispersion(inFeatures, "", outMeanCenter, "", 
                                         outEllipse, "2_STANDARD_DEVIATIONS")