增量空间自相关 (空间统计)

摘要

测量一系列距离的空间自相关,并选择性创建这些距离及其相应 z 得分的折线图。 z 得分反映空间聚类的程度,具有统计显著性的峰值 z 得分表示促进空间过程聚类最明显的距离。 这些峰值距离值通常适用于具有距离范围距离半径参数的工具。

插图

“增量空间自相关”工具图示
Z 得分峰值反映促进空间过程聚类最明显的距离。

使用情况

  • 使用此工具有助于为具有这些参数(如热点分析点密度)的工具选择合适的距离阈值半径参数值。

  • 增量空间自相关工具可测量一系列距离增量的空间自相关,并为每项距离增量报告相关的 Moran 指数、预期指数、方差、z 得分和 p 值。 当工具运行时,这些值将被写入为消息。 这些消息还包括按距离划分的空间自相关折线图,显示每个距离的 z 得分。

  • 当显示多个具有统计显著性的峰值时,聚类在这些距离处均很明显。 选择最符合您感兴趣的分析规模的峰值距离;通常这是遇到的第一个具有统计意义的峰值。

  • 输入字段参数值应包含多种值。 此统计数学方法要求待分析的变量存在一定程度的变化;例如,如果所有输入都是 1 便无法求解。 要使用此工具分析事件数据的空间模式,应考虑聚合事件数据

  • 如果未投影输入要素类参数值(即,坐标单位为度、分和秒),或者将输出坐标系设置为地理坐标系,则采用弦测量方法计算距离。 使用弦距离测量法是因为此方法不仅计算速度快,而且提供真实测地线距离的良好估测,至少对于彼此 30 度以内的点是这样。 弦距离是基于扁椭球体计算的。 给定地球表面上的任意两点,两点之间的弦距离是从三维地球穿过然后连接该两点的一条线的长度。 弦距离报表将以米为单位。

    警告:

    如果您的研究区域超过 30 度,则请确保投影数据。 弦距离无法准确估算超出 30 度的测地线距离。

  • 如果分析时使用弦距离,开始距离距离增量参数(如提供)应以米为单位。

  • 对于线和面要素,距离计算中会使用要素的质心。对于多点、折线或由多部分组成的面,将会使用所有要素部分的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。

  • 地图图层可用于定义输入要素类。在使用带有选择内容的图层时,分析只会包括所选的要素。

  • 对于面要素,几乎总是需要为行标准化参数指定。 如果每个要素所具有的邻域数目由聚合方案或者采样过程决定,而不是反映您所分析的变量的实际空间分布,则行标准化将减少偏移。

  • 如果未指定开始距离参数值,则默认值为数据集中每个要素至少有一个相邻要素所需的最小距离(所有要素之间的最大最近邻距离)。 如果您的数据集中存在位置异常值,那么此距离可能不是最合适的开始距离

  • 如果未指定增量距离参数值,则使用平均最近邻距离或 (Td - B) / I 中的较小者,其中 Td 是最大阈值距离,B开始距离参数值,I距离段数量参数值。 该算法可确保始终根据指定的距离段数量值来执行计算,确保最大距离段不会过大以致一些要素以所有其它要素或几乎所有其它要素作为其相邻要素。

  • 如果指定的开始距离增量距离参数值所生成的距离段大于最大阈值距离,增量距离将自动减小。 为避免该调整,可以减小增量距离值或距离段数量值。

  • 运行此工具时,可能会发生内存不足的情况。 这种情况通常发生在指定开始距离增量距离参数值导致要素具有很多相邻要素时。 最好不要在具有上千个相邻要素的要素处创建空间关系。 增量距离使用更小的值并临时移除位置异常值,以便以更小的开始距离值启动。

  • 即使使用工具计算开始距离增量距离,大数据集的处理时间也可能比较长。 可以通过执行以下操作来提高性能:

    • 临时移除位置异常值(如上所述)。
    • 对研究区域的代表性部分中的选定要素(而不是所有要素)运行分析。
    • 从数据集中随机选择要素的样本,分析这些样本要素。

  • 距离通常基于输出坐标系环境设置。 输出坐标系环境的默认选项为与输入相同。 输入要素在分析之前投影到输出坐标系。

  • 可选输出表参数值将包含各迭代处的距离值、Moran I 指数值、预期 Moran I 指数值、方差、z 得分和 p 值。 峰值为 z 得分值升高、然后降低处的值。 例如,如果此工具找到 50、100 和 150 米距离的 z 得分,即 2.95、3.68、3.12,则峰值将为 100 米。 输出表还包括按距离的空间自相关折线图,其中显示可用于识别峰值的每个距离的 z 得分。

  • 当从 Python 使用此工具时,运行该工具返回的结果对象具有以下输出:

    位置描述数据类型

    0

    第一个峰值

    双精度

    1

    最大峰值

    双精度

参数

标注说明数据类型
输入要素

将在一系列距离上测量其空间自相关的要素类。

Feature Layer
输入字段

用于评估空间自相关的数值字段。

Field
距离段数量

邻域大小增加的次数以及对数据集进行空间自相关分析的次数。 分别在开始距离距离增量参数中指定的增量的起点和大小。

Long
开始距离
(可选)

开始空间自相关分析的距离和开始增量的距离。 为此参数输入的值应使用输出坐标系环境设置的单位。

Double
距离增量
(可选)

每次迭代后要增加的距离。 分析中使用的距离于开始距离参数值处开始,以距离增量参数值中指定的数量增加。 为此参数输入的值应使用输出坐标系环境设置的单位。

Double
距离法
(可选)

指定计算每个要素与邻近要素之间的距离的方式。

  • 欧氏使用两点间的直线距离计算距离值。 这是默认设置。
  • 曼哈顿将使用沿垂直角轴(城市街区)测量的两点之间的距离来计算距离,该距离是通过对 x 坐标和 y 坐标之间的(绝对)差求和来计算的。
String
行标准化
(可选)

指定是否标准化空间权重。 当要素分布由于采样设计或施加的聚合方案而可能偏离时,建议使用行标准化。

  • 选中 - 对空间权重执行标准化。 每个权重都会除以行的和(所有相邻要素的权重和)。 这是默认设置。
  • 不选中 - 不对空间权重执行标准化。
Boolean
输出表
(可选)

要使用每个距离范围和关联的 z 得分结果创建的表。

Table
输出报表文件
(可选)

要创建的 .pdf 文件,其中包含汇总结果的折线图。

File

派生输出

标注说明数据类型
第一个峰值

第一个峰值 z 得分。

Double
最大峰值

最大峰值 z 得分。

Double

arcpy.stats.IncrementalSpatialAutocorrelation(Input_Features, Input_Field, Number_of_Distance_Bands, {Beginning_Distance}, {Distance_Increment}, {Distance_Method}, {Row_Standardization}, {Output_Table}, {Output_Report_File})
名称说明数据类型
Input_Features

将在一系列距离上测量其空间自相关的要素类。

Feature Layer
Input_Field

用于评估空间自相关的数值字段。

Field
Number_of_Distance_Bands

邻域大小增加的次数以及对数据集进行空间自相关分析的次数。 分别在 Beginning_DistanceDistance_Increment 参数中指定的增量的起点和大小。

Long
Beginning_Distance
(可选)

开始空间自相关分析的距离和开始增量的距离。 为此参数输入的值应使用输出坐标系环境设置的单位。

Double
Distance_Increment
(可选)

每次迭代后要增加的距离。 分析中使用的距离于 Beginning_Distance 参数值处开始,以 Distance_Increment 参数值中指定的数量增加。 为此参数输入的值应使用输出坐标系环境设置的单位。

Double
Distance_Method
(可选)

指定计算每个要素与邻近要素之间的距离的方式。

  • EUCLIDEAN使用两点间的直线距离计算距离值。 这是默认设置。
  • MANHATTAN将使用沿垂直角轴(城市街区)测量的两点之间的距离来计算距离,该距离是通过对 x 坐标和 y 坐标之间的(绝对)差求和来计算的。
String
Row_Standardization
(可选)

指定是否标准化空间权重。 当要素分布由于采样设计或施加的聚合方案而可能偏离时,建议使用行标准化。

  • ROW_STANDARDIZATION对空间权重执行标准化。 每个权重都会除以行的和(所有相邻要素的权重和)。 这是默认设置。
  • NO_STANDARDIZATION不对空间权重执行标准化。
Boolean
Output_Table
(可选)

要使用每个距离范围和关联的 z 得分结果创建的表。

Table
Output_Report_File
(可选)

要创建的 .pdf 文件,其中包含汇总结果的折线图。

File

派生输出

名称说明数据类型
First_Peak

第一个峰值 z 得分。

Double
Max_Peak

最大峰值 z 得分。

Double

代码示例

IncrementalSpatialAutocorrelation 示例 1(Python 窗口)

以下 Python 窗口脚本演示了如何使用 IncrementalSpatialAutocorrelation 函数。

import arcpy
arcpy.env.workspace = r"C:\ISA"
arcpy.stats.IncrementalSpatialAutocorrelation("911CallsCount.shp", "ICOUNT", 
                                              "20", "", "", "EUCLIDEAN",
                                              "ROW_STANDARDIZATION", 
                                              "outTable.dbf")
IncrementalSpatialAutocorrelation 示例 2(独立脚本)

以下独立 Python 脚本演示了如何使用 IncrementalSpatialAutocorrelation 函数。

# Hot Spot Analysis of 911 calls in a metropolitan area
# using the Incremental Spatial Autocorrelation and Hot Spot Analysis Tools

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables
workspace = r"C:\ISA"

try:
    # Set the current workspace (to avoid having to specify the full path to 
    # the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap together at 
    # 30 feet
    # Process: Copy Features and Integrate
    cf = arcpy.management.CopyFeatures("911Calls.shp", "911Copied.shp")
    integrate = arcpy.management.Integrate("911Copied.shp #", "30 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.stats.CollectEvents("911Copied.shp", "911Count.shp")

    # Use Incremental Spatial Autocorrelation to get the peak distance
    # Process: Incremental Spatial Autocorrelation
    isa = arcpy.stats.IncrementalSpatialAutocorrelation(ce, "ICOUNT", "20", "", 
                     "", "EUCLIDEAN", "ROW_STANDARDIZATION", "outTable.dbf", 
                     "outReport.pdf")

    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    distance = isa.getOutput(2)
    hs = arcpy.stats.HotSpots(ce, "ICOUNT", "911HotSpots.shp", "Fixed Distance Band",
                     "Euclidean Distance", "None",  distance, "", "")

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

环境

特殊情况

输出坐标系

执行分析之前,将要素几何投影到输出坐标系。 所有数学计算都基于输出坐标系空间参考进行。 输出坐标系基于度、分、秒时,测地线距离使用弦距离估测。