热点分析比较 (空间统计)

摘要

比较两个热点分析结果图层并衡量它们的相似度和关联度。

通过比较相应特征之间的显著性级别类别来确定两个输入图层中热点结果图层之间的相似度和关联度。 相似度衡量两个热点结果的热点、冷点和不显著区域在空间上对齐的程度。 关联(或依赖性)衡量热点变量之间潜在统计关系的强度(类似于连续变量的相关性)。

了解有关“热点分析比较”工作原理的详细信息

插图

“热点分析比较”工具图示
将比较两个热点分析结果图层。 更深的橙色阴影指示图层之间的差异更大。

使用情况

  • 将通过比较两个输入图层中相应要素及其相邻要素之间的显著性级别类别(99% 热、95% 热、90% 热、不显著、90% 冷、95% 冷和99% 冷)来执行所有比较。 相似度衡量两个热点结果的热点、冷点和不显著区域在空间上对齐的程度。 关联(或依赖性)衡量热点变量之间潜在统计关系的强度(类似于连续变量的相关性)。 相似度和关联度之间的区别很重要,因为即使两个热点结果高度相似(许多对应的要素及其相邻要素具有相同的显著性级别),但仍然几乎没有关联或依赖是很常见的。 这意味着尽管显著性级别相似,但如果影响其中一个变量(例如缓解措施),另一个变量不会发生变化。 高度相似但不相关的结果通常出现在两个热点结果都由单一类别主导时,例如不显著,或者两个结果都具有具有相同显著性级别的大型要素集群时。

    热点结果之间的相似度由介于 0 和 1 之间的相似度值来衡量。 如果两个结果中的许多对应要素具有相同的显著性级别,则该值将接近于 1。 如果许多对应要素没有匹配的显著性级别,则该值将接近于 0。 关联由 kappa 值衡量:强关联结果的 kappa 值接近 1,不关联(独立)结果的 kappa 值接近 0(或略为负)。 kappa 值是相似度值的重新缩放版本,它考虑了空间聚类和类别频率,以便隔离热点结果之间的统计关联。 这两个值都使用模糊集成员资格来允许基于显著性级别相似度和空间邻域的相应要素之间的部分匹配。 例如,99% 的热点可以被认为是与其他 99% 热点的完美匹配,与 95% 热点的部分匹配,以及与 99% 冷点的完全不匹配。 如果两个对应的要素本身不具有相同的显著性级别但其相邻要素具有相同的显著性级别,则也可以将其视为部分匹配。

    该工具计算全局相似度和全局 kappa 值,以衡量热点结果之间的整体相似度和关联度,并为每一对对应的要素计算局部版本。 这允许您映射比较以探索具有比全局值更高或更低相似度或关联度的区域。 输出要素还包括图表和自定义符号系统,突出显示热点结果最不相似的区域并汇总所有相应要素的显著性级别对。

  • 输入热点结果 1输入热点结果 2 参数值必须是热点分析 (Getis-Ord Gi*)优化热点分析工具的输出要素。 每个结果中的每个要素都必须与另一个结果的单个要素配对,以便可以比较它们的显著性级别类别。 如果输入的两个热点结果的要素在空间上不对齐(例如边界不相同的面),则在分析之前将两个要素图层相交,并在要素相交处进行比较。 当两个热点结果是不同大小的面时要小心,因为相交会将大的面细分为许多较小的面,并改变显著性级别类别的频率。 使用该工具至少需要 20 个要素交叉点。

  • 比较结果通过地理处理消息、输出要素类的图层组和图表返回。

    这些消息显示有关热点结果之间总体比较的信息。 这些消息显示如下信息:

    • 相似度值 - 一个介于 0 和 1 之间的值,用于衡量热点结果图层之间的整体相似度。 该值可以解释为任何一对对应要素具有相同显著性级别类别的模糊概率。
    • 期望相似度值 - 假设两个热点结果图层不关联(独立)的情况下的相似度期望值。 如果相似度值大于其期望值,则表明两个地图之间存在潜在依赖性。 该值主要是信息性的,用于在计算 kappa 值时缩放相似度值。 通过将每个要素与另一个热点结果中的随机要素配对并计算相似度来计算该值。 通过将每个要素与随机要素(而不是其对应的要素)配对,将在空间上对期望值进行调整,以考虑两个热点结果中的空间聚类和类别频率。 置换检验次数参数指定每个要素的随机配对数,期望相似度值是置换相似度值的平均值。
    • 空间模糊 Kappa - 热点分析变量之间关联的一种度量值,通过将相似度值按其期望值缩放计算得出。 完全关联的热点结果将具有值 1,而未关联(独立)的结果将具有接近 0 的值。 负值表示热点分析变量之间的负相关关系。 虽然该值没有下限,但实际上这些值很少小于 -3。
    • 每个热点显著性级别对之间的权重汇总。
    • 显示每个热点显著性级别对的计数和百分比的消息表。 在表格中,第二个热点结果图层的显著性级别的计数和百分比按第一个结果图层的类别细分。 例如,在第一个结果图层的 90% 显著热点中,您可以在第二个结果图层中看到同样为 90% 显著热点的计数和百分比,以及所有其他显著性级别类别的计数和百分比。 当两个热点结果代表在不同时间测量的相同变量时,此表将非常有用。 在这种情况下,您可以通过该表查看类别在两次测量之间的时间过渡情况。

    输出要素包含每对对应要素的相似度值、期望相似度值、kappa 值和显著性级别类别的字段。 当该工具在地图中运行时,三个图层将添加到一个图层组中,使您可以在空间上探索和调查相似度、关联度和显著性级别对。 第一个图层显示相似度值分为 0 到 1 之间的五个相等间隔,较低的相似度值以较深的颜色显示,以强调最不相似的区域。 第二个图层显示以等间隔和六类符号化的空间模糊 kappa 值。 第三个图层显示每个显著性级别组合与自定义符号系统,以识别要素,其中一个输入热点结果是具有统计显著性的热点,另一个是具有统计显著性的冷点(在自定义符号系统中,90%、95% 和 99% 为了减少组合的数量,不区分重要性)。

    最后一个图层还具有热点图和定制条形图,以进一步研究显著性级别对。 这些图表显示与消息中的表格相同的信息,但图表将按计数和百分比着色以便于解释。 您还可以使用图表和地图之间的选项,例如,选择一个结果中 99% 的热点和另一个结果中 99% 的冷点的所有要素,以指示可能的最大差异。

    了解有关工具输出的详细信息

  • 相似度加权方法参数使用模糊集成员定义显著性级别类别的每个组合之间的相似度。 每个权重都是一个介于 0 和 1 之间的值,表示在执行比较时类别的相似程度。 例如,您可以在 99% 热门和 95% 热门类别之间定义 0.75 的权重,以指示它们不完全相同,但它们的相似性大于不同之处。

    默认的模糊权重选项根据显著性级别的接近程度(由临界值比率确定)对类别进行加权。 其他选项允许您通过在类别之间分配权重值 1 来组合类别。 例如,组合 95% 和 99% 显著性选项将 99% 热和 95% 热组合成一个类别,将 99% 冷和 95% 冷组合,并将 90% 热、不显著和 90% 冷组合。 此选项将显著性等于或高于 95% 的所有热点(或冷点)视为相同(具有统计显著性),并将显著性低于 95% 的所有要素视为相同(不具有统计显著性)。 当您打算以 95% 的显著性级别执行两个热点分析,并且您希望将所有 90% 的显著热点和冷点视为不显著时,这将非常有用。 反转热点和冷点关系选项用于在热点和冷点之间分配较大的相似度权重。 例如,认为 99% 的热点与 99% 的冷点完全相似,而与其他 99% 的热点完全不同。 此选项可用于衡量具有负相关关系的变量之间的相似度和关联度,例如比较婴儿死亡率的热点与中等收入的冷点。

    自定义权重选项允许您定义自定义相似度权重以合并类别并定义您的偏好。 您可以在自定义相似度权重参数中提供自定义权重。 该参数显示为具有 49(7 x 7)个显著性级别组合的弹出矩阵。 要指定类别对之间的权重,请将值键入关联的单元格并按 Enter。 您可以从弹出对话框中将自定义权重导出到表中,以便以后可以通过从表中获取权重选项重新使用它们。

    注:

    相似度权重只影响相似度和 kappa 值的计算。 即使使用相似度权重组合显著性级别类别,消息表、输出图层符号系统和图表也会将它们视为单独的类别。

    了解有关类别相似度的详细信息

  • 当每个热点结果中有很大比例不显著时,由于不显著区域的匹配,相似度值会很大。 但是,如果非显著要素不在感兴趣研究范围内,您可能不希望相似度和 kappa 值仅反映两个结果中非显著区域的丰度。 如果两个热点结果在统计上均不显著,则可以使用排除非显著要素参数从比较中排除任何一对相应要素。 如果排除,该工具将计算条件相似度和 kappa 值,这些值仅比较统计显著的热点和冷点。 通过从计算中排除不显著的要素,您可以仅计算具有统计显著性的热点和冷点之间的相似度和 kappa 值,以准确反映它们的相似度和关联度。

    注:

    如果通过提供 1 的相对相似度权重将任何显著性级别类别与非显著性类别相结合,则这些类别也将从比较中排除。

  • 如果任一输入热点结果图层包含重叠面,则重叠部分将相交成新要素。 由此会导致相似度值不等于 1,即使对于具有相同显著性级别类别的结果图层也是如此。 可以使用 XY 容差环境以移除意外重叠,例如地理编码错误。 建议您查看输出要素中的要素数量以确定交叉点是否多于预期。

  • 相邻要素数参数指定将用于距离相似度的附加相邻要素的数量。 与相似度加权方法一样,当要素本身不具有相同的显著性级别但其邻域中的其他要素确实具有匹配的显著性级别时,距离相似度允许部分匹配。 因为热点分析是一种使用局部邻域的空间方法,所以每个要素的显著性级别是要素及其最近相邻要素值的表征,而不仅仅是要素。 从这个意义上说,如果任何相邻要素相似,它应该对其相邻要素的相似度有所贡献。

    使用基于相邻要素排序的距离权重合并通过相邻要素的部分相似度。 该要素的距离权重为 1,并且权重会随着每个附加相邻要素的增加而持续下降。 任何两个要素之间的整体相似度是它们的分类相似度(来自相似度加权方法)乘以它们的距离相似度。

    了解有关距离相似度和相邻要素权重的详细信息

  • 更改输入热点结果的顺序不会影响相似度值,但由于置换检验次数的随机性,期望相似度和 kappa 值会略有变化。 消息表和图表的轴也会反转,这在某些情况下更容易解释。 由于消息和图表显示的是按第一个结果的类别细分的第二个热点结果的显著性级别类别,因此您可以通过反转输入图层的顺序来显示按第二个结果的类别细分的第一个结果的类别。

参数

标注说明数据类型
Input Hot Spot Result 1

第一个热点分析结果图层。

Feature Layer
Input Hot Spot Result 2

第二个热点分析结果图层。

Feature Layer
输出要素

将包含相似度和关联度的局部测量值的输出要素类。

Feature Class
相邻要素的数目
(可选)

将用于距离加权的每个要素周围的相邻要素数量。 距离加权是整体相似度的一个组成部分,在计算相似度和关联度时,邻域内具有匹配显著性级别的任何要素都将被视为部分匹配。

Long
置换检验次数
(可选)

将用于估计期望相似度和 kappa 值的置换检验次数。 大量的模拟将提高估计的精度,但也会增加计算时间。

  • 99分析将使用 99 次置换检验。
  • 199分析将使用 199 次置换检验。
  • 499分析将使用 499 次置换检验。 这是默认设置。
  • 999分析将使用 999 次置换检验。
  • 9999分析将使用 9,999 次置换检验。
Long
相似度加权法
(可选)

指定将如何定义显著性级别类别之间的相似度权重。 相似度权重是介于 0 和 1 之间的数字,用于定义预期与另一结果的类别相匹配的一个结果的类别。 值为 1 表示类别将被视为完全相同,值为 0 表示类别将被视为完全不同。 0 和 1 之间的值表示类别之间的部分相似度。 例如,99% 的显著热点可以被认为与其他 99% 的热点完全相似,与 95% 的热点部分相似,而与 99% 的冷点完全不同。

  • 模糊权重相似度权重将是模糊的(非二元的)并由显著性级别的接近程度决定。 例如,99% 的显著热点将与其他 99% 的显著热点(权重 = 1)完全相似,但它们将与 95% 的显著热点(权重 = 0.71)和 90% 的显著热点(权重 = = 0.55)部分相似。 95% 显著性和 90% 显著性之间的权重为 0.78。所有热点都将完全不同于所有冷点和不显著的要素(权重 = 0)。 这是默认设置。
  • 精准的显著性级别匹配要素必须具有相同的显著性级别才能被视为相似。 例如,99% 的显著热点将被视为与 95% 和 90% 的显著热点完全不同。
  • 结合 90%、95% 和 99% 的显著性具有 90%、95% 和 99% 显著热点的要素将被视为彼此完全相似,而具有 90%、95% 和 99% 显著冷点的所有要素将被视为彼此完全相似。 此选项将显著性等于或高于 90% 的所有要素视为相同(统计显著),将置信度低于 90% 的所有要素视为相同(不显著)。 当以 90% 的显著性级别执行热点分析时,建议使用此选项。
  • 结合 95% 和 99% 的显著性具有 95% 和 99% 显著热点(冷点)的要素将被视为彼此完全相似,而具有 95% 和 99% 显著冷点的所有要素将被视为完全相似。 例如,90% 的显著热点和冷点将被视为与更高的显著性级别完全不同。 此选项将置信性等于或高于 95% 的所有要素视为相同(统计显著),将置信度低于 95% 的所有要素视为相同(不显著)。 当以 95% 的显著性级别执行热点分析时,建议使用此选项。
  • 仅使用 99% 显著性只有 99% 显著热点(或冷点)的要素才会被认为彼此完全相似。 此选项将显著性低于 99% 的所有要素视为不显著。 当以 99% 的显著性级别执行热点分析时,建议使用此选项。
  • 自定义权重将使用类别相似度权重参数中提供的自定义相似度权重。
  • 通过表格获取权重显著性级别之间的相似度权重将由输入表定义。 在输入权重表参数中提供该表。
  • 反转冷热关系将使用默认模糊权重,但第一个热点结果的热点将被视为与第二个热点结果的冷点相似。 例如,一个结果中 99% 的显著热点将被视为与另一个结果中的 99% 冷点完全相似,并与另一个结果中的 95% 和 90% 冷点部分相似。 当热点分析变量具有负相关关系时,建议使用此选项。 例如,您可以衡量婴儿死亡率热点与医疗保健冷点的对应程度。
String
类别相似度权重
(可选)

显著性级别类别之间的自定义相似度权重。 权重是介于 0 和 1 之间的值,表示考虑这两个类别的相似程度。 值为 0 表示类别完全不同;值为 1 表示值完全相似;0 和 1 之间的值表示类别部分相似。 在权重矩阵弹出窗口中,单击一个单元格,键入权重值,然后按 Enter 键应用权重。

Value Table
输入权重表
(可选)

该表包含热点显著性级别类别的每个组合的自定义相似度权重。 输入表必须包含 CATEGORY1CATEGORY2WEIGHT 字段。 在类别字段中提供对(输入图层的 Gi_Bin 字段值)的显著性级别类别,并在权重字段中提供它们之间的相似度权重。 如果表中未提供组合,则假定该组合的权重为 0。

Table View
排除不显著的要素
(可选)

指定如果两个热点结果都不显著,是否将要素对排除在比较之外。 如果排除,将计算条件相似度和 kappa 值,这些值仅比较统计显著的热点和冷点。 如果您只关注输入图层的热点和冷点是否对齐,而不关注非显著性区域是否对齐时,建议排除要素,例如比较收入中位数的热点和冷点是否与食物获取的热点和冷点相对应。

  • 选中 - 将排除不显著的要素,并且比较将以具有统计意义的热点和冷点为条件。
  • 未选中 - 将包括不显著的要素。 这是默认设置。

如果任何显著性级别类别被分配给非显著类别的相似度权重为 1(表示该类别将被视为与非显著类别相同),如果具有该类别的要素与另一个非显著要素配对,则它们也将被排除在比较之外。

Boolean

派生输出

标注说明数据类型
全局相似度值

热点结果之间的相似度值。

Double
全局期望相似值

热点结果之间相似度的期望值。

Double
全局空间模糊 Kappa

热点结果之间经过空间调整的模糊 kappa 值。

Double
输出图层组

输出图层的图层组。

Group Layer

arcpy.stats.HotSpotAnalysisComparison(in_hot_spot_1, in_hot_spot_2, out_features, {num_neighbors}, {num_perms}, {weighting_method}, {similarity_weights}, {in_weights_table}, {exclude_nonsig_features})
名称说明数据类型
in_hot_spot_1

第一个热点分析结果图层。

Feature Layer
in_hot_spot_2

第二个热点分析结果图层。

Feature Layer
out_features

将包含相似度和关联度的局部测量值的输出要素类。

Feature Class
num_neighbors
(可选)

将用于距离加权的每个要素周围的相邻要素数量。 距离加权是整体相似度的一个组成部分,在计算相似度和关联度时,邻域内具有匹配显著性级别的任何要素都将被视为部分匹配。

Long
num_perms
(可选)

将用于估计期望相似度和 kappa 值的置换检验次数。 大量的模拟将提高估计的精度,但也会增加计算时间。

  • 99分析将使用 99 次置换检验。
  • 199分析将使用 199 次置换检验。
  • 499分析将使用 499 次置换检验。 这是默认设置。
  • 999分析将使用 999 次置换检验。
  • 9999分析将使用 9,999 次置换检验。
Long
weighting_method
(可选)

指定将如何定义显著性级别类别之间的相似度权重。 相似度权重是介于 0 和 1 之间的数字,用于定义预期与另一结果的类别相匹配的一个结果的类别。 值为 1 表示类别将被视为完全相同,值为 0 表示类别将被视为完全不同。 0 和 1 之间的值表示类别之间的部分相似度。 例如,99% 的显著热点可以被认为与其他 99% 的热点完全相似,与 95% 的热点部分相似,而与 99% 的冷点完全不同。

  • FUZZY相似度权重将是模糊的(非二元的)并由显著性级别的接近程度决定。 例如,99% 的显著热点将与其他 99% 的显著热点(权重 = 1)完全相似,但它们将与 95% 的显著热点(权重 = 0.71)和 90% 的显著热点(权重 = = 0.55)部分相似。 95% 显著性和 90% 显著性之间的权重为 0.78。所有热点都将完全不同于所有冷点和不显著的要素(权重 = 0)。 这是默认设置。
  • EXACT_MATCH要素必须具有相同的显著性级别才能被视为相似。 例如,99% 的显著热点将被视为与 95% 和 90% 的显著热点完全不同。
  • ABOVE_90具有 90%、95% 和 99% 显著热点的要素将被视为彼此完全相似,而具有 90%、95% 和 99% 显著冷点的所有要素将被视为彼此完全相似。 此选项将显著性等于或高于 90% 的所有要素视为相同(统计显著),将置信度低于 90% 的所有要素视为相同(不显著)。 当以 90% 的显著性级别执行热点分析时,建议使用此选项。
  • ABOVE_95具有 95% 和 99% 显著热点(冷点)的要素将被视为彼此完全相似,而具有 95% 和 99% 显著冷点的所有要素将被视为完全相似。 例如,90% 的显著热点和冷点将被视为与更高的显著性级别完全不同。 此选项将置信性等于或高于 95% 的所有要素视为相同(统计显著),将置信度低于 95% 的所有要素视为相同(不显著)。 当以 95% 的显著性级别执行热点分析时,建议使用此选项。
  • ABOVE_99只有 99% 显著热点(或冷点)的要素才会被认为彼此完全相似。 此选项将显著性低于 99% 的所有要素视为不显著。 当以 99% 的显著性级别执行热点分析时,建议使用此选项。
  • CUSTOM将使用 similarity_weights 参数中提供的自定义相似度权重。
  • TABLE显著性级别之间的相似度权重将由输入表定义。 将在 in_weights_table 参数中提供该表。
  • REVERSE将使用默认模糊权重,但第一个热点结果的热点将被视为与第二个热点结果的冷点相似。 例如,一个结果中 99% 的显著热点将被视为与另一个结果中的 99% 冷点完全相似,并与另一个结果中的 95% 和 90% 冷点部分相似。 当热点分析变量具有负相关关系时,建议使用此选项。 例如,您可以衡量婴儿死亡率热点与医疗保健冷点的对应程度。
String
similarity_weights
[similarity_weights,...]
(可选)

显著性级别类别之间的自定义相似度权重。 权重是介于 0 和 1 之间的值,表示考虑这两个类别的相似程度。 值为 0 表示类别完全不同;值为 1 表示值完全相似;0 和 1 之间的值表示类别部分相似。

Value Table
in_weights_table
(可选)

该表包含热点显著性级别类别的每个组合的自定义相似度权重。 输入表必须包含 CATEGORY1CATEGORY2WEIGHT 字段。 在类别字段中提供对(输入图层的 Gi_Bin 字段值)的显著性级别类别,并在权重字段中提供它们之间的相似度权重。 如果表中未提供组合,则假定该组合的权重为 0。

Table View
exclude_nonsig_features
(可选)

指定如果两个热点结果都不显著,是否将要素对排除在比较之外。 如果排除,将计算条件相似度和 kappa 值,这些值仅比较统计显著的热点和冷点。 如果您只关注输入图层的热点和冷点是否对齐,而不关注非显著性区域是否对齐时,建议排除要素,例如比较收入中位数的热点和冷点是否与食物获取的热点和冷点相对应。

  • EXCLUDE将排除不显著的要素,并且比较将以具有统计意义的热点和冷点为条件。
  • NO_EXCLUDE将包括不显著的要素。 这是默认设置。

如果任何显著性级别类别被分配给非显著类别的相似度权重为 1(表示该类别将被视为与非显著类别相同),如果具有该类别的要素与另一个非显著要素配对,则它们也将被排除在比较之外。

Boolean

派生输出

名称说明数据类型
SIM_VALUE

热点结果之间的相似度值。

Double
EXP_SIM_VALUE

热点结果之间相似度的期望值。

Double
KAPPA

热点结果之间经过空间调整的模糊 kappa 值。

Double
output_layer_group

输出图层的图层组。

Group Layer

代码示例

HotSpotAnalysisComparison 示例 1(Python 窗口)

以下 Python 脚本演示了如何使用 HotSpotAnalysisComparison 函数。


arcpy.stats.HotSpotAnalysisComparison("c:/data/boston.gdb/robbery_hotspot", 
      "c:/data/boston.gdb/social_disorder_hotspot", "robbery_disorder_comparison",
      8, 499, "FUZZY", None, None, "EXCLUDE")
HotSpotAnalysisComparison 示例 2(独立脚本)

以下 Python 脚本演示了如何使用 HotSpotAnalysisComparison 函数。


# Compare hot spot analysis results for robberies and social disorder.

# Import required modules.
import arcpy

# Set the workspace.
arcpy.env.workspace = "c:/data/boston.gdb"

# Create hot spot result for robberies in Boston.
robbery_hs = arcpy.stats.HotSpots(
    "boston_ecometrics_hex", "robbery", "robbery_hotspot",
     "K_NEAREST_NEIGHBORS", None, None, None, None, None, None, 8
)

# Create hot spot result of social disorder in Boston.
social_disorder_hs = arcpy.stats.HotSpots(
    "boston_ecometrics_hex", "scl_dsr", "social_disorder_hotspot", 
    "K_NEAREST_NEIGHBORS", None, None, None, None, None, None, 8
)

# Compare robbery and social disorder hot spot results.
try:
    hs_compare = arcpy.stats.HotSpotAnalysisComparison(
        robbery_hs, social_disorder_hs, "robbery_disorder_comparison", 8, 999, "FUZZY", 
        None, None, False
    )
except arcpy.ExecuteError:
    # If an error occurred when running the tool, print the error message.
    print(arcpy.GetMessages())

# Save similarity and kappa derived outputs.
result_vals = [hs_compare.getOutput(out) for out in range(hs_compare.outputCount)]

# Apply labels to derived outputs
results_names = ["output_fc", "similarity", "expected_similarity", "fuzzy_kappa", 
    "output_layer"]

# Combine to dictionary and print derived outputs.
results = dict(zip(results_names, result_vals))
results