“热点分析比较”的工作原理

热点分析比较工具用于比较两个热点分析结果图层,并计算其相似度和关联度。 通过比较相应要素(及其相邻要素)之间的显著性级别类别(99% 热点、95% 热点、90% 热点、非显著、90% 冷点、95% 冷点和 99% 冷点)来确定两个输入图层中热点结果图层之间的相似度和关联度。

两个热点分析结果的比较

该工具将计算全局相似度和全局 kappa 值,以衡量热点结果之间的整体相似度和关联度。 还将为每对相应要素计算局部版本的相似度和 kappa 值。 这允许您绘制比较以探索具有比全局值更高或更低相似度或关联度的区域。 输出要素还包括图表和自定义符号系统,突出显示热点结果最不相似的区域并汇总所有相应要素的显著性级别对。

输入热点结果图层必须为热点分析 (Getis-Ord Gi*)优化热点分析工具的输出要素。 每个结果中的每个要素都必须与另一个结果的单个相应要素配对,以便比较其显著性级别类别。 如果输入的两个热点结果的要素在空间上不对齐(例如边界不相同的面),则在分析之前将两个要素图层相交,并在要素相交处进行比较。

相似度和关联度

热点结果的相似度是两个热点结果的热点、冷点和非显著区域在空间上对齐的程度,结果之间的关联度(或依赖度)是潜在热点分析变量之间在统计上存在依赖关系的强度。 两者之间的区别非常微妙,但却非常重要,因为即使两个热点结果高度相似(许多相应要素具有相同的显著性级别),但仍然几乎不存在关联或依赖。 这将显示在下图中的两个热点结果图层中。

由于每个结果中的 25 个面中有 23 个面匹配类别,因此这两个结果高度相似。 但是,由于每个结果中的 25 个面中有 24 个面为冷点,因此即使潜在热点结果独立且不相关,也至少会存在 23 个匹配面。 这意味着尽管几乎每个面都具有匹配类别,但无法证明结果在统计上具有关联性。 可以得出结论,这两个变量几乎完全为冷点,仅存在一个孤立的热点,但无法证明它们之间存在关系或关联。

相似但不关联的结果
在两个热点结果图层中,每个图层中的红色面为热点,蓝色面为冷点。

在下图的两个热点结果中,25 个面中有 23 个面同样匹配,因此其相似度与第一组结果相同。 但是,其中 22 个匹配针对冷点,1 个匹配针对热点。 由于每个结果中只有两个热点,因此热点不太可能偶然对齐得如此紧密。 由此证明结果之间存在潜在关系和关联。 虽然这种关系不一定是因果关系,但是可以通过更改一个结果的值来影响另一个结果的值。 例如,如果一个热点结果代表婴儿死亡率的热点和冷点,而另一个代表污染的热点和冷点,则变量之间的强关联表明婴儿死亡率可能会随着污染水平的降低而降低。 再比如,如果这两个热点结果代表连续年份的污染水平,则此关联可以解释为污染水平向北和向东移动。

相似和关联的结果

热点结果之间的相似度由介于 0 和 1 之间的相似度值来衡量。 如果两个结果中的许多对应要素具有相同的显著性级别,则该值将接近于 1,如果许多对应要素没有匹配的显著性级别,则该值将接近于 0。 关联由 kappa 值衡量:强关联结果的 kappa 值接近 1,不关联(独立)结果的 kappa 值接近 0(或略为负)。 kappa 值是相似度值的重新缩放版本,它考虑了空间聚类和类别频率,以便隔离热点结果之间的统计关联。 作为参考,以上第一组热点结果的 kappa 值约等于 0,第二组结果的 kappa 值约等于 0.6。

排除不显著的要素

当热点结果由单个类别主导时(如上例),最常见的是它为非显著类别。 但是,如果不显著的要素不在研究兴趣范围内,您可能不希望相似度和 kappa 值简单地反映两个结果中不显著区域的丰度。 为防止出现这种情况,如果两个热点结果在统计上都不显著,您可以使用排除不显著的要素参数从比较中排除任何一对相应要素。 如果排除,则该工具将计算条件相似度和 kappa 值,这些值仅比较具有统计显著性的热点和冷点,以精确反映其相似度和关联度。 显著性级别类别的计数和总体比例将会影响相似度和 kappa 值,因此在排除大量非显著要素之前,需要考虑结果。

模糊相似度

当比较两个相应要素时,结果可以不仅仅是指示要素是否具有相同显著性级别类别的简单二进制(是或否)。 相似度和关联度的计算将使用模糊集合隶属度,以允许基于显著性级别相似度和空间邻域的相应要素之间存在部分匹配。 例如,99% 的热点可以被认为是与其他 99% 热点的完美匹配,与 95% 热点的部分匹配,以及与 99% 冷点的完全不匹配。 如果两个相应要素不具有相同的显著性级别,但其相邻要素具有相同的显著性级别,则也可以将其视为基于距离相似度的部分匹配。 任何两个相应要素之间的整体相似度是其类别相似度乘以距离相似度。 有关计算的详细信息,请参阅以下空间模糊 kappa 部分。

类别相似度

每个热点结果中存在 7 个可能的显著性级别类别。 这些类别具有从 99% 热点到 99% 冷点的自然顺序,并且一些类别比其他类别更加相似。 类别相似度权重用于定义您认为不同显著性级别类别的相似程度。 每个结果组合(例如,90% 冷点与 95% 热点)的类别权重必须介于 0 和 1 之间,用于指示其相似度。 权重等于 1 的组合被视为完全匹配,权重等于 0 的组合被视为完全不同。 0 和 1 之间的值表示类别之间的部分相似度。 权重必须对称;例如,99% 热点和 95% 热点之间的权重必须等于 95% 热点和 99% 热点之间的权重。

如果两个类别的相似度权重等于 1,则相似度和关联度的计算会将其视为同一类别,因此您可以使用权重来组合不同的类别。 例如,要以 95% 的置信度执行两个热点分析,您可以将 90% 冷点类别、非显著类别和 90% 热点类别组合起来,对于类别的所有组合使用等于 1 的权重。 相似度值和 kappa 值会将 90% 冷点类别和 90% 热点类别视为非显著。 此外,如果您排除非显著要素,则与非显著类别组合的任何类别也将被排除。

通过在热点和冷点之间赋予较大的权重,您还可以反转冷点和热点关系。 当热点结果具有负相关性时,例如收入中位数的冷点与糖尿病的热点对齐,建议反转关系。

警告:

类别相似度权重仅影响相似度和 kappa 值的计算。 即使使用相似度权重组合显著性级别类别,消息表、输出图层符号系统和图表也会将它们视为单独的类别。 有关详细信息,请参阅以下工具输出部分。

可以使用相似度加权方法参数指定类别相似度权重。 可用选项如下:

  • 模糊权重 - 相似度权重将为模糊权限(非二元),并由显著性级别的接近程度决定。 所有热点都将完全不同于所有冷点和非显著要素(反之亦然)。 90%、95% 和 99% 热点和冷点之间的权重由正态分布上单侧拒绝区域的临界值比率确定;例如,95% 热点和 99% 热点之间的权重为 1.645/2.33 = 0.71。 有关类别之间的所有其他权重,请参阅以下权重矩阵弹出窗口部分中的第一张图片。 这是默认设置。
  • 精确显著性级别匹配 - 要素必须具有相同的显著性级别,才能被视为相似。 例如,99% 热点将被视为与 95% 和 90% 热点完全不同。
  • 组合 90%、95% 和 99% 显著性 - 具有 90%、95% 和 99% 热点的要素将被视为彼此完全相似,而具有 90%、95% 和 99% 冷点的所有要素将被视为彼此完全相似。 此选项将显著性等于或高于 90% 的所有要素视为相同(统计显著),将置信度低于 90% 的所有要素视为相同(不显著)。
  • 组合 95% 和 99% 显著性 - 具有 95% 和 99% 热点的要素将被视为完全相似,而具有 95% 和 99% 冷点的要素将被视为完全相似。 例如,90% 热点和 90% 冷点将被视为与更高的显著性级别完全不同。 此选项将显著性等于或高于 95% 的所有要素视为相同(具有统计显著性),将显著性低于 95% 的所有要素视为相同(非显著)。
  • 仅使用 99% 显著性 - 仅 99% 热点(或冷点)的要素才会被认为彼此完全相似。 此选项将显著性低于 99% 的所有要素视为不显著。
  • 反转热点和冷点关系 - 将使用默认模糊权重,但第一个热点结果的热点将被视为与第二个热点结果的冷点相似。 例如,一个结果中 99% 热点将被视为与另一个结果中的 99% 冷点完全相似,并与另一个结果中的 95% 和 90% 冷点部分相似。
  • 从表中获取权重 - 将使用由表图层的字段定义的权重。 该表将在输入权重表参数中提供,并且必须包含 CATEGORY1CATEGORY2WEIGHT 字段。 在类别字段中提供对(输入图层的 Gi_Bin 字段值)的显著性级别类别,并在权重字段中提供它们之间的相似度权重。 例如,[-3, -2, 0.6] 行将相似度权重值 0.6 分配给 99% 冷点与 95% 冷点组合。 如果表中未提供组合,则假设权重为 0。 可以从权重矩阵弹出窗口中导出该表。
  • 自定义权重 - 将使用类别相似度权重参数中提供的自定义相似度权重值。

权重矩阵弹出窗口

类别相似度权重参数允许您使用权重矩阵弹出窗口以交互方式查看和编辑权重。 当选择相似度加权方法参数的不同选项时,显示的权重将进行更新,因此您可以查看与每个选项关联的权重并进行任何编辑。 要打开弹出窗口,请单击该参数旁的自定义按钮。

类别相似度权重矩阵弹出窗口

要在显著性级别组合之间分配自定义权重,请单击关联的单元格,键入介于 0 和 1 之间的权重值,然后按 Enter 键。 要保持权重对称,您只能编辑矩阵左下半部分的单元格,并且权重将镜像到右上角的等效单元格。 下图显示了自定义权重的示例,这些权重使用与反转的冷点和热点关系相匹配的精确显著性级别(例如,95% 热点与 95% 冷点完全相似,与所有其他显著性级别完全不同):

与反转的冷点和热点关系相匹配的精确显著性级别

提供权重后,请单击确定或者单击弹出窗口外部以应用权重。 如果更改了任何权重,则相似度加权方法参数值将更改为自定义权重。 您也可以单击取消关闭按钮以关闭弹出窗口,而不应用更改。

导出按钮将打开一个浏览对话框,用于将权重值保存为一个表,以供以后通过从表中获取权重选项重用这些权重值。 要在将来重用自定义权重,建议您使用权重矩阵弹出窗口创建权重文件;然后使用权重表进行未来比较。

距离相似度

除了类别相似度之外,当要素不具有相同的显著性级别,但其邻域中的其他要素确实具有匹配的显著性级别时,距离相似度允许部分匹配。 因为热点分析是一种使用局部邻域的空间方法,所以每个要素的显著性级别是要素及其最近相邻要素值的表征,而不仅仅是要素。 从这个意义上说,如果任何相邻要素相似,则其应对其相邻要素的相似度有所贡献。

相邻要素的数目参数用于指定将在比较中使用的附加相邻要素的数目,并使用基于相邻要素排序的距离权重合并部分相似度。 该要素的距离权重等于 1,并且使用以下公式,每个附加相邻要素的权重都会持续下降:

距离权重公式

该公式中的等级为相邻要素的顺序,范围从 0(适用于正在进行比较的要素)到相邻要素的数目(适用于最远的相邻要素)。 例如,对于 4 个相邻要素(包含进行比较的要素为 5 个),将使用以下 5 个距离权重:5/5 (1)、4/5 (0.8)、3/5 (0.6)、2/5 (0.4 ) 和 1/5 (0.2)。

注:

对于面和线,质心之间的欧氏距离用于确定最近相邻要素的顺序。 如果输出空间参考为地理坐标系,则将使用质心之间的弦距离。 相邻要素的顺序(而非原始距离)将用于距离权重,以保留所有要素的相同期望相似度值,即使其相邻要素与进行比较的要素的距离不同也是如此。

工具输出

比较结果通过地理处理消息、输出要素的图层组和图表返回。

地理处理消息

这些消息将显示有关热点结果之间全局比较的信息。 这些消息显示如下信息:

  • 相似度值 - 一个介于 0 和 1 之间的值,用于衡量热点结果图层之间的整体相似度。 该值可以解释为任何一对对应要素具有相同显著性级别类别的模糊概率。 该值等于所有局部相似度值的平均值。
  • 期望相似度值 - 假设两个热点结果图层不关联(独立)的情况下的相似度期望值。 如果相似度值大于其期望值,则表明两个地图之间存在潜在依赖性。 该值主要是信息性的,用于在计算 kappa 值时缩放相似度值。 该值等于局部期望相似度值的平均值。
  • 空间模糊 Kappa - 热点分析变量之间关联的一种度量值,通过将相似度值按其期望值缩放计算得出。 完全关联的热点结果将具有值 1,而未关联(独立)的结果将具有接近 0 的值。 负值表示热点分析变量之间的负相关关系。 虽然该值没有下限,但实际上这些值很少小于 -3。 解释 kappa 值没有严格的规则,但是通常建议将高于 0.8 的值解释为几乎完美的关联,将 0.6 和 0.8 之间的值解释为强关联,将 0.4 和 0.6 之间的值解释为中等关联,将 0.2 和 0.4 之间的值解释为一般关联,将 0 到 0.2 之间的值解释为轻微关联,将负值解释为无关联(或者对于较大的负值,解释为负关联)。
  • 不显著要素数量 - 两个特征均不具有统计显着性的热点显著性级别对的数量。
    注:

    如果排除非显著要素,则不会将其包含在相似度、期望相似度或空间模糊 kappa 计算中。 标注将更改为条件相似度值条件期望相似度值条件空间模糊 Kappa排除的不显著要素数量,以指示这些值以具有统计显著性的要素为条件。

  • “类别权重表”消息表将显示每个热点显著性级别对之间的类别权重。 例如,下图显示了默认类别相似度加权方法的类别权重表:

    “类别权重表”消息

  • 热点显著性级别对(计数)消息表将显示每个热点显著性级别对的计数。 例如,在下图中,第一行第二列中的值 440 表示 440 个要素对在第一个热点结果中为 99% 冷点,在第二个结果中为 95% 冷点。 边框中的行和列总数指示每个热点结果中各显著性级别的总计数。

    “热点显著性级别对(计数)”消息

  • “热点显著性级别对(百分比)”消息表将显示与计数表相同的信息,但将计数转换为行总数的百分比。 例如,在下图中,上图中显示 440 的单元格现在显示 5.57 (440/7904 = 0.0557)。 当两个热点结果代表在不同时间测量的相同变量时,此表将非常有用。 在这种情况下,您可以通过该表查看类别在两次测量之间的时间过渡情况。 例如,下图显示了在第一个结果中为 99% 冷点的要素中,89.26% 保持为 99% 冷点,5.57% 变为 95% 冷点等。

    “热点显著性级别对计数(百分比)”消息

输出要素和图层组

输出要素将为输入热点结果图层的交集,并将包含用于汇总每对相应要素局部相似度和关联度的字段。 要素类将具有以下字段:

  • 热点 1 输入值 (GI_BIN_1) - 一个整数,表示来自第一个热点结果的要素的显著性级别类别。 该值的范围介于 -3(99% 冷点)到 3(99% 热点)。 此字段类型将为长整型。
  • 热点 2 输入值 (GI_BIN_2) - 一个整数,表示来自第二个热点结果的要素的显著性级别类别。 此字段类型将为长整型。
  • 热点 1 显著性级别 (GI_SIG_1) - 来自第一个热点结果的要素的显著性级别类别。 可能的值为:冷点 99%、冷点 95%、冷点 90%、非显著、热点 90%、热点 95% 和热点 99%。 此字段类型将为文本型。
  • 热点 2 显著性级别 (GI_SIG_2) - 来自第二个热点结果的要素的显著性级别类别。 此字段类型将为文本型。
  • 相似度值 (SIM_VALUE) - 要素对的局部相似度值。 该值将介于 0 和 1 之间。 此字段类型将为双精度型。
  • 期望相似度值 (EXP_SIM) - 要素对的期望相似度值。 该值将介于 0 和 1 之间。 此字段类型将为双精度型。
  • 空间模糊 Kappa (KAPPA) - 要素对的空间模糊 Kappa 值。 此字段类型将为双精度型。
  • 显著性级别组合 (CAT_PAIR) - 热点结果的显著性级别类别组合。 此字段用作以下两个图表的基础。 此字段类型将为文本型。

当该工具在地图中运行时,会将 3 个图层添加至一个图层组中,以便您在空间上探索相似度、关联度和显著性级别对。 第一个图层显示相似度值分为 0 到 1 之间的五个相等间隔,较低的相似度值以较深的颜色显示,以强调最不相似的区域。 第二个图层显示以等间隔和六类符号化的空间模糊 kappa 值。 第三个图层显示每个显著性级别组合与自定义符号系统,以识别要素,其中一个输入热点结果是具有统计显著性的热点,另一个是具有统计显著性的冷点(在自定义符号系统中,90%、95% 和 99% 为了减少组合的数量,不区分重要性)。 默认情况下,将启用第一个图层并禁用后两个图层。

比较结果的图层组

图表

最后一个图层带有两个图表,以供进一步研究结果之间的显著性级别组合。 这些图表显示与消息中的表格相同的信息,但图表将按计数和百分比着色以便于解释。 您还可以使用图表和地图之间的选项,例如,选择一个结果中 99% 的热点和另一个结果中 99% 的冷点的所有要素,以指示可能的最大差异。

“热点显著性级别对计数”热点图将显示每个显著性级别组合的计数,蓝色阴影越深,则计数越高。 例如,在下图中,计数最大的对为冷点 99% 到 99% 冷点(左上)、非显著到非显著(中间)和热点 99% 到热点 99% (右下)。

“热点显著性级别对计数”热点图

热点 1 级别类别条形图内的热点 2 级别计数将显示堆叠的水平条,以可视化第一个结果类别内第二个热点结果的各显著性级别类别计数。 例如,在下图中,大多数 99% 的热点和冷点为显着热点和冷点(顶部和底部条柱大部分分别为蓝色和红色)。 但是,与第一个结果中的非显著要素相比,第二个结果中匹配的热点多于冷点(中间条柱的红色多于蓝色)。 如果两个热点结果图层表示在不同时间测得的温度,这可能表明研究区域在每次测量之间普遍变暖。

热点 1 级别类别条形图内的热点 2 级别计数

空间模糊 Kappa

热点结果图层之间的关联由 kappa 值测量,该值量化了在两个结果独立的情况下,与您期望的结果相似度相比较的相似度。 由于大量的特定类别和类别的空间聚类,相似度值可能较高。 kappa 值将针对类别频率和空间聚类进行校正,以更加精确地衡量热点结果图层之间的潜在关联度。

将根据以下公式,按其期望值重新调整相似度值来计算 Kappa 值:

Kappa 公式

如果热点结果图层完全相似(相似度等于1),则 Kappa 值也等于1,指示完全关联。 如果相似度值等于其期望值,则 Kappa 值将为 0,指示结果不关联且独立。 如果相似度值小于期望值,则 Kappa 值将为负,指示热点结果之间存在负关联。

Kappa 统计最初是为了使用李克特量表测试评分者的一致性和可靠性而开发的 (Cohen 1960)。 kappa 统计的第一个版本针对类别频率进行了校正(一些李克特评级比其他评级更常见),但假设每个评级均独立。 在 2000 年代初期对其进行了增强,以整合类别和距离相似度,用于比较类别栅格(Hagen 2003,235-249)(Hagen-Zanker、Straatman 和 Uljee 2005,769-785)(Hagen-Zanker 2009,61-73)(Dou et. al. 2007,726-734)。 然而,这些增强功能仍然假设类别不在空间上聚集,这对于热点分析结果和大多数其他空间类别变量而言并非如此。 热点分析比较工具将 kappa 统计增强为空间模糊 kappa 统计,用于说明每个热点结果内显著性级别类别的类别聚类(自相关)。

相似度值计算

将针对热点分析结果中的每对相应要素计算局部相似度值。 全局相似度值是所有局部相似度值的平均值。

当相应要素各自具有相同的显著性级别类别(或者具有已按相似度权重组合的类别)时,要素对的相似度值将等于 1。 当第一个结果的所有相邻要素与第二个结果的所有相邻要素(例如,第一个结果中的所有热点和第二个结果中的所有冷点)具有完全不同的显著性级别类别时,相似度值将等于 0。 所有其他情况将导致相似度值介于 0 和 1 之间。

对于每对要素,相似度值涉及计算两个方向的相似度值并取两者中较小的一个。 第一方向相似度是从第一个结果到第二个结果的相似度,第二个方向相似度是从第二个结果到第一个结果的相似度。 每个相似度的计算都需要对一个结果的要素类别与另一个结果的相应要素及其每个相邻要素进行比较。 对于对应要素及每个相邻要素,会将类别权重乘以距离权重,并且最大结果将为方向相似度值。

例如,下图显示了两个热点结果 A 和 B。 A 和 B 各自具有 3 个要素:一个热点(红色)、一个冷点(蓝色)和一个非显著要素(浅灰色)。 最大的面为第一个要素对,最小的面为第二个要素对,中等面为第三个要素对。 显示面的质心有助于确定比其他面更近的面;第一个面比第三个面更接近第二个面。

相似度计算示例

对于本示例,假设匹配类别(热点到热点、冷点到冷点以及非显著到非显著)之间的类别权重为 1,热点和冷点之间的权重为 0,非显著要素的权重为热点和冷点的 1/2。

下表显示了从结果 A 到结果 B 的方向相似度的类别权重、距离权重和相似度。 通过将距离权重和类别权重相乘来计算最后一列中的相似度值:

组合距离权重类别权重相似度

A1 至 B1

1(相应要素)

0(冷点到热点)

0

A1 至 B2

2/3(第一个相邻要素)

1/2(冷点到非显著)

1/3 = 0.33

A1 至 B3

1/3(第二个相邻要素)

1(冷点到冷点)

1/3 = 0.33

从结果 A 到结果 B 的最大相似度为 0.33,这出现在两个相邻要素组合中。 下表显示了从结果 B 到结果 A 的方向相似度。

组合距离权重类别权重相似度

B1 至 A1

1(相应要素)

0(热点到冷点)

0

B1 至 A2

2/3(第一个相邻要素)

1(热点到热点)

2/3 = 0.67

B1 至 A3

1/3(第二个相邻要素)

1/2(热点到非显著)

1/6 = 0.17

从结果 B 到结果 A 的最大相似度为 0.67。

要素对的局部相似度值是两个方向相似度(A 到 B 和 B 到 A)中较小的一个,因此第一个要素对的相似度值为 0.33。 同样的过程也用于计算第二个和第三个要素对的相似度值,对于本示例,两者的相似度值均等于 0.5。 全局相似度值是所有要素对相似度值的平均值,对于本示例,全局相似度值为 4/9 = 0.44。

如果排除非显著要素,则不会计算其相似度值,也不会将其计入全局相似度值的平均值;但是,在计算未排除要素的相似度值时,它们仍将用作相邻要素。

注:

此示例使用了只有 3 个要素对和 3 个显著性级别类别的热点结果以减少组合数量。 但是,至少需要 20 个要素对才能使用该工具,并且必须在所有 7 个显著性级别类别之间提供类别权重。

期望相似度值计算

对于每个要素,期望相似度值的计算将使用与相似度值相同的过程;但是,第一个结果的要素将与第二个结果中的随机要素,而非其相应要素配对。

随机邻域
第一个热点结果的每个要素将与第二个结果的多个要素随机配对。

通过比较随机邻域,期望值将考虑类别频率(更有可能随机选择更常见的类别)和邻域内的类别聚类(随机邻域可能包含具有相似显著性级别类别的要素聚类)。 在假设两个热点结果独立的情况下,每个随机配对的相似度值是对相似度值的单一估计。 要计算要素的期望相似度值,需要将第一个结果的每个要素与许多随机相邻要素进行配对,并计算随机相似度值的平均值。 置换检验次数参数将指定每个要素的随机配对数。 较大的置换检验次数将增加工具的运行时间并提高期望相似度和 Kappa 值的精度。

全局期望相似度值是所有要素对的期望相似度值的平均值。 如果排除非显著要素,则将永远不会选择已排除的要素作为随机相邻要素,并且不会计算其期望相似度值;但是,仍然可以包含它们作为随机选择的要素的相邻要素。

注:

在假设两个结果之间独立的情况下,全局期望相似度值是对真实全局期望值的无偏差估计。 但是,由于重叠邻域之间的相关性,全局期望值的方差将与全局相似度值的方差不同。 这意味着对于此过程,全局相似度值的传统基于等级的置换 p 值无效。 加强支持显著性测试的方法是一个活跃的研究领域。

最佳做法和限制

在使用此工具时,请考虑以下问题:

  • 类别相似度权重的选择以及是否排除非显著要素应该基于您希望通过执行比较来回答的问题。 您不应选择仅用于最大化或最小化热点结果之间相似度或关联度的值和选项。 例如,虽然您可以使用类别相似度权重来组合 99% 热点和 90% 冷点类别,但是比较可能无法回答有意义的问题,除非存在某种理由相信应该考虑一个结果中的 99% 热点类似于另一个结果中的 90% 冷点。 同样,排除或包括非显著要素应根据非显著区域是否代表感兴趣的研究领域来确定。
  • 如果任一输入热点结果图层包含重叠面,则重叠部分将相交成新要素。 由此会导致相似度值不等于 1,即使对于具有相同显著性级别类别的结果图层也是如此。 可以使用 XY 容差环境以移除意外重叠,例如地理编码错误。 建议您查看输出要素中的要素数量以确定交叉点是否多于预期。
  • 如果两个热点结果为不同大小的面,则交叉点会将较大的面细分为许多较小的面。 由此会更改显著性级别类别的计数并影响相似度和关联度。 必须至少存在 20 个要素交叉点,才能使用该工具。
  • 更改输入热点结果的顺序不会影响相似度值,但由于置换检验次数的随机性,期望相似度和 kappa 值会略有变化。 消息表和图表的轴也会反转,这在某些情况下更容易解释。 由于消息和图表将在第一个结果的类别中显示第二个热点结果的显著性级别类别计数,因此通过反转输入图层的顺序,可以在第二个结果的类别内显示第一个结果的类别。

参考资料

Cohen, Jacob. 1960. "A coefficient of agreement for nominal scales." Educational and Psychological Measurement. 20:1, 37-46. https://doi.org/10.1177/001316446002000104.

Dou, Weibei, Yuan Ren, Qian Wu, Su Ruan, Yanping Chen, Daniel Bloyet, and Jean-Marc Constans. 2007. "Fuzzy kappa for the agreement measure of fuzzy classifications." Neurocomputing. 70, 726-734. https://dx.doi.org/10.1016/j.neucom.2006.10.007.

Hagen, Alex. 2003. "Fuzzy set approach to assessing similarity of categorical maps." International Journal of Geographical Information Science. 17:3, 235-249. https://doi.org/10.1080/13658810210157822.

Hagen-Zanker, Alex, Bas Straatman, and Inge Uljee. 2005. "Further developments of a fuzzy set map comparison approach." International Journal of Geographical Information Science. 19:7, 769-785. https://doi.org/10.1080/13658810500072137.

Hagen-Zanker, Alex. 2009. "An improved Fuzzy Kappa statistic that accounts for spatial autocorrelation." International Journal of Geographical Information Science. 23:1, 61-73. https://doi.org/10.1080/13658810802570317.