查找热点

大数据分析中的可用工具图标

“查找热点”工具 “查找热点”工具 将使用 Getis-Ord Gi* 统计来标识数据空间模式中具有统计显著性的热点和冷点。

工作流示意图

“查找热点”工作流示意图

示例

以下是“查找热点”工具的用例:

  • 警方正在执行分析,以确定暴力犯罪是否与失业率有关。 将为暴力犯罪和失业多发区域内的高中执行扩展的暑期工作计划。 “查找热点”工具可以用于查找具有统计显著性犯罪和失业热点的区域。
  • 一位保护官员正在研究树木病害,以优先考虑森林中的哪些区域应接受治疗,并了解有关存在某些抵抗力的区域的详细信息。 “查找热点”工具可用于查找病株(热点)和健康株(冷点)的聚类。

用法说明

使用“查找热点”工具时,请谨记以下内容:

  • 输入要素必须为点图层。 点将在分析之前聚合成指定大小的方形格网(立方图格)。
  • 输出图层将提供其他字段,包含诸如每个要素的统计显著性、p 值和 z 得分等®信息。
  • 在分析过程中,输入点将聚合到指定大小的图格中。 然后,对其进行分析以确定热点。 经过聚合的图格必须包含多种值(一个图格中的点计数应该是高度可变的)。
  • Z 得分和 p 值都是统计显著性的度量,可指示观测所得的高值或低值的空间聚类是否比在这些相同值的随机分布中预期的更加明显。 然后,可以使用聚合图格来确定是接受还是拒绝 null 假设。 Z 得分和 p 值字段不体现任何类型的错误发现率 (FDR) 校正。
  • 如果要素的 z 得分高而 p 值小,则表示点事件密集存在。 如果 z 得分低并为负数且 p 值小,则表示不存在点事件。 z 得分越高(或越低),聚类密集程度就越大。 如果 z 得分接近零,则表示不存在明显的空间聚类。
  • z 得分基于随机化零假设进行计算。 有关 z 得分的详细信息,请参阅什么是 z 得分? 什么是 p 值?
  • “查找热点”工具允许使用时间步长来进行分析。 每个时间步长将独立于时间步长外的要素进行分析。 要使用时间步长,输入数据必须已启用时间且能够表示时刻。 应用时间步长后,输出要素将为 StartTimeEndTime 字段表示的时间间隔。
  • 时间步长参考参数可以是日期和时间值或仅为日期值,但不可仅为时间值。

参数

以下是“查找热点”工具的参数:

参数描述数据类型

输入图层

将要计算热点的点要素。

要素

图格类型

将用于创建常规图格的图格形状。 默认值为正方形

字符串

图格大小

表示用于分析输入点的图格大小的距离间隔。

字符串

邻域大小(可选)

分析邻域的空间范围。 该值用于确定将哪些要素一起用于分析以便访问局部聚类。

字符串

时间步长间隔(可选)

时间步长的间隔。 仅当输入点的方案具有标记为 Start Time 关键字段的字段时,才会使用此参数。

字符串

时间步长对齐(可选)

指定时间步长的对齐方式。 仅当在输入点启用了时间且表示时刻时,此参数才可用。

  • 开始时间 - 时间步长与第一次时间事件对齐,并向前聚合时间。
  • 结束时间 - 时间步长与最后一次时间事件对齐,并向后聚合时间。
  • 参考时间 - 时间步长与指定日期和时间对齐。 如果输入要素中的所有点的时间戳大于您所提供的参考时间(或时间戳刚好位于输入要素的开始时间),则时间步长间隔将以该参考时间为开始时间,并向前聚合时间(与使用开始时间对齐的效果相同)。 如果输入要素中的所有点的时间戳小于您所提供的参考时间(或时间戳刚好位于输入要素的结束时间),则时间步长间隔将以该参考时间为结束时间,并向后聚合时间(与使用结束时间对齐的效果相同)。 如果提供的参考时间处于数据时间范围的中间,则将以提供的参考时间结束时间步长间隔的创建(与使用结束时间对齐的效果相同);其他间隔将在参考时间前后进行创建,直到覆盖数据的完整时间范围为止。

字符串

时间步长参考(可选)

要对齐的时间步长和时间间隔的参考时间。 仅当针对时间步长对齐参数使用参考时间时,才会显示此参数。

日期

输出图层

输出图层将包含以下字段以代替原始字段:

字段名描述字段类型

value

该图格中的要素数。

Float64

GiZScore

该图格中要素的 z 得分

Float64

GiPValue

该图格中要素的 p 值

Float64

Gi_Bin

用于标识具有统计显著性的热点和冷点的置信度。 Gi_Bin 值为 +/-3 的要素反映置信度为 99% 的统计显著性;Gi_Bin 值为 +/-2 的要素反映置信度为 95% 的统计显著性;Gi_Bin 值为 +/-1 的要素反映置信度为 90% 的统计显著性;Gi_Bin 值为 0 的要素的聚类则没有统计学意义。

Float64