查找相似位置

大数据分析中的可用工具图标

“查找相似位置”工具 “查找相似位置”工具 可根据要素属性来标识与单个或多个参考要素最相似或者最不相似的候选要素。

工作流示意图

查找相似位置工作流示意图

示例

以下是“查找相似位置”工具的用例:

  • 根据数值型属性值之间的关系,确定您的生产设施中与生产效率最高的设施最相似的生产设施。
  • 犯罪分析师希望搜索所有犯罪的数据库,以确定某近期罪行是否属于较重犯罪形式或有重罪趋势。
  • 根据受疾病影响最严重的村庄的特征,确定其他存在较高疾病风险的村庄。

用法说明

使用“查找相似位置”工具时,请谨记以下信息:

  • 可使用表格、点、折线或面要素。
  • 搜索(候选)要素为必需项,并将按与参考位置的相似性或相异性来划分等级。
  • 最多将返回 10,000 个搜索图层要素。
  • 如果目标图层(参考位置要素)参数值中存在多个要素,则匹配将基于平均参考要素值。 例如,如果存在两个参考要素,并且其中一个分析字段属性为人口变量,那么工具会搜索人口数与平均人口值接近的连接图层(候选搜索要素)参数值。 例如,如果人口值为 100 和 102,那么工具会搜索人口数接近 101 的候选要素。
    注:

    如果目标图层(参考位置要素)参数中存在多个要素,则对于具有相似值的属性,请选择相似性依据(分析字段)。 例如,如果其中一个要素的人口值为 100,另一个要素的人口值为 100,000,则工具将搜索人口数接近两者平均值 50,050 的匹配。 此平均值远未达到两个图层中任一图层的人口值。

  • 可使用相似性参数,分别通过最相似最不相似选项来搜索与参考要素最相似的要素或者最不相似的要素。 在某些情况下,您可能希望看见上述两者。 例如,如果相似性参数值为 3 且相似性参数值已设置为最相似和最不相似,则工具将查找三个最相似和三个最不相似的候选要素。
  • 输出中给出的任何匹配解决方案均是与参考要素最相似或最不相似的解决方案;单个解决方案不会同时出现两种情况(匹配的解决方案不会在输出要素中重复)。 因此,如果相似性参数值为最相似和最不相似,则可能出现的匹配结果的最大数量(结果数量)将是连接图层数量的一半。
  • 匹配方法参数的两个选项为:
    • 属性值 - 最相似的候选要素会具有所有分析字段属性的最小平方差总和。 计算差异之前,所有值均为标准化值。
    • 属性剖面 - 将测量余弦相似性。 余弦相似性将在标准化属性值间搜索相同关系,而并非尝试匹配量级。 例如,存在名为 A1、A2 和 A3 的三个分析字段。 A2 是 A1 的两倍,且 A3 与 A2 几乎相等。 如果匹配方法参数设置为属性剖面,则该工具将搜索具有属性关系的候选要素:A2 是 A1 的两倍,A3 与 A2 几乎相等。 由于该方法用于查找属性关系,您必须至少指定两个分析字段属性。 您可以使用余弦相似性方法(属性剖面选项)来查找与洛杉矶相似但比例不同的地方;例如您对人口资料感兴趣的地方,这里车辆数与居民数的比值小于 20。 余弦相似性的指数范围在 1.0(完全相似)和 -1.0(完全不相似)之间。 将余弦相似性指数写入输出要素的 simindex 字段。
  • 相似性依据参数应为数值型字段,且必须以相同字段名和相同字段类型同时存在于参考位置要素(目标图标)和候选搜索(连接图层)数据集中。 如果该工具未找到与候选搜索(连接图层)要素相对应的字段,则将显示验证警告,指示必须存在相同的字段名。
  • 将所有用于匹配的属性均写入输出。 可以使用追加字段参数来指定要添加到输出表中的字段。 默认情况下,将添加所有字段。 可以使用追加字段参数从想要添加的连接图层中选择指定字段。

参数

以下是“查找相似位置”工具的参数:

参数描述数据类型

目标图层(参考位置要素)

包含参考要素的目标图层。 通过使用参考位置表达式参考位置范围参数(如下所示),可以进一步减少或过滤参考要素。

要素

连接图层(候选搜索要素)

包含搜索或候选要素的连接图层。 该工具将评估搜索要素,以查找与目标图层(参考要素)参数具有相似分析字段属性值的要素。

要素

参考位置表达式

一个 Arcade 属性表达式,将对其进行评估以过滤要保留的目标图层(参考要素)。 表达式在可通过单击配置 Arcade 表达式访问的 Arcade 表达式构建器中进行配置。

将对每个记录进行评估并保留评估为 true 的记录,丢弃评估为 false 的记录。

字符串(Arcade 表达式)

参考位置范围

可以提供范围以过滤参考位置。 仅在为此参数指定的参考空间范围内的参考要素将被保留为参考要素。

在工具配置中,有一个范围选择器组件,可用于绘制参考位置范围。

EsriJSON 包络矩形

相似性依据

指定感兴趣的一个或多个数值属性(分析字段)。 将针对目标图层(参考位置要素)参数值来计算这些属性字段中显示的值。

然后,将对连接图层(候选搜索要素)参数中的要素进行评估,以确定与参考要素最相似或最不相似的搜索要素。

字符串(字段名)

相似

指定从此工具返回的结果是否将与为指定分析字段提供的目标图层(参考位置要素)参数值最相似或最不相似。

可返回的最大结果数量为 10,000。

可以选择相似最不相似或者最相似和最不相似选项以返回要素。

整型和字符串

匹配方法

提供了两种匹配方法:

  • 属性值 - 最相似的候选要素会具有所有分析字段属性的最小平方差总和。 计算差异之前,所有值均为标准化值。
  • 属性剖面 - 将测量余弦相似性。 余弦相似性将在标准化属性值间搜索相同关系,而并非尝试匹配量级。 例如,存在名为 A1、A2 和 A3 的三个分析字段。 A2 是 A1 的两倍,且 A3 与 A2 几乎相等。 如果匹配方法参数值为属性剖面,该工具会搜索具有同样属性关系的候选要素:A2 是 A1 的两倍,A3 与 A2 几乎相等。 由于该方法用于查找属性关系,您必须至少指定两个属性值属性。 您可以使用余弦相似性方法(属性剖面选项)来查找与洛杉矶相似但比例不同的地方;例如您对人口资料感兴趣的地方,这里车辆数与居民数的比值小于 20。 余弦相似性的指数范围在 1.0(完全相似)和 -1.0(完全不相似)之间。 将余弦相似性指数写入输出要素的 simindex 字段。

字符串

追加字段

将所有用于匹配的属性均写入输出。 追加字段参数用于指定要添加到输出表中的特定字段。 默认情况下,将添加所有字段。 可以使用追加字段参数从想要添加的连接图层(候选搜索要素)参数值中选择指定字段。

字符串(字段名)

参考 ID 字段

(可选)

包含目标图层(参考位置要素)方案中唯一 ID 的字段。

如果未选择字段,则该工具将为要素生成唯一 ID。

字符串(字段名)

候选 ID 字段

(可选)

包含连接图层(候选搜索要素)方案中唯一 ID 的字段。

如果未选择字段,则该工具将为要素生成唯一 ID。

字符串(字段名)

输出图层

目标图层(参考位置要素)参数中的所有要素和连接图层(候选搜索要素)参数中的匹配以及相似性依据附加字段参数中的属性将写入输出要素。 此外,下列字段也包含在输出要素中:

字段名描述备注

location_type

一个字符串,指示要素是目标参考要素还是连接搜索(候选)要素。

simrank

如果针对相似性参数选择最相似最相似和最不相似,则所有匹配的解决方案均按照相似度由高到低的顺序进行等级划分。 最相似的解决方案匹配的等级值为 1。

如果针对相似性参数选择最不相似最相似和最不相似,则该字段将仅包含在输出要素中。

dissimrank

如果针对相似性参数选择最不相似最相似和最不相似,则所有匹配的解决方案均按照相似度由低到高的顺序进行等级划分。 最不相似的解决方案的等级值为 1。

如果针对相似性参数选择最不相似最相似和最不相似,则该字段将仅包含在输出要素中。

simindex

该字段量化了每个匹配解决方案与目标参考要素的相似程度。 如果将属性值指定为匹配方法参数值,则该值表示值平方差总和。

如果为匹配方法参数选择了属性值,则该字段将仅包含在输出要素中。

cosimindex

该字段量化了每个匹配解决方案与目标要素的相似程度。 如果为匹配方法参数指定了属性剖面,则该值表示余弦相似性。

如果为匹配方法参数选择了属性剖面,则该字段将仅包含在输出要素中。

labelrank

该字段仅用于显示。 此工具使用该字段为分析结果提供默认渲染。

reference_id

目标参考要素的唯一 ID 值。 连接搜索(候选)要素被赋予空值。

如果未指定参考 ID 字段参数,则将为参考要素生成唯一 ID 值。

search_id

连接搜索(候选)要素的唯一 ID 值。 目标参考要素被赋予空值。

如果候选 ID 字段参数未指定,则将为候选或搜索要素生成唯一 ID 值。