计算比率 (空间统计)

摘要

计算粗率或平滑率。 全局经验贝叶斯比率方法将比率平滑至全局参考比率。 局部经验贝叶斯、局部加权平均值和局部加权中值比率方法使用局部相邻要素来对比率进行空间平滑。

详细了解计算比率的工作原理

使用情况

  • 如果输入表或要素参数值是表,则比率方法参数的选项将仅限于粗率全局经验贝叶斯局部经验贝叶斯局部加权平均值局部加权中值选项仅对空间数据有效。

  • 该工具提供了多个邻域类型参数选项。 但是,要进一步自定义邻域,请使用 Neighborhood Explorer 配置邻域并导出 .swm 文件。 使用该 .swm 文件作为空间权重矩阵参数值。

  • 如果比率值很小,则可能难以解释。 使用比率乘数参数可缩放比率或报告每个特定人口单位的比率。 例如,如果比率乘数值为 10,000,则比率将报告为每 10,000 人的数字。

  • 如果选择空间平滑率方法,则每个焦点特征将包含在其自己的邻域中。 例如,如果邻域类型参数值为 K 最近相邻要素相邻要素数量参数值为 7,则每个要素将有一个包含 8 个要素的邻域。 整个邻域用于计算焦点要素的比率。

  • 如果比率方法参数设置为局部经验贝叶斯局部加权平均值局部加权中值,则输出将包含 Number of Non-Null Neighbors 字段。 此字段包含人口字段计数字段参数值中没有负值或空值的相邻要素数量(包括焦点要素)。

  • 人口字段值中值为 0 的要素将收到空的粗率值。

  • 如果比率方法参数设置为局部加权平均值局部加权中位数,则输出将包含 Fill Missing Value 字段。 此字段指示是否为具有负数或空计数字段人口字段值的要素估算了比率。

参数

标注说明数据类型
输入表或要素

包含用于计算比率的计数字段和人口字段的表或要素。

Table View
比率字段

将用于计算比率的计数和人口字段。

Value Table
将字段附加到输入
(可选)

指定是将字段追加到输入数据集还是将其另存为输出表或要素类。

  • 选中 - 字段将附加到输入要素。 将修改输入数据。
  • 未选中 - 将创建包含字段的输出表或要素类。 这是默认设置。

Boolean
输出表或要素
(可选)

包含比率和有助于评估比率的附加字段的输出表或要素类。

Feature Class; Table
比率方法
(可选)

指定将用于计算比率的方法。

  • 粗率比率将通过计数字段值除以人口字段值来计算。 这是默认设置。
  • 全局经验贝叶斯比率将是原油比率和全球平均比率的加权平均值。 权重取决于要素的人口规模。
  • 局部经验贝叶斯该比率将是焦点要素的粗率和其邻域的加权平均比率的加权平均值。
  • 局部加权平均这些比率将是每个要素及其邻域的空间加权平均比率。
  • 局部加权中值这些比率将是每个要素及其邻域的空间加权中值比率。
String
概率分布

指定计数字段的概率分布。

  • 泊松假设计数字段遵循泊松分布。 这是默认设置。
  • 二项式假设计数字段服从二项式分布。
String
邻域类型
(可选)

指定用于识别每个要素的相邻要素的方法。

  • 距离范围应用阈值距离来识别相邻要素。 位于焦点要素阈值距离内的所有要素均被视为相邻要素。 如果输入包含点或线要素,则这是默认值。
    固定距离
  • 仅限邻接边共享边界或重叠要素的面要素将成为该要素的相邻要素。
    仅邻接边
  • 邻接边拐角与要素重叠、共享边界或共享折点的要素为该要素的相邻要素。 如果输入包含面要素,则这是默认值。
    邻接边拐角
  • K 最近邻域每个要素都分配有相同数量的相邻要素 k。 距离要素最近的 k 个要素将成为其相邻要素。
    K - 最近邻
  • Delaunay 三角测量可以根据要素质心创建不重叠的三角网。 每个要素是一个三角形结点,具有公共边的结点被视为邻域。
    修剪型 Delaunay 三角测量
  • 通过文件获取空间权重要素之间的空间关系在空间权重矩阵 (.swm) 文件中定义。
String
距离范围
(可选)

将用于搜索相邻要素的每个要素的距离。 此距离内的所有要素都将作为相邻要素包含在内。

Linear Unit
相邻要素的数目
(可选)

将包含在要素邻域中的邻域数量。

Long
空间权重矩阵
(可选)

定义要素间空间关系的空间权重矩阵文件的路径和文件名。

File
局部权重方案
(可选)

指定将在计算局部统计数据时应用于相邻要素的加权方案。

  • 未加权将不会对相邻要素进行加权。 这是默认设置。
  • 双平方将使用双平方核方案对相邻要素进行加权。
  • 高斯函数将使用高斯核方案对相邻要素进行加权。
String
核带宽
(可选)

双平方或高斯局部加权方案的带宽。 如果未提供任何值,则将在处理过程中估算一个值,并将其作为地理处理消息包含在内。

Linear Unit
比率乘数

将乘以比率的常数值。 此参数可用于缩放比率或报告每个特定人口单位的比率。 例如,当值设置为 10,000 时,比率将报告为每 10,000 人的数字。

Long

派生输出

标注说明数据类型
更新的输入表

已更新的输入表。

Table View
输出图层组

如果为输入表或要素参数指定了要素类,则输出图层组,其中包含在比率字段参数中指定的每个比率的图层。

Group Layer

arcpy.stats.CalculateRates(in_table, rate_fields, {append_to_input}, {out_table}, {rate_method}, probability_distribution, {neighborhood_type}, {distance_band}, {number_of_neighbors}, {weights_matrix_file}, {local_weighting_scheme}, {kernel_bandwidth}, rate_multiplier)
名称说明数据类型
in_table

包含用于计算比率的计数字段和人口字段的表或要素。

Table View
rate_fields
[[count_field, population_field],...]

将用于计算比率的计数和人口字段。

Value Table
append_to_input
(可选)

指定是将字段追加到输入数据集还是将其另存为输出表或要素类。

  • APPEND字段将附加到输入要素。 将修改输入数据。
  • NO_APPEND将创建包含字段的输出表或要素类。 这是默认设置。
Boolean
out_table
(可选)

包含比率和有助于评估比率的附加字段的输出表或要素类。

Feature Class; Table
rate_method
(可选)

指定将用于计算比率的方法。

  • CRUDE_RATE比率将通过计数字段值除以人口字段值来计算。 这是默认设置。
  • GLOBAL_EMPIRICAL_BAYES比率将是原油比率和全球平均比率的加权平均值。 权重取决于要素的人口规模。
  • LOCAL_EMPIRICAL_BAYES该比率将是焦点要素的粗率和其邻域的加权平均比率的加权平均值。
  • LOCALLY_WEIGHTED_AVERAGE这些比率将是每个要素及其邻域的空间加权平均比率。
  • LOCALLY_WEIGHTED_MEDIAN这些比率将是每个要素及其邻域的空间加权中值比率。
String
probability_distribution

指定计数字段的概率分布。

  • POISSON假设计数字段遵循泊松分布。 这是默认设置。
  • BINOMIAL假设计数字段服从二项式分布。
String
neighborhood_type
(可选)

指定用于识别每个要素的相邻要素的方法。

  • DISTANCE_BAND应用阈值距离来识别相邻要素。 位于焦点要素阈值距离内的所有要素均被视为相邻要素。 如果输入包含点或线要素,则这是默认值。
    固定距离
  • CONTIGUITY_EDGES_ONLY共享边界或重叠要素的面要素将成为该要素的相邻要素。
    仅邻接边
  • CONTIGUITY_EDGES_CORNERS与要素重叠、共享边界或共享折点的要素为该要素的相邻要素。 如果输入包含面要素,则这是默认值。
    邻接边拐角
  • K_NEAREST_NEIGHBORS每个要素都分配有相同数量的相邻要素 k。 距离要素最近的 k 个要素将成为其相邻要素。
    K - 最近邻
  • DELAUNAY_TRIANGULATION可以根据要素质心创建不重叠的三角网。 每个要素是一个三角形结点,具有公共边的结点被视为邻域。
    修剪型 Delaunay 三角测量
  • GET_SPATIAL_WEIGHTS_FROM_FILE要素之间的空间关系在空间权重矩阵 (.swm) 文件中定义。
String
distance_band
(可选)

将用于搜索相邻要素的每个要素的距离。 此距离内的所有要素都将作为相邻要素包含在内。

Linear Unit
number_of_neighbors
(可选)

将包含在要素邻域中的邻域数量。

Long
weights_matrix_file
(可选)

定义要素间空间关系的空间权重矩阵文件的路径和文件名。

File
local_weighting_scheme
(可选)

指定将在计算局部统计数据时应用于相邻要素的加权方案。

  • UNWEIGHTED将不会对相邻要素进行加权。 这是默认设置。
  • BISQUARE将使用双平方核方案对相邻要素进行加权。
  • GAUSSIAN将使用高斯核方案对相邻要素进行加权。
String
kernel_bandwidth
(可选)

双平方或高斯局部加权方案的带宽。 如果未提供任何值,则将在处理过程中估算一个值,并将其作为地理处理消息包含在内。

Linear Unit
rate_multiplier

将乘以比率的常数值。 此参数可用于缩放比率或报告每个特定人口单位的比率。 例如,当值设置为 10,000 时,比率将报告为每 10,000 人的数字。

Long

派生输出

名称说明数据类型
updated_table

已更新的输入表。

Table View
output_layer_group

如果为参数指定了 in_table 要素类,则输出图层组,其中包含 rate_fields 参数中指定的每个比率的图层。

Group Layer

代码示例

CalculateRates 示例 1(Python 窗口)

以下 Python 脚本演示了如何使用 CalculateRates 函数。

import arcpy
in_features = r"C:\Health.gdb\cancer_deaths"
out_features = r"C:\Health.gdb\cancer_rate"
rate_fields = "deaths_2024 population_2024; deaths_2023 population_2023"
rate_method = "Global Empirical Bayes"
distribution = "Poisson"
scaling_factor = 100000

arcpy.stats.CalculateRates(
    in_features, rate_fields, "NO_APPEND", out_features, rate_method,
    distribution, None, None, None, None, None, None, scaling_factor)
CalculateRates 示例 2(独立脚本)

以下 Python 脚本演示了如何使用 CalculateRates 函数。

import arcpy

arcpy.env.workspace = r"C:\Health.gdb"

in_features = "cancer_deaths"
out_features = "cancer_rate"
rate_fields = "deaths_2024 population_2024; deaths_2023 population_2023"
rate_method = "RAW_RATE"
scaling_factor = 100000

arcpy.stats.CalculateRates(
    in_features, rate_fields,"NO_APPEND", out_features, rate_method, None, 
    None, None, None, None, None, None, scaling_factor)