函数数据集

Insights in ArcGIS Online
Insights in ArcGIS Enterprise
Insights 桌面版

函数数据集将创建为创建回归模型的输出。 函数数据集包含回归模型的方程和统计数据。

使用函数数据集

函数数据集用作预测变量的输入回归模型。 可以通过将函数数据集拖动到地图卡片来打开“预测变量”。

通过在数据窗格中展开函数数据集并单击查看置信区间,可以创建点图,以显示截距及各个解释变量的系数和置信区间。

提示:

Drag-N Drop 可以将函数数据集拖动到根据不同回归模型创建的点图上,以比较两个模型之间解释变量的置信区间。

统计数据

函数数据集将存储回归模型的方程和统计数据。 通过在数据窗格中展开函数数据集或打开数据表,可以查看统计数据。

数据窗格中包含以下统计数据:

统计数据描述

回归方程

回归方程为以下格式:

y=b0+b1x1+b2x2+...+bnxn

其中 y 是因变量,bn 表示计算的参数,xn 表示解释变量。

R2

R2 值也称为判决系数,是一个 0 到 1 之间的数值,用于测量最佳拟合线对数据点的建模程度,值越接近 1 表示模型越准确。

校正 R2

校正 R2 也是介于 0 和 1 之间的度量,但是其考虑了更多附加预测因子,这些预测因子可能会造成在仅基于偶然的模型中更好地拟合。 因此,当模型具有大量预测因子,或者比较具有不同数量预测因子的模型时,最好使用校正 R2

德宾-沃森

德宾-沃森检验根据 0 至 4 级的回归分析来衡量残差的自相关。 在此级别上,0 到 2 为正自相关,2 为无自相关,2 到 4 为负自相关。 最好在回归模型中具有较低的自相关性,这意味着最接近 2 的德宾-沃森检验值更适合。

注:

德宾-沃森检验计算取决于数据的顺序。 按顺序对数据进行排序非常重要,尤其是在数据与时间相关的情况下。 如果未对数据进行正确排序,则德宾-沃森检验的值可能不准确。

标准残差

标准残差用于测量回归模型使用新数据预测值的准确性。 数值越小表示模型越精确。 还将给出残差自由度的值以及标准残差。

F 统计

F 统计用于通过确定系数是否与 0 显著不同来确定回归模型的预测功能。 F 统计将被指定为大于或等于 0 的值,并且包括两个自由度值,第一个为解释变量的自由度,第二个为残差的自由度。

p 值

F 统计的 p 值是对回归模型全局显著性的检验。 p 值将被指定为 0.0 到 1.0 之间的值。 0 到 0.05 之间的值表示全局模型具有统计显著性。

数据表中提供了以下统计数据:

统计数据描述

变量

截距和解释变量的名称。

系数

回归方程的 b 值,对应于 y 截距和每个解释变量的斜率。

标准误差

标准误差用于测量模型中使用的每个预测因子的变化。 数值越小表示预测因子越精确。

t 值

t 值用于通过确定系数是否与 0 显著不同来确定每个回归系数的预测功能。

p 值

p 值与 t 值相关,用于检验回归模型中系数的局部显著性。 p 值将被指定为 0.0 到 1.0 之间的值。 0.0 到 0.05 之间的值表示系数具有统计显著性。

置信区间

置信区间将给出上限和下限,可以在一定置信度上确定系数位于该上限和下限范围内。 例如,如果 95% 置信区间的下限为 10 且 95% 置信区间的上限为 15,则系数真值在 10 到 15 之间的置信度为 95%。

数据表中给出了以下置信区间:

  • 90% 下限
  • 90% 上限
  • 95% 下限
  • 95% 上限
  • 99% 下限
  • 99% 上限

标准化系数

可以通过标准化数据来计算标准化系数,以使因变量和解释变量的方差等于 1。 标准化系数对于比较使用不同测量单位的系数值特别有用。

标准化置信区间

标准化置信区间将给出上限和下限,可以在一定置信度上确定标准化系数位于该上限和下限范围内。

数据表中给出了以下标准化置信区间:

  • 90% 下限
  • 90% 上限
  • 95% 下限
  • 95% 上限
  • 99% 下限
  • 99% 上限

有关如何使用和解释函数数据集中的统计输出的详细信息,请参阅回归分析