函数数据集—ArcGIS Insights

函数数据集将创建为创建回归模型的输出。函数数据集包含回归模型的方程和统计数据。

使用函数数据集

函数数据集用作预测变量的输入回归模型。可以通过将函数数据集拖动到地图卡片来打开“预测变量”。

通过在数据窗格中展开函数数据集并单击查看置信区间，可以创建点图，以显示截距及各个解释变量的系数和置信区间。

提示：

Drag-N Drop 可以将函数数据集拖动到根据不同回归模型创建的点图上，以比较两个模型之间解释变量的置信区间。

统计数据

函数数据集将存储回归模型的方程和统计数据。通过在数据窗格中展开函数数据集或打开数据表，可以查看统计数据。

数据窗格中包含以下统计数据：


统计数据	描述
回归方程	回归方程为以下格式： `y=b₀+b₁x₁+b₂x₂+...+b_nx_n` 其中 y 是因变量，b_n 表示计算的参数，x_n 表示解释变量。
R²	R² 值也称为判决系数，是一个 0 到 1 之间的数值，用于测量最佳拟合线对数据点的建模程度，值越接近 1 表示模型越准确。
校正 R²	校正 R² 也是介于 0 和 1 之间的度量，但是其考虑了更多附加预测因子，这些预测因子可能会造成在仅基于偶然的模型中更好地拟合。因此，当模型具有大量预测因子，或者比较具有不同数量预测因子的模型时，最好使用校正 R²。
德宾-沃森	德宾-沃森检验根据 0 至 4 级的回归分析来衡量残差的自相关。在此级别上，0 到 2 为正自相关，2 为无自相关，2 到 4 为负自相关。最好在回归模型中具有较低的自相关性，这意味着最接近 2 的德宾-沃森检验值更适合。注：德宾-沃森检验计算取决于数据的顺序。按顺序对数据进行排序非常重要，尤其是在数据与时间相关的情况下。如果未对数据进行正确排序，则德宾-沃森检验的值可能不准确。
标准残差	标准残差用于测量回归模型使用新数据预测值的准确性。数值越小表示模型越精确。还将给出残差自由度的值以及标准残差。
F 统计	F 统计用于通过确定系数是否与 0 显著不同来确定回归模型的预测功能。 F 统计将被指定为大于或等于 0 的值，并且包括两个自由度值，第一个为解释变量的自由度，第二个为残差的自由度。
p 值	F 统计的 p 值是对回归模型全局显著性的检验。 p 值将被指定为 0.0 到 1.0 之间的值。 0 到 0.05 之间的值表示全局模型具有统计显著性。

数据表中提供了以下统计数据：


统计数据	描述
变量	截距和解释变量的名称。
系数	回归方程的 b 值，对应于 y 截距和每个解释变量的斜率。
标准误差	标准误差用于测量模型中使用的每个预测因子的变化。数值越小表示预测因子越精确。
t 值	t 值用于通过确定系数是否与 0 显著不同来确定每个回归系数的预测功能。
p 值	p 值与 t 值相关，用于检验回归模型中系数的局部显著性。 p 值将被指定为 0.0 到 1.0 之间的值。 0.0 到 0.05 之间的值表示系数具有统计显著性。
置信区间	置信区间将给出上限和下限，可以在一定置信度上确定系数位于该上限和下限范围内。例如，如果 95% 置信区间的下限为 10 且 95% 置信区间的上限为 15，则系数真值在 10 到 15 之间的置信度为 95%。数据表中给出了以下置信区间： 90% 下限 90% 上限 95% 下限 95% 上限 99% 下限 99% 上限
标准化系数	可以通过标准化数据来计算标准化系数，以使因变量和解释变量的方差等于 1。标准化系数对于比较使用不同测量单位的系数值特别有用。
标准化置信区间	标准化置信区间将给出上限和下限，可以在一定置信度上确定标准化系数位于该上限和下限范围内。数据表中给出了以下标准化置信区间： 90% 下限 90% 上限 95% 下限 95% 上限 99% 下限 99% 上限

有关如何使用和解释函数数据集中的统计输出的详细信息，请参阅回归分析。

有关此主题的反馈?

使用函数数据集

提示：

统计数据

注：

在本主题中