函数数据集将创建为创建回归模型的输出。 函数数据集包含回归模型的方程和统计数据。
使用函数数据集
函数数据集用作预测变量的输入回归模型。 可以通过将函数数据集拖动到地图卡片来打开“预测变量”。
通过在数据窗格中展开函数数据集并单击查看置信区间,可以创建点图,以显示截距及各个解释变量的系数和置信区间。
提示:
可以将函数数据集拖动到根据不同回归模型创建的点图上,以比较两个模型之间解释变量的置信区间。
统计数据
函数数据集将存储回归模型的方程和统计数据。 通过在数据窗格中展开函数数据集或打开数据表,可以查看统计数据。
数据窗格中包含以下统计数据:
统计数据 | 描述 |
---|---|
回归方程 | 回归方程为以下格式:
其中 y 是因变量,bn 表示计算的参数,xn 表示解释变量。 |
R2 | R2 值也称为判决系数,是一个 0 到 1 之间的数值,用于测量最佳拟合线对数据点的建模程度,值越接近 1 表示模型越准确。 |
校正 R2 | 校正 R2 也是介于 0 和 1 之间的度量,但是其考虑了更多附加预测因子,这些预测因子可能会造成在仅基于偶然的模型中更好地拟合。 因此,当模型具有大量预测因子,或者比较具有不同数量预测因子的模型时,最好使用校正 R2。 |
德宾-沃森 | 德宾-沃森检验根据 0 至 4 级的回归分析来衡量残差的自相关。 在此级别上,0 到 2 为正自相关,2 为无自相关,2 到 4 为负自相关。 最好在回归模型中具有较低的自相关性,这意味着最接近 2 的德宾-沃森检验值更适合。 注:德宾-沃森检验计算取决于数据的顺序。 按顺序对数据进行排序非常重要,尤其是在数据与时间相关的情况下。 如果未对数据进行正确排序,则德宾-沃森检验的值可能不准确。 |
标准残差 | 标准残差用于测量回归模型使用新数据预测值的准确性。 数值越小表示模型越精确。 还将给出残差自由度的值以及标准残差。 |
F 统计 | F 统计用于通过确定系数是否与 0 显著不同来确定回归模型的预测功能。 F 统计将被指定为大于或等于 0 的值,并且包括两个自由度值,第一个为解释变量的自由度,第二个为残差的自由度。 |
p 值 | F 统计的 p 值是对回归模型全局显著性的检验。 p 值将被指定为 0.0 到 1.0 之间的值。 0 到 0.05 之间的值表示全局模型具有统计显著性。 |
数据表中提供了以下统计数据:
统计数据 | 描述 |
---|---|
变量 | 截距和解释变量的名称。 |
系数 | 回归方程的 b 值,对应于 y 截距和每个解释变量的斜率。 |
标准误差 | 标准误差用于测量模型中使用的每个预测因子的变化。 数值越小表示预测因子越精确。 |
t 值 | t 值用于通过确定系数是否与 0 显著不同来确定每个回归系数的预测功能。 |
p 值 | p 值与 t 值相关,用于检验回归模型中系数的局部显著性。 p 值将被指定为 0.0 到 1.0 之间的值。 0.0 到 0.05 之间的值表示系数具有统计显著性。 |
置信区间 | 置信区间将给出上限和下限,可以在一定置信度上确定系数位于该上限和下限范围内。 例如,如果 95% 置信区间的下限为 10 且 95% 置信区间的上限为 15,则系数真值在 10 到 15 之间的置信度为 95%。 数据表中给出了以下置信区间:
|
标准化系数 | 可以通过标准化数据来计算标准化系数,以使因变量和解释变量的方差等于 1。 标准化系数对于比较使用不同测量单位的系数值特别有用。 |
标准化置信区间 | 标准化置信区间将给出上限和下限,可以在一定置信度上确定标准化系数位于该上限和下限范围内。 数据表中给出了以下标准化置信区间:
|
有关如何使用和解释函数数据集中的统计输出的详细信息,请参阅回归分析。