関数データセットは、[回帰モデルの作成] の出力として作成されます。 関数データセットには、回帰モデルの方程式と統計情報が含まれています。
関数データセットの使用
関数データセットは、予測変数の入力回帰モデルとして使用されます。 [変数の予測] は、関数データセットをマップ カードにドラッグして開くことができます。
切片と各説明変数の係数と信頼区間を示すポイント チャートは、データ ウィンドウで関数データセットを展開し、[信頼区間の表示] をクリックして作成できます。
ヒント:
関数データセットを別の回帰モデルから作成されたポイント チャートにドラッグして、モデル間の説明変数の信頼区間を比較します。
統計情報
関数データセットには、回帰モデルの方程式と統計情報が保存されます。 統計情報を表示するには、データ ウィンドウで関数データセットを展開するか、データ テーブルを開きます。
データ ウィンドウでは、次の統計情報を表示できます。
統計情報 | 説明 |
---|---|
回帰方程式 | 回帰方程式の形式は次のとおりです。
ここで、y は従属変数、bn は計算されたパラメーター、xn は説明変数を表します。 |
R2 | 決定係数とも呼ばれる R2 値は、0 ~ 1 の範囲の数値であり、ベスト フィット ラインによってデータ ポイントがどのくらいの適合度 (精度) でモデル化されるかを計測します。この値が 1 に近いほど、モデルの精度が高いことを示します。 |
補正 R2 | 補正 R2 も、0 ~ 1 の範囲の計測値ですが、単なる偶然に基づくモデルでより高い適合度をもたらすことがあるより多くの追加の予測因子を表します。 したがって、モデルに多数の予測因子が存在する場合や、それぞれ異なる数の予測因子を持つモデルを比較する場合は、補正 R2 値の使用をお勧めします。 |
Durbin-Watson | Durbin-Watson 検定は、0 ~ 4 のスケールで回帰分析の残差の自己相関を計測します。 このスケールにおいて、0 ~ 2 の範囲の値は正の自己相関、値 2 は自己相関なし、2 ~ 4 の範囲の値は負の自己相関を示します。 回帰モデルでは、自己相関の度合が低いことが推奨されます。つまり、Durbin-Watson 検定の値は、2 に近いほど回帰モデルに適しています。 注意:Durbin-Watson 検定の計算はデータの順序に左右されます。 特にデータが時間に関連付けられている場合は、データが順番どおりに並んでいることが重要になります。 データの順番が正しくないと、Durbin-Watson 検定の値が正確ではない場合があります。 |
残差の標準誤差 | 残差の標準誤差では、回帰モデルが新しいデータで値を予測できる精度が計測されます。 値が小さいほど、モデルの精度が高いことを示します。 残差の自由度の値も、残差の標準誤差で指定します。 |
F 統計 | F 統計量は、係数が 0 から大きく離れているかどうかを判断することで、回帰モデルの予測能力を確認するために使用されます。 F 統計量には 0 以上の値が設定され、2 つの自由度 (説明変数の自由度および残差の自由度) に関する値が含まれています。 |
p 値 | F 統計量の p 値は、回帰モデルのグローバルな有意性を検定します。 p 値には 0.0 ~ 1.0 までの値が設定されます。 値が 0 ~ 0.05 の場合、グローバル モデルが統計的に有意であることを示します。 |
データ テーブルでは、次の統計情報を表示できます。
統計情報 | 説明 |
---|---|
変数 | 切片と説明変数の名前。 |
係数 | 回帰方程式の b 値。各説明変数の Y 軸切片と傾きに対応します。 |
標準誤差 | 標準誤差では、モデルに使用される各予測因子のばらつきが計測されます。 値が小さいほど、予測因子の精度が高いことを示します。 |
t 値 | t 値は、係数が 0 から大きく離れているかどうかを判断することで、各回帰係数の予測能力を判断するために使用されます。 |
p 値 | p 値は t 値に関連し、回帰モデルの係数のローカルな有意性を検定します。 p 値には 0.0 ~ 1.0 までの値が設定されます。 値が 0.0 ~ 0.05 の場合、係数が統計的に有意であることを示します。 |
信頼区間 | 信頼区間は、係数が範囲内に収まることについて一定の確実性を担保できる上限と下限を示しています。 たとえば、95% 信頼区間の下限値が 10 で、95% 信頼区間の上限値が 15 の場合、係数の実値が 10 ~ 15 の間であることに 95% の信頼度を持つことができます。 次の信頼区間がデータ テーブルに表示されます。
|
標準化係数 | 標準化係数は、従属変数と説明変数の分散が 1 になるよう、データを標準化することで計算されます。 標準化係数は、係数値をさまざまな計測単位と比較する場合に特に役立ちます。 |
標準化された信頼区間 | 標準化された信頼区間は、標準化係数が範囲内に収まることについて一定の確実性を担保できる上限と下限を示しています。 次の標準化された信頼区間がデータ テーブルに表示されます。
|
関数データセットで統計出力を使用および解釈する方法の詳細については、「回帰分析」をご参照ください。