Наборы данных функции создаются как выходные данные инструмента Создание модели регрессии. Набор данных функции содержит уравнение и статистику регрессионной модели.
Использование набора данных функции
Наборы данных функции используются в качестве входной регрессионной модели для Переменной прогнозирования. Также можно открыть Переменную прогнозирования, перетащив набор данных функции в карточку карты.
Точечную диаграмму, показывающую коэффициенты и доверительные интервалы для отсечения и каждую независимую переменную, можно создать, развернув набор данных функции на панели данных и щелкнув Просмотреть доверительные интервалы.
Подсказка:
Перетащите набор данных функции на точечную диаграмму, созданную из другой регрессионной модели, чтобы сравнить доверительные интервалы для независимых переменных между моделями.
Статистика
Наборы данных функции хранят уравнение и статистику из регрессионной модели. Статистику можно просмотреть, развернув набор данных функции на панели данных или открыв таблицу данных.
На панели данных доступны следующие статистические данные:
Статистика | Описание |
---|---|
Уравнение регрессии | Форматы уравнения регрессии следующие:
где y – зависимая переменная, bn – вычисляемые параметры, а xn – объясняющие переменные. |
R2 | Значение R2, также известное как коэффициент детерминации, представляет собой число между 0 и 1, которое измеряет, насколько хорошо линия наилучшего соответствия моделирует точки данных, причем значения ближе к 1 указывают на более точные модели. |
Выровненные R2 | Скорректированный R2 также является мерой от 0 до 1, но с учетом дополнительных объясняющих переменных, которые обеспечивают более точную подгонку моделей, построенных на случайности. При наличии большого числа объясняющих переменных, а также при сравнении моделей с разным числом объясняющих переменных лучше использовать скорректированное значение R2. |
Тест Дарбина-Уотсона | Тест Дарбина-Уотсона измеряет автокорреляцию в невязках анализа регрессии по шкале от 0 до 4. По этой шкале автокорреляция в пределах от 0 до 2 является позитивной, 2 означает отсутствие автокорреляции, а значения от 2 до 4 указывают на негативную автокореляцию. Лучше всего в модели регрессии иметь низкую автокорреляцию, то есть значения Durbin-Watson, близкие к 2. Примечание:Расчет теста Дарбина-Уотсона зависит от порядка данных. Важно, чтобы данные упорядочивались последовательно, особенно если они связаны со временем. Если данные не упорядочены должным образом, то значение теста Дарбина-Уотсона может быть неточным. |
Стандартная ошибка невязки | Стандартная ошибка невязки измеряет точность, с которой регрессионная модель может предсказывать значения с новыми данными. Меньшие значения указывают на более точную модель. Значение степеней свободы невязки также задается стандартной ошибкой невязки. |
F-статистика | F-статистика используется для определения прогностических возможностях регрессионной модели путем определения существенно ли коэффициенты отличаются от 0. F-статистика - это значение, большее или равное 0, и включает в себя два значения степеней свободы, первое из которых является степенями свободы для объясняющих переменных, а второе - степенями свободы для невязок. |
p-значение | P-значение для F-статистики является тестом глобальной значимости регрессионной модели. P-значение задается как значение между 0.0 и 1.0. Значения от 0 до 0.05 указывают, что глобальная модель является статистически значимой. |
В таблице данных доступны следующие статистические данные:
Статистика | Описание |
---|---|
Переменная | Пересечение и имена объясняющих переменных. |
Коэффициент | B-значения уравнения регрессии, которым соответствуют пересечение линии регрессии и уклон для каждой объясняющей переменной. |
Стандартная ошибка | Стандартная ошибка измеряет вариацию каждого из предикторов, используемых в модели. Меньшие значения указывают на более точные предикторы. |
t-значение | T-значение используется для определения прогностической способности каждого коэффициента регрессии путем определения существенно ли коэффициент отличается от 0. |
p-значение | P-значение связано с t-значением и проверяет локальную значимость коэффициентов в регрессионной модели. P-значение задается как значение между 0.0 и 1.0. Значения между 0.0 и 0.05 указывают на то, что коэффициент является статистически значимым. |
Доверительный интервал | Доверительные интервалы дают верхний и нижний пороги, в пределах которых можно получить определенную степень уверенности в том, что коэффициент попадает в диапазон. Например, если нижний 95-процентный доверительный интервал равен 10, а верхний 95-процентный доверительный интервал равен 15, можно иметь 95-процентную уверенность в том, что истинное значение коэффициента находится в диапазоне от 10 до 15. В таблице данных приведены следующие доверительные интервалы:
|
Стандартизированные коэффициенты | Стандартизированные коэффициенты рассчитываются путем стандартизации данных таким образом, чтобы дисперсия зависимой и объясняющей переменных была равна 1. Стандартизированные коэффициенты особенно полезны для сравнения значений коэффициентов с различными единицами измерения. |
Стандартизированные доверительные интервалы | Стандартизированные доверительные интервалы дают верхний и нижний пороги, в пределах которых можно иметь определенную степень уверенности в том, что стандартизированный коэффициент попадает в диапазон. В таблице данных приведены следующие стандартизированные доверительные интервалы:
|
Дополнительные сведения об использовании и интерпретации статистических результатов в наборе данных функции см. в разделе Регрессионный анализ.