Наборы данных функции—ArcGIS Insights

Наборы данных функции создаются как выходные данные инструмента Создание модели регрессии. Набор данных функции содержит уравнение и статистику регрессионной модели.

Использование набора данных функции

Наборы данных функции используются в качестве входной регрессионной модели для Переменной прогнозирования. Также можно открыть Переменную прогнозирования, перетащив набор данных функции в карточку карты.

Точечную диаграмму, показывающую коэффициенты и доверительные интервалы для отсечения и каждую независимую переменную, можно создать, развернув набор данных функции на панели данных и щелкнув Просмотреть доверительные интервалы.

Подсказка:

Drag-N Drop Перетащите набор данных функции на точечную диаграмму, созданную из другой регрессионной модели, чтобы сравнить доверительные интервалы для независимых переменных между моделями.

Статистика

Наборы данных функции хранят уравнение и статистику из регрессионной модели. Статистику можно просмотреть, развернув набор данных функции на панели данных или открыв таблицу данных.

На панели данных доступны следующие статистические данные:


Статистика	Описание
Уравнение регрессии	Форматы уравнения регрессии следующие: `y=b₀+b₁x₁+b₂x₂+...+b_nx_n` где y – зависимая переменная, b_n – вычисляемые параметры, а x_n – объясняющие переменные.
R²	Значение R², также известное как коэффициент детерминации, представляет собой число между 0 и 1, которое измеряет, насколько хорошо линия наилучшего соответствия моделирует точки данных, причем значения ближе к 1 указывают на более точные модели.
Выровненные R²	Скорректированный R² также является мерой от 0 до 1, но с учетом дополнительных объясняющих переменных, которые обеспечивают более точную подгонку моделей, построенных на случайности. Поэтому, при наличии большого числа объясняющих переменных, а также при сравнении моделей с разным числом объясняющих переменных лучше использовать скорректированное значение R².
Тест Дарбина-Уотсона	Тест Дарбина-Уотсона измеряет автокорреляцию в невязках анализа регрессии по шкале от 0 до 4. По этой шкале автокорреляция в пределах от 0 до 2 является позитивной, 2 означает отсутствие автокорреляции, а значения от 2 до 4 указывают на негативную автокореляцию. Лучше всего в модели регрессии иметь низкую автокорреляцию, то есть значения Durbin-Watson, близкие к 2. Примечание: Расчет теста Дарбина-Уотсона зависит от порядка ваших данных. Важно, чтобы ваши данные упорядочивались последовательно, особенно если они связаны со временем. Если данные не упорядочены должным образом, то значение теста Дарбина-Уотсона может быть неточным.
Стандартная ошибка невязки	Стандартная ошибка невязки измеряет точность, с которой регрессионная модель может предсказывать значения с новыми данными. Меньшие значения указывают на более точную модель. Значение степеней свободы невязки также задается стандартной ошибкой невязки.
F-статистика	F-статистика используется для определения прогностических возможностях регрессионной модели путем определения существенно ли коэффициенты отличаются от 0. F-статистика представлена как значение, большее или равное 0, и включает в себя два значения степеней свободы, первое из которых является степенями свободы для объясняющих переменных, а второе - степенями свободы для невязок.
p-значение	P-значение для F-статистики является тестом глобальной значимости регрессионной модели. P-значение задается как значение между 0.0 и 1.0. Значения от 0 до 0.05 указывают, что глобальная модель является статистически значимой.

В таблице данных доступны следующие статистические данные:


Статистика	Описание
Переменная	Пересечение и имена объясняющих переменных.
Коэффициент	B-значения уравнения регрессии, которым соответствуют пересечение линии регрессии и уклон для каждой объясняющей переменной.
Стандартная ошибка	Стандартная ошибка измеряет вариацию каждого из предикторов, используемых в модели. Меньшие значения указывают на более точные предикторы.
t-значение	T-значение используется для определения прогностической способности каждого коэффициента регрессии путем определения существенно ли коэффициент отличается от 0.
p-значение	P-значение связано с t-значением и проверяет локальную значимость коэффициентов в вашей регрессионной модели. P-значение задается как значение между 0.0 и 1.0. Значения между 0.0 и 0.05 указывают на то, что коэффициент является статистически значимым.
Доверительный интервал	Доверительные интервалы дают верхний и нижний пороги, в пределах которых можно получить определенную степень уверенности в том, что коэффициент попадает в диапазон. Например, если нижний 95-процентный доверительный интервал равен 10, а верхний 95-процентный доверительный интервал равен 15, можно иметь 95-процентную уверенность в том, что истинное значение коэффициента находится в диапазоне от 10 до 15. В таблице данных приведены следующие доверительные интервалы: Ниже 90 процентов Выше 90 процентов Ниже 95 процентов Выше 95 процентов Ниже 99 процентов Выше 99 процентов
Стандартизированные коэффициенты	Стандартизированные коэффициенты рассчитываются путем стандартизации данных таким образом, чтобы дисперсия зависимой и объясняющей переменных была равна 1. Стандартизированные коэффициенты особенно полезны для сравнения значений коэффициентов с различными единицами измерения.
Стандартизированные доверительные интервалы	Стандартизированные доверительные интервалы дают верхний и нижний пороги, в пределах которых можно иметь определенную степень уверенности в том, что стандартизированный коэффициент попадает в диапазон. В таблице данных приведены следующие стандартизированные доверительные интервалы: Ниже 90% Выше 90% Ниже 95% Выше 95% Ниже 99% Выше 99%

Дополнительные сведения об использовании и интерпретации статистических результатов в наборе данных функции см. в разделе Регрессионный анализ.

Отзыв по этому разделу?

Использование набора данных функции

Подсказка:

Статистика

Примечание:

В этом разделе