Наборы данных функции

Insights в ArcGIS Online
Insights в ArcGIS Enterprise
Insights desktop

Наборы данных функции создаются как выходные данные инструмента Создание модели регрессии. Набор данных функции содержит уравнение и статистику регрессионной модели.

Использование набора данных функции

Наборы данных функции используются в качестве входной регрессионной модели для Переменной прогнозирования. Также можно открыть Переменную прогнозирования, перетащив набор данных функции в карточку карты.

Точечную диаграмму, показывающую коэффициенты и доверительные интервалы для отсечения и каждую независимую переменную, можно создать, развернув набор данных функции на панели данных и щелкнув Просмотреть доверительные интервалы.

Подсказка:

Drag-N Drop Перетащите набор данных функции на точечную диаграмму, созданную из другой регрессионной модели, чтобы сравнить доверительные интервалы для независимых переменных между моделями.

Статистика

Наборы данных функции хранят уравнение и статистику из регрессионной модели. Статистику можно просмотреть, развернув набор данных функции на панели данных или открыв таблицу данных.

На панели данных доступны следующие статистические данные:

СтатистикаОписание

Уравнение регрессии

Форматы уравнения регрессии следующие:

y=b0+b1x1+b2x2+...+bnxn

где y – зависимая переменная, bn – вычисляемые параметры, а xn – объясняющие переменные.

R2

Значение R2, также известное как коэффициент детерминации, представляет собой число между 0 и 1, которое измеряет, насколько хорошо линия наилучшего соответствия моделирует точки данных, причем значения ближе к 1 указывают на более точные модели.

Выровненные R2

Скорректированный R2 также является мерой от 0 до 1, но с учетом дополнительных объясняющих переменных, которые обеспечивают более точную подгонку моделей, построенных на случайности. Поэтому, при наличии большого числа объясняющих переменных, а также при сравнении моделей с разным числом объясняющих переменных лучше использовать скорректированное значение R2.

Тест Дарбина-Уотсона

Тест Дарбина-Уотсона измеряет автокорреляцию в невязках анализа регрессии по шкале от 0 до 4. По этой шкале автокорреляция в пределах от 0 до 2 является позитивной, 2 означает отсутствие автокорреляции, а значения от 2 до 4 указывают на негативную автокореляцию. Лучше всего в модели регрессии иметь низкую автокорреляцию, то есть значения Durbin-Watson, близкие к 2.

Примечание:

Расчет теста Дарбина-Уотсона зависит от порядка ваших данных. Важно, чтобы ваши данные упорядочивались последовательно, особенно если они связаны со временем. Если данные не упорядочены должным образом, то значение теста Дарбина-Уотсона может быть неточным.

Стандартная ошибка невязки

Стандартная ошибка невязки измеряет точность, с которой регрессионная модель может предсказывать значения с новыми данными. Меньшие значения указывают на более точную модель. Значение степеней свободы невязки также задается стандартной ошибкой невязки.

F-статистика

F-статистика используется для определения прогностических возможностях регрессионной модели путем определения существенно ли коэффициенты отличаются от 0. F-статистика представлена как значение, большее или равное 0, и включает в себя два значения степеней свободы, первое из которых является степенями свободы для объясняющих переменных, а второе - степенями свободы для невязок.

p-значение

P-значение для F-статистики является тестом глобальной значимости регрессионной модели. P-значение задается как значение между 0.0 и 1.0. Значения от 0 до 0.05 указывают, что глобальная модель является статистически значимой.

В таблице данных доступны следующие статистические данные:

СтатистикаОписание

Переменная

Пересечение и имена объясняющих переменных.

Коэффициент

B-значения уравнения регрессии, которым соответствуют пересечение линии регрессии и уклон для каждой объясняющей переменной.

Стандартная ошибка

Стандартная ошибка измеряет вариацию каждого из предикторов, используемых в модели. Меньшие значения указывают на более точные предикторы.

t-значение

T-значение используется для определения прогностической способности каждого коэффициента регрессии путем определения существенно ли коэффициент отличается от 0.

p-значение

P-значение связано с t-значением и проверяет локальную значимость коэффициентов в вашей регрессионной модели. P-значение задается как значение между 0.0 и 1.0. Значения между 0.0 и 0.05 указывают на то, что коэффициент является статистически значимым.

Доверительный интервал

Доверительные интервалы дают верхний и нижний пороги, в пределах которых можно получить определенную степень уверенности в том, что коэффициент попадает в диапазон. Например, если нижний 95-процентный доверительный интервал равен 10, а верхний 95-процентный доверительный интервал равен 15, можно иметь 95-процентную уверенность в том, что истинное значение коэффициента находится в диапазоне от 10 до 15.

В таблице данных приведены следующие доверительные интервалы:

  • Ниже 90 процентов
  • Выше 90 процентов
  • Ниже 95 процентов
  • Выше 95 процентов
  • Ниже 99 процентов
  • Выше 99 процентов

Стандартизированные коэффициенты

Стандартизированные коэффициенты рассчитываются путем стандартизации данных таким образом, чтобы дисперсия зависимой и объясняющей переменных была равна 1. Стандартизированные коэффициенты особенно полезны для сравнения значений коэффициентов с различными единицами измерения.

Стандартизированные доверительные интервалы

Стандартизированные доверительные интервалы дают верхний и нижний пороги, в пределах которых можно иметь определенную степень уверенности в том, что стандартизированный коэффициент попадает в диапазон.

В таблице данных приведены следующие стандартизированные доверительные интервалы:

  • Ниже 90%
  • Выше 90%
  • Ниже 95%
  • Выше 95%
  • Ниже 99%
  • Выше 99%

Дополнительные сведения об использовании и интерпретации статистических результатов в наборе данных функции см. в разделе Регрессионный анализ.