Использование функции Построить модель регрессии

Insights в ArcGIS Online
Insights в ArcGIS Enterprise
Insights desktop

Функция Построить модель регрессии моделирует отношения между двумя или несколькими независимыми переменными с одной стороны и зависимой переменной реакции – с другой путем подгонки линейного уравнения к наблюдаемым данным. Каждое значение независимой переменной (x) связано со значением зависимой переменной (y).

Построить модель регрессии в качестве типа регрессии использует Метод наименьших квадратов (OLS).

Пример

Экологическая организация изучает причину выбросов парниковых газов в стране с 1990 по 2015 год. Функция Построить модель регрессии может использоваться для построения выражения, оценивающего объем выбросов тепличных газов по странам на основе описательных переменных, таких как численность населения и валовой внутренний продукт.

Запуск функции Построить модель регрессии

Выполните следующие действия, чтобы создать модель регрессии:

  1. Создайте карту, диаграмму или таблицу, используя набор данных, с помощью которого хотите создать модель регрессии.
  2. Щелкните кнопку Действие Действие.
  3. Вы можете сделать следующее:
    • Для карточек диаграммы или таблицы щелкните Как связаны данные на панели Аналитика.
    • Для карточки карты щелкните вкладку Найти ответы выберите Как связаны данные.
  4. Щелкните Построить модель регрессии.
  5. Для параметра Выбрать слой выберите набор данных для создания модели регрессии.
  6. Для параметра Выбрать зависимую переменную выберите поле, которое вы хотите объяснить с помощью модели.

    Поле должно быть числовое или доля/отношение.

  7. Щелкните Выбрать независимые переменные, чтобы отобразить меню доступных полей.
  8. Выберите поля для использования их в качестве независимых переменных (также называемых объясняющими переменными).
  9. Щелкните Выбрать, чтобы применить независимые переменные.
  10. Щелкните кнопку Визуализировать, чтобы просмотреть точечную диаграмму (рассеяния) или матрицу точечной диаграммы зависимых и независимых переменных, если они доступны.
    Точечные диаграммы (рассеяния) можно использовать как часть исследовательского анализа для модели.
    Примечание:

    Кнопка Визуализация не доступна, если выбрано пять или более независимых переменных.

  11. Щелкните Запустить.

Регрессионная модель создается для указанных зависимых и независимых переменных. Теперь можно использовать выходные данные и статистику для продолжения проверки достоверности модели с помощью исследовательского и подтверждающего анализа.

Примечания по использованию

Для доступа к функции Построить модель регрессии щелкните кнопку Действие Действие в разделе Как оно связано на вкладке Найти ответы.

В качестве зависимой переменной можно выбрать одно числовое поле или одно поле доля/отношение. Зависимая переменная – это поле чисел, которое вы пытаетесь объяснить с помощью модели регрессии. Например, если вы создаете модель регрессии, чтобы определить причину детской смертности, коэффициент детской смертности является зависимой переменной.

В качестве независимых переменных можно указать до 20 числовых полей или полей доля/отношение. Объясняющие переменные являются независимыми переменными, которые можно задать как часть модели регрессии для объяснения зависимой переменной. Например, если вы создаете модель регрессии, чтобы определить причины детской смертности, к описательным переменным могут относится уровни бедности, заболеваемости и вакцинации. Если число описательных переменных - четыре или меньше, диаграмму рассеяния или матрицу диаграммы рассеяния можно создать, щелкнув Визуализировать.

Следующие выходные значения находятся в разделе Статистика модели:

  • Уравнение регрессии
  • R2
  • Выровненные R2
  • Тест Durbin-Watson
  • p-значение
  • Стандартная ошибка невязки
  • F-статистика

Выходные данные и статистика могут быть использованы для анализа точности модели.

После создания модели, новый набор данных функции добавляется на панель данных. Набор данных функции можно использовать в Переменной прогнозирования. Построить модель регрессии также создает итоговый набор данных, который содержит все поля из входных, а также поля estimated, residual и standardized_residual. Эти поля содержат следующую информацию:

  • estimated - значение зависимой переменной, оцененное с помощью модели регрессии
  • residual- разница между исходным значением поля и интерполируемым значением зависимой переменной
  • standardized_residual- соотношение невязки и среднеквадратичного отклонения невязок

Как работает инструмент Построить модель регрессии

Регрессионную модель OLS можно создать, если выполняются следующие условия:

  • Данная модель должна быть линейной по параметрам.
  • Данные представляют собой случайную выборку населения.
  • Независимые переменные не являются идеально коллинеарными.
  • Степень точности измерения независимых переменных настолько высока, что ошибкой измерения можно пренебречь.
  • Ожидаемое значение остатков всегда равно нулю.
  • Остатки имеют постоянную дисперсию (однородную дисперсию).
  • Распределение остатков – обычное.

Построить модель регрессии часто срабатывает успешно, даже если одно или несколько предположений не выполняются. Предположения для OLS должны быть проверены перед применением инструмента Построить модель регрессии. Если предположения не выполняются, модель может оказаться недействительной.

Модель не может быть создана, если третье предположение - независимые переменные не являются полностью коллинеарными - не выполняется. В этом случае появится сообщение Две или больше описательных переменных являются связанными. Удалите одну из коллинеарных переменных и попробуйте снова. . Вы можете определить, какие переменные являются коллинеарными с помощью диаграммы рассеяния или матрицы диаграммы рассеяния. Коллинеарные переменные будут иметь линейное отношение и одна из них будет явно зависеть от другой. Удалите зависимую коллинеарную переменную из модели.

Дополнительные сведения и рекомендации по применению моделей OLS см. в разделе Регрессионный анализ.