Мультимасштабная географически взвешенная регрессия (МГВР) (Пространственная статистика)

Краткая информация

Выполняет мультимасштабную географически взвешенную регрессию (МГВР) - локальную форму линейной регрессии, используемую для моделирования пространственно меняющихся отношений.

МГВР основывается на географически взвешенной регрессии (ГВР). Эта локальная модель регрессии, при которой коэффициенты для независимых переменных меняются в пространстве. Каждая независимая переменная может обрабатываться в разных пространственных масштабах. В ГВР это не используется, а в МГВР допускается использование окрестностей различного размера (с разной шириной полосы) для каждой независимой переменной. Окрестность (ширина полосы) для независимой переменной определяет объекты, участвующие в формировании коэффициента независимой переменной в линейной модели регрессии, соответствующей целевому объекту.

Более подробно о том, как работает Мультимасштабная географически взвешенная регрессия (MGWR)

Иллюстрация

Иллюстрация инструмента Мультимасштабная географически взвешенная регрессия (МГВР)
В окрестности каждой независимой переменной применяется расчет по методу биквадратного ядра. Каждая независимая переменная использует разную ширину полосы для учета варьирующихся пространственных отношений.

Использование

  • Этот инструмент наиболее эффективен с наборами данных, в которых, как минимум, несколько сотен объектов. Инструмент не подходит для очень небольших наборов данных. Инструмент не работает с мультиточечными данными.

  • Используйте параметр Входные объекты, с полем, представляющим явление, которое вы моделируете (Зависимую переменную), а также укажите одно или несколько полей, представляющих Независимые переменные. Эти поля должны быть числовыми и содержать диапазоны значений. Объекты с пустыми значениями в зависимой или независимых переменных исключаются из анализа; но можно использовать инструмент Заполнить пустые значения, чтобы сделать набор данных полным перед запуском инструмента Мультимасштабная географически взвешенная регрессия (МГВР).

  • В настоящее время модель допускает только переменные с непрерывными значениями. Не используйте инструмент с количествами, долями или бинарными (индикаторными) независимыми переменными. В настоящий момент для Типа модели поддерживается только одна доступная опция Непрерывные. Другие опции возможно будут добавлены в последующих версиях.

    Если зависимая переменная представлена не непрерывными данными, результат может быть бессмысленным, например, прогнозирование с отрицательными количествами или вероятности больше единицы.

    Внимание:

    В отличие от зависимой, независимые переменные могут быть любого типа, но будьте осторожны при использовании независимых переменных с количествами, долями или бинарными значениями. В локальных моделях регрессии, где используются независимые переменные с типом данных, отличных от непрерывного, часто отмечаются проблемы мультиколлинеарности. Если какая-либо независимая переменная демонстрирует высокую корреляцию, как глобально, так и локально - может произойти сбой инструмента с ошибкой 110222 из-за мультиколлинеарности.

    Более подробно о мультиколлинеарности.

  • Должна присутствовать глобальная и локальная вариабельность между Зависимой переменной и Независимыми переменными. Не используйте поля, содержащие одно постоянное значение, индикаторные независимые переменные, представляющие различные пространственные конструкции или категорийные переменные, демонстрирующие пространственную кластеризацию.

  • Для использования категорийных переменных, категории необходимо конвертировать в индикаторные переменные (0 или 1) с помощью инструмента Кодировать поле. Тогда эти индикаторные переменные можно использовать как независимые в инструменте Мультимасштабная географически взвешенная регрессия (МГВР).

  • Этот инструмент создает выходной класс объектов и добавляет поля со значениями локальных проверок. Выходной класс объектов и связанные с ним диаграммы автоматически добавляются в таблицу содержания с расходящейся цветовой схемой, применяемой в моделировании невязок.

  • Существует четыре опции для параметра Метод выбора окрестности, которые можно использовать для расчета оптимального пространственного масштаба для каждой независимой переменной:

    • Золотой поиск — определяет расстояние или число соседних объектов для каждой независимой переменной, с использованием алгоритма Золотого поиска. В рамках этого метода ищутся различные комбинации переменных для каждой независимой переменной между указанными минимальными и максимальными значениями. Это итеративный процесс, использующий результаты предыдущих комбинаций для выбора новой комбинации для тестирования. Итоговые значения выбираются по наименьшему AIC. Если выбрана опция Число соседей, минимальные и максимальные значения указываются в параметрах Минимальное число соседей и Минимальное число соседей. Для опции диапазона расстояний минимальные и максимальные значения указываются в параметрах Минимальное расстояние поиска и Максимальное расстояние поиска. Минимальные и максимальные значения распространяются на все независимые переменные, но рассчитанное число соседей или диапазон расстояний будут разными для каждой независимой переменной (кроме двух или более совпадающих, с одинаковым пространственным масштабом). Эта опция требует больше времени для вычисления, особенно для больших наборов данных и наборов данных с большим диапазоном значений.

    • Градиентный поиск — определяет расстояние или число соседних объектов для каждой независимой переменной, с использованием алгоритма оптимизации на основе градиента. Чтобы подобрать оптимальную ширину полосы для каждой независимой переменной, Градиентный поиск берет значения AIC, связанные с каждым значением ширины полосы, и обновляет эти значения, пока не подберет наименьший AIC. Если выбрана опция Число соседей, минимальные и максимальные значения указываются в параметрах Минимальное число соседей и Минимальное число соседей. Для опции Диапазона расстояний минимальные и максимальные значения указываются в параметрах Минимальное расстояние поиска и Максимальное расстояние поиска. Так же, как и для Золотого поиска, Минимальные и максимальные значения распространяются на все независимые переменные, но рассчитанное число соседей или диапазон расстояний будут разными для каждой независимой переменной (кроме двух или более совпадающих, с одинаковым пространственным масштабом). Эта опция формирует окрестности, сопоставлимые с опцией Золотой поиск, но выполняется значительно быстрее, и с меньшим расходом памяти.

    • Интервалы вручную — определяет расстояние или число соседних объектов для каждой независимой переменной, ступенчато увеличивая число соседей или расстояние, начиная с минимального значения. Для опции числа соседей метод начинает со значения параметра Минимальное число соседей. Число соседей затем увеличивается на значение, указанное в параметре Инкремент числа соседей. Этот инкремент повторяется определенное количество раз, в соответствии с установкой в параметре Число инкрементов. Для опции Диапазона расстояний метод использует параметры Минимальное расстояние, Инкремент расстояния поиска и Число инкрементов. Число соседей или диапазон расстояния, используемый для каждой независимой переменной будет представлен одним из протестированных значений, но значения могут быть разными для разных независимых переменных. Эта опция выполняется быстрее, чем Золотой поиск, и часто рассчитывает сопоставимые окрестности.

    • Определен пользователем — число соседей или расстояние поиска, используемое независимыми переменными. Это значение указывается в параметре Число соседей или Диапазон расстояний. Эта опция обеспечивает вас большим контролем, если вы знаете оптимальные значения.

    По умолчанию все параметры окрестности, относящиеся к выбранному методу окрестности, применяются ко всем независимым переменным. Но настраиваемые параметры выбора окрестности можно применить только к определенным независимым переменным, используя соответствующие замещающие параметры для типа окрестности и метода выбора: Число соседей для Золотого поиска, Число соседей для Градиентного поиска, Число соседей для интервалов вручную, Заданное пользователем число соседей, Расстояние поиска для Золотого поиска, Расстояние поиска для Градиентного поиска, Расстояние поиска для интервалов вручную или Заданное пользователем расстояние поиска. Чтобы использовать настраиваемую окрестность для конкретных независимых переменных, укажите независимые переменные в первом столбце соответствующего замещающего параметра, и укажите настраиваемые опции для окрестности в других столбцах. Столбцы названы теми же именами, что и замещающие параметры; например, если вы используете интервалы вручную для диапазона расстояний, столбец Инкремент расстояния поиска будет содержать настроенные значения для параметра Инкремент расстояния поиска. В панели Геообработка настроенные параметры окрестности отображаются в категории параметров Настраиваемые опции окрестности.

    Например, допустим, вы используете три независимых переменных с типом окрестности Золотой поиск и 30 минимальным и 40 максимальным числом соседей. Если инструмент запустится с этими параметрами, каждая из трех независимых переменных будет использовать в расчетах данные от 30 до 40 соседних объектов. Если же вы хотите использовать от 45 до 55 соседей только для второй независимой переменной, вы можете указать вторую независимую переменную, пользовательское значение минимума и пользовательское значение максимума в столбцах параметра Число соседей для золотого поиска. Таким образом, для первой и третьей независимых переменных будут использоваться данные от 30 до 40 соседей, а вторая независимая переменна будет использовать в расчетах данные от 45 до 55 соседних объектов.

  • В сообщениях инструмента геообработки есть несколько проверок модели, которые можно использовать для оценки надежности модели МГВР. Просмотрите результаты этих проверок до того, как оцените другие выходные данные инструмента. Если проверки модели вас устраивают, посмотрите диаграммы и символы выходных объектов для лучшего понимания результатов.

    Подробнее о проверках модели и выходных данных инструмента

  • Просмотрите результаты и проверьте, являются ли отношения между каждой зависимой и независимой переменной линейными, имеется ли избыточность (мультиколлинеарность) или отсутствие (неверная спецификация) каких-либо независимых переменных, наличие выбросов или кластеризации в распределении невязок. Более подробно о возможных проблемах моделей регрессии см. Основы регрессионного анализа.

  • Для получения более точных результатов, перепроецируйте данные в систему координат проекции, если координаты представлены в виде широты и долготы. Это особенно важно при использовании опции Диапазон расстояний в параметре Тип окрестности, так как для оптимизации необходимо точное измерение расстояний.

  • Если вы отметите параметр Масштабировать данные, будет создан слой для каждого коэффициента пересчета. Коэффициенты, в соответствии с которыми пересчитываются единицы измерения исходных данных, хранятся как поля в выходном классе объектов. Если растровые коэффициенты созданы с использованием параметра Рабочая область растровых коэффициентов создаются слои пересчитанных растровых коэффициентов, и пересчитанные растры сохраняются в этой рабочей области.

    Рекомендуется пересчитывать и зависимую и независимые переменные. Это особенно важно, если диапазон значений переменных существенно меняется, так как пересчет выравнивает дисперсию независимых переменных. При численной оценке ширины полосы и коэффициентов каждой локальной модели оценки обычно сходятся быстрее и ведут к более точным значениям, если каждая переменная вносит равный вклад в общую дисперсию данных. Если независимые переменные имеют разную вариабельность, переменные с большей вариабельностью сильнее влияют на каждый шаг итеративной оценки. В большинстве случаев это отрицательно влияет на результирующую ширину полосы и коэффициенты модели.

  • В ряде случаев опция Интервал вручную для параметра Метод выбора окрестности может выдать более низкое значение критерия AIC, чем опция Золотой поиск, даже если поиск выполняется при одинаковом диапазоне расстояний или числе соседей. И так же, если вы выполняете Золотой поиск или интервал вручную, затем указываете для оценивания диапазоны ширины полосы или числа соседей, используя опцию Определен пользователем, результаты не будут в точности такие же. Оба этих поведения обусловлены зависимостями пути алгоритмов Золотого поиска и обратной подгонки, которые используются для оценки параметров модели МГВР. Чтобы воспроизвести те же результаты МГВП, вы должны запустить инструмент с теми же настройками параметров.

Параметры

ПодписьОписаниеТип данных
Входные объекты

Класс пространственных объектов, содержащий зависимые и независимые переменные.

Feature Layer
Зависимая переменная

Числовое поле, содержащее значения, которые нужно смоделировать.

Field
Тип модели

Определяет модель регрессии на основании значений зависимой переменной. В настоящий момент поддерживаются только непрерывные данные, поэтому параметр в панели Геообработка скрыт. Не используйте зависимые переменные, содержащие категории, количества или бинарные данные.

  • НепрерывныеЗависимая переменная представляет непрерывные данные. Используется по умолчанию.
String
Независимые переменные

Перечень полей, которые будут использованы в качестве независимых переменных в вашей регрессионной модели.

Field
Выходные объекты

Создаваемый новый класс объектов, содержащий коэффициенты, невязки и уровни значимости модели МГВР. Класс объектов будет добавлен в панель Содержание как составной слой.

Feature Class
Тип окрестности

Указывает, будет ли окрестность с фиксированным расстоянием, или допускаются изменения в пространстве как в зависимости от плотности объектов.

  • Число соседейРазмер окрестности определяется числом ближайших соседей для каждого объекта. Если объекты расположены плотно, пространственный экстент окрестности небольшой; если же объекты распределены в пространстве, пространственный экстент окрестности увеличивается.
  • Диапазон расстоянийРазмер окрестности будет постоянным (фиксированным) для каждого объекта.
String
Метод выбора окрестности

Задает, как будут определяться размер окрестности.

  • Золотой поискОптимальное расстояние или число соседей определяется по минимальному значению AIC с использованием алгоритма Золотого поиска. Эта опция требует больше времени для вычисления, особенно для больших наборов данных и наборов данных с большим диапазоном значений.
  • Градиентный поискОптимальное расстояние или число соседей определяется по минимальному значению AIC с использованием алгоритма оптимизации на основе градиента. Эта опция выполняется быстрее и требует значительно меньше памяти, чем опция Золотого поиска.
  • Интервалы вручнуюРасстояние или число соседей определяется тестированием диапазона значений и выбором нужного по минимальному значению AIC. Если параметр Тип окрестности установлен на Расстояние поиска, минимальное значение диапазона определяется параметром Минимальное расстояние поиска. Минимальное значение затем увеличивается в соответствии с инкрементом, заданным в параметре Инкремент расстояния поиска. Это повторяется определенное число раз, указанное в параметре Число инкрементов. Если параметр Тип окрестности установлен на Число соседей, минимальное значение, размер инкремента и число инкрементов указывается в параметрах Минимальное число соседей, Инкремент числа соседей и Число инкрементов соответственно.
  • Определен пользователемРазмер окрестности будет определен параметрами Число соседей или Диапазон расстояний.
String
Минимальное число соседей
(Дополнительный)

Минимальное число соседей каждого объекта, которое будет включено в расчет. Рекомендуется использовать не менее 30 соседей.

Long
Максимальное число соседей
(Дополнительный)

Максимальное число соседей каждого объекта, которое будет включено в расчет.

Long
Единицы измерения расстояния
(Дополнительный)

Определяет единицы измерения, которые будут использованы при измерениях расстояний между объектами.

  • Международные футыРасстояния будут измерены в международных футах.
  • Сухопутные милиРасстояния будут измерены в сухопутных милях.
  • Геодезические футы СШАРасстояния будут измерены в геодезических футах США.
  • МетрыРасстояния будут измерены в метрах.
  • KilometersРасстояния будут измерены в километрах.
  • Геодезические мили СШАРасстояния будут измерены в геодезических милях США.
String
Минимальное расстояние поиска
(Дополнительный)

Минимальное расстояние поиска, применимое к каждой независимой переменной. Рекомендуется использовать расстояние, в пределах которого каждый объект имеет, по меньшей мере, 30 соседей.

Double
Максимальное расстояние поиска
(Дополнительный)

Максимальное расстояние поиска, применимое к каждой независимой переменной.

Double
Инкремент числа соседей
(Дополнительный)

Число, на которое в опции Интервал вручную будет увеличено число соседей в процессе оценки окрестности.

Long
Инкремент расстояния поиска
(Дополнительный)

Расстояние, на которое в опции Интервал вручную будет увеличена окрестность в процессе оценки.

Double
Число инкрементов
(Дополнительный)

Число размеров окрестностей для тестирования при использовании интервалов вручную. Первый размер окрестности - значение параметра Минимальное число соседей или Минимальное расстояние поиска.

Long
Число соседей
(Дополнительный)

Число соседей, используемое для типа окрестности, определенного пользователем.

Long
Диапазон расстояний
(Дополнительный)

Размер диапазона расстояний, используемый для типа окрестности, определенного пользователем. Все, находящиеся в пределах этого расстояния, объекты будут считаться соседними в локальной модели.

Double
Число соседей для золотого поиска
(Дополнительный)

Настроенные опции золотого поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное число соседей и максимальное число соседей в соответствующих столбцах.

Value Table
Число соседей для интервалов вручную
(Дополнительный)

Настроенные опции интервала вручную для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите минимальное число соседей, инкремент числа соседей и число инкрементов в соответствующих столбцах.

Value Table
Заданное пользователем число соседей
(Дополнительный)

Настроенные, определенные пользователем опции для независимых переменных. Для каждой настраиваемой независимой переменной укажите число соседей.

Value Table
Расстояние поиска для золотого поиска
(Дополнительный)

Настроенные опции золотого поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное расстояние поиска и максимальное расстояние поиска в соответствующих столбцах.

Value Table
Расстояние поиска для интервалов вручную
(Дополнительный)

Настроенные опции интервалов вручную для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное расстояние поиска, инкремент расстояния поиска и число инкрементов в соответствующих столбцах.

Value Table
Заданное пользователем расстояние поиска
(Дополнительный)

Настроенные, определенные пользователем опции для независимых переменных. Для каждой настраиваемой переменной укажите переменную и расстояние в соответствующих столбцах.

Value Table
Прогнозируемые местоположения
(Дополнительный)

Класс объектов местоположений, для которых вычисляются оценки. Каждый объект в этом наборе данных должен содержать значения для каждой указанной независимых переменных. Зависимая переменная для этих объектов будет оценена на основании модели, калиброванной для данных во входном классе объектов. Эти объекты местоположений должны быть близко (в пределах 115 процентов экстента) или в той же области изучения, что и исходные объекты.

Feature Layer
Независимые переменные для сопоставления
(Дополнительный)

Независимые переменные прогнозируемых местоположений, соответствующие независимым переменным входного класса объектов.

Value Table
Выходные объекты прогнозирования
(Дополнительный)

Выходной класс объектов с оценками зависимой переменной для каждого прогнозируемого местоположения.

Feature Class
Грубый прогноз
(Дополнительный)

Определяет объекты, которые будут использоваться в вычислении прогнозированных значений.

  • Отмечено — объекты со значениями больше чем на три среднеквадратических отклонения чем среднее, (выбросы) и объекты с весом 0 (пространственные выбросы) будут исключены из расчета прогнозов, но получат прогнозируемое значение в выходном классе объектов. Используется по умолчанию.
  • Не отмечено — все объекты будут использоваться в вычислении прогнозирования.

Boolean
Локальная схема весов
(Дополнительный)

Определяет тип кернфункции, которая будет использоваться при присвоении пространственных весов в модели. Кернфункция определяет, каким образом каждый объект связан с остальными объектами в пределах окрестности.

  • БиквадратнаяВес, равный 0, присваивается объектам, находящимся за пределами указанной окрестности. Используется по умолчанию.
  • ГауссоваВсем объектам присваивается какой-либо вес, причем значение веса снижается экспоненциально по мере удаления от целевого объекта.
String
Выходная таблица окрестности
(Дополнительный)

Таблица, содержащая выходные вычисления статистики модели МГВР. Столбчатая диаграмма оцениваемых диапазонов расстояний или количеств соседей, включенные в выходные данные.

Table
Рабочая область растровых коэффициентов
(Дополнительный)

Рабочая область, где будут создаваться растровые коэффициенты. Когда указана эта рабочая область, растры создаются для точки пересечения и каждой независимой переменной. Этот параметр доступен только при условии наличия лицензии Desktop Advanced. Если указана директория, все растры будут растрового типа TIFF (.tif).

Workspace
Масштабировать данные
(Дополнительный)

Указывает, будет ли выполнена стандартизация значений независимых и зависимой переменной (называемая стандартизацией Z-оценки), то есть пересчет для получения среднего значения - 0 и значения среднеквадратического значения - 1 перед подгонкой модели.

  • Отмечено — значения переменных пересчитываются. Результаты будут включать пересчитанные и не пересчитанные варианты коэффициентов независимых переменных.
  • Отмечено — значения переменных не пересчитываются. Все коэффициенты останутся не пересчитанными в исходных единицах данных.

Boolean
Число соседей для градиентного поиска
(Дополнительный)

Настроенные опции градиентного поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное число соседей и максимальное число соседей в соответствующих столбцах.

Value Table
Расстояние поиска для градиентного поиска
(Дополнительный)

Настроенные опции градиентного поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное расстояние поиска и максимальное расстояние поиска в соответствующих столбцах.

Value Table

Производные выходные данные

ПодписьОписаниеТип данных
Слой растровых коэффициентов

Выходные растры коэффициентов независимых переменных.

Raster
Выходной составной слой

Составной слой выходных данных. Имя составного слоя указывается в параметре Выходные объекты, с добавлением фразы _MGWR_Results. Он содержит стандартизированные невязки и отдельный составной подслой для каждой независимой переменной. Каждый составной подслой включает слой Коэффициент и слой Significance. Составной слой будет добавлен к панели Содержание.

Group Layer

arcpy.stats.MGWR(in_features, dependent_variable, model_type, explanatory_variables, output_features, neighborhood_type, neighborhood_selection_method, {minimum_number_of_neighbors}, {maximum_number_of_neighbors}, {distance_unit}, {minimum_search_distance}, {maximum_search_distance}, {number_of_neighbors_increment}, {search_distance_increment}, {number_of_increments}, {number_of_neighbors}, {distance_band}, {number_of_neighbors_golden}, {number_of_neighbors_manual}, {number_of_neighbors_defined}, {distance_golden}, {distance_manual}, {distance_defined}, {prediction_locations}, {explanatory_variables_to_match}, {output_predicted_features}, {robust_prediction}, {local_weighting_scheme}, {output_table}, {coefficient_raster_workspace}, {scale}, {number_of_neighbors_gradient}, {distance_gradient})
ИмяОписаниеТип данных
in_features

Класс пространственных объектов, содержащий зависимые и независимые переменные.

Feature Layer
dependent_variable

Числовое поле, содержащее значения, которые нужно смоделировать.

Field
model_type

Определяет модель регрессии на основании значений зависимой переменной. В настоящий момент поддерживаются только непрерывные данные, поэтому параметр в панели Геообработка скрыт. Не используйте зависимые переменные, содержащие категории, количества или бинарные данные.

  • CONTINUOUSЗависимая переменная представляет непрерывные данные. Используется по умолчанию.
String
explanatory_variables
[explanatory_variables,...]

Перечень полей, которые будут использованы в качестве независимых переменных в вашей регрессионной модели.

Field
output_features

Создаваемый новый класс объектов, содержащий коэффициенты, невязки и уровни значимости модели МГВР.

Feature Class
neighborhood_type

Указывает, будет ли окрестность с фиксированным расстоянием, или допускаются изменения в пространстве как в зависимости от плотности объектов.

  • NUMBER_OF_NEIGHBORSРазмер окрестности определяется числом ближайших соседей для каждого объекта. Если объекты расположены плотно, пространственный экстент окрестности небольшой; если же объекты распределены в пространстве, пространственный экстент окрестности увеличивается.
  • DISTANCE_BANDРазмер окрестности будет постоянным (фиксированным) для каждого объекта.
String
neighborhood_selection_method

Задает, как будут определяться размер окрестности.

  • GOLDEN_SEARCHОптимальное расстояние или число соседей определяется по минимальному значению AIC с использованием алгоритма Золотого поиска. Эта опция требует больше времени для вычисления, особенно для больших наборов данных и наборов данных с большим диапазоном значений.
  • GRADIENT_SEARCHОптимальное расстояние или число соседей определяется по минимальному значению AIC с использованием алгоритма оптимизации на основе градиента. Эта опция выполняется быстрее и требует значительно меньше памяти, чем опция Золотого поиска.
  • MANUAL_INTERVALSРасстояние или число соседей определяется тестированием диапазона значений и выбором нужного по минимальному значению AIC. Если параметр neighborhood_type установлен на DISTANCE_BAND, минимальное значение диапазона определяется параметром minimum_search_distance. Минимальное значение затем увеличивается в соответствии с инкрементом, заданным в параметре search_distance_increment. Это повторяется определенное число раз, указанное в параметре number_of_increments. Если параметр neighborhood_type установлен на NUMBER_OF_NEIGHBORS, минимальное значение, размер инкремента и число инкрементов указывается в параметрах minimum_number_of_neighbors, number_of_neighbors_increment и number_of_increments соответственно.
  • USER_DEFINEDРазмер окрестности будет определен параметрами number_of_neighbors или distance_band.
String
minimum_number_of_neighbors
(Дополнительный)

Минимальное число соседей каждого объекта, которое будет включено в расчет. Рекомендуется использовать не менее 30 соседей.

Long
maximum_number_of_neighbors
(Дополнительный)

Максимальное число соседей каждого объекта, которое будет включено в расчет.

Long
distance_unit
(Дополнительный)

Определяет единицы измерения, которые будут использованы при измерениях расстояний между объектами.

  • FEETINTРасстояния будут измерены в международных футах.
  • MILESINTРасстояния будут измерены в сухопутных милях.
  • FEETРасстояния будут измерены в геодезических футах США.
  • METERSРасстояния будут измерены в метрах.
  • KILOMETERSРасстояния будут измерены в километрах.
  • MILESРасстояния будут измерены в геодезических милях США.
String
minimum_search_distance
(Дополнительный)

Минимальное расстояние поиска, применимое к каждой независимой переменной. Рекомендуется использовать расстояние, в пределах которого каждый объект имеет, по меньшей мере, 30 соседей.

Double
maximum_search_distance
(Дополнительный)

Максимальное расстояние поиска, применимое к каждой независимой переменной.

Double
number_of_neighbors_increment
(Дополнительный)

Число, на которое в опции Интервал вручную будет увеличено число соседей в процессе оценки окрестности.

Long
search_distance_increment
(Дополнительный)

Расстояние, на которое в опции Интервал вручную будет увеличена окрестность в процессе оценки.

Double
number_of_increments
(Дополнительный)

Число размеров окрестностей для тестирования при использовании интервалов вручную. Первый размер окрестности - значение параметра minimum_number_of_neighbors или minimum_search_distance.

Long
number_of_neighbors
(Дополнительный)

Число соседей, используемое для типа окрестности, определенного пользователем.

Long
distance_band
(Дополнительный)

Размер диапазона расстояний, используемый для типа окрестности, определенного пользователем. Все, находящиеся в пределах этого расстояния, объекты будут считаться соседними в локальной модели.

Double
number_of_neighbors_golden
[number_of_neighbors_golden,...]
(Дополнительный)

Настроенные опции золотого поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное число соседей и максимальное число соседей в соответствующих столбцах.

Value Table
number_of_neighbors_manual
[number_of_neighbors_manual,...]
(Дополнительный)

Настроенные опции интервала вручную для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите минимальное число соседей, инкремент числа соседей и число инкрементов в соответствующих столбцах.

Value Table
number_of_neighbors_defined
[number_of_neighbors_defined,...]
(Дополнительный)

Настроенные, определенные пользователем опции для независимых переменных. Для каждой настраиваемой независимой переменной укажите число соседей.

Value Table
distance_golden
[distance_golden,...]
(Дополнительный)

Настроенные опции золотого поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное расстояние поиска и максимальное расстояние поиска в соответствующих столбцах.

Value Table
distance_manual
[distance_manual,...]
(Дополнительный)

Настроенные опции интервалов вручную для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное расстояние поиска, инкремент расстояния поиска и число инкрементов в соответствующих столбцах.

Value Table
distance_defined
[distance_defined,...]
(Дополнительный)

Настроенные, определенные пользователем опции для независимых переменных. Для каждой настраиваемой переменной укажите переменную и расстояние в соответствующих столбцах.

Value Table
prediction_locations
(Дополнительный)

Класс объектов местоположений, для которых вычисляются оценки. Каждый объект в этом наборе данных должен содержать значения для каждой указанной независимых переменных. Зависимая переменная для этих объектов будет оценена на основании модели, калиброванной для данных во входном классе объектов. Эти объекты местоположений должны быть близко (в пределах 115 процентов экстента) или в той же области изучения, что и исходные объекты.

Feature Layer
explanatory_variables_to_match
[explanatory_variables_to_match,...]
(Дополнительный)

Независимые переменные прогнозируемых местоположений, соответствующие независимым переменным входного класса объектов.

Value Table
output_predicted_features
(Дополнительный)

Выходной класс объектов с оценками зависимой переменной для каждого прогнозируемого местоположения.

Feature Class
robust_prediction
(Дополнительный)

Определяет объекты, которые будут использоваться в вычислении прогнозированных значений.

  • ROBUSTОбъекты со значениями больше чем на три среднеквадратических отклонения чем среднее, (выбросы) и объекты с весом 0 (пространственные выбросы) будут исключены из расчета прогнозов, но получат прогнозируемое значение в выходном классе объектов. Используется по умолчанию.
  • NON_ROBUSTВсе объекты будут использоваться в вычислении прогнозирования.
Boolean
local_weighting_scheme
(Дополнительный)

Определяет тип кернфункции, которая будет использоваться при присвоении пространственных весов в модели. Кернфункция определяет, каким образом каждый объект связан с остальными объектами в пределах окрестности.

  • BISQUAREВес, равный 0, присваивается объектам, находящимся за пределами указанной окрестности. Используется по умолчанию.
  • GAUSSIANВсем объектам присваивается какой-либо вес, причем значение веса снижается экспоненциально по мере удаления от целевого объекта.
String
output_table
(Дополнительный)

Таблица, содержащая выходные вычисления статистики модели МГВР. Столбчатая диаграмма оцениваемых диапазонов расстояний или количеств соседей, включенные в выходные данные.

Table
coefficient_raster_workspace
(Дополнительный)

Рабочая область, где будут создаваться растровые коэффициенты. Когда указана эта рабочая область, растры создаются для точки пересечения и каждой независимой переменной. Этот параметр доступен только при условии наличия лицензии Desktop Advanced. Если указана директория, все растры будут растрового типа TIFF (.tif).

Workspace
scale
(Дополнительный)

Указывает, будет ли выполнен пересчет значений независимых и зависимой переменной для получения среднего значения - 0, и значения среднеквадратического значения - 1 перед подгонкой модели.

  • SCALE_DATAЗначения переменных пересчитываются. Результаты будут включать пересчитанные и не пересчитанные варианты коэффициентов независимых переменных.
  • NO_SCALE_DATAЗначения переменных не пересчитываются. Все коэффициенты останутся не пересчитанными в исходных единицах данных.
Boolean
number_of_neighbors_gradient
[number_of_neighbors_gradient,...]
(Дополнительный)

Настроенные опции градиентного поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное число соседей и максимальное число соседей в соответствующих столбцах.

Value Table
distance_gradient
[distance_gradient,...]
(Дополнительный)

Настроенные опции градиентного поиска для отдельных независимых переменных. Для каждой настраиваемой независимой переменной укажите переменную, минимальное расстояние поиска и максимальное расстояние поиска в соответствующих столбцах.

Value Table

Производные выходные данные

ИмяОписаниеТип данных
coefficient_raster_layers

Выходные растры коэффициентов независимых переменных.

Raster
output_layer_group

Составной слой выходных данных. Имя составного слоя указывается в параметре Выходные объекты, с добавлением фразы _MGWR_Results. Он содержит стандартизированные невязки и отдельный составной подслой для каждой независимой переменной. Каждый составной подслой включает слой Коэффициент и слой Significance. Составной слой будет добавлен к панели Содержание.

Group Layer

Пример кода

MGWR, пример 1 (окно Python)

Следующий скрипт окна Python демонстрирует использование функции MGWR.


import arcpy
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")
MGWR, пример 2 (автономный скрипт)

Следующий автономный Python скрипт демонстрирует, как использовать функцию MGWR.

# Run MGWR to predict house prices using "Number of Neighbors" and "Golden Search"
# Import modules
import arcpy

# Set the current workspace
arcpy.env.workspace = "C:/data"

# Run MGWR 
arcpy.stats.MGWR("r\data.gdb\house_price", "price", "CONTINUOUS", 
                 "review;beds;areas", r"data.gdb\house_price_fit_model", 
                 "DISTANCE_BAND", "GOLDEN_SEARCH", None, None, None, None, 
                 None, None, None, None, None, None, None, None, None, 
                 "review # #;beds # #; areas # #", None, None, 
                 r"data.gdb\house_price", "review review;beds beds; areas areas", 
                 r"data.gdb\house_price_prediction", "ROBUST", "BISQUARE")