Пошаговая пространственная автокорреляция (Пространственная статистика)

Краткая информация

Измеряет пространственную автокорреляцию для серии расстояний и при необходимости создает линейный график этих расстояний и соответствующих z-оценок. z-оценки отражают интенсивность пространственной кластеризации, а статистически значимые и увеличивающиеся пиковые z-оценки обозначают расстояния, на которых пространственные процессы, обеспечивающие пространственную кластеризацию, наиболее выражены. Эти пиковые расстояния часто нужно использовать в инструментах с параметром Диапазон расстояний или Радиус расстояний.

Иллюстрация

Иллюстрация инструмента Пошаговая пространственная автокорреляция
Пиковые z-оценки соответствует расстояниям, при которых пространственные процессы, обеспечивающие пространственную кластеризацию, наиболее выражены.

Использование

  • Используйте этот инструмент, чтобы указать соответствующее значение параметров Порог расстояния или Радиус для инструментов, имеющих эти параметры, таких как Анализ горячих точек» или Плотность точек.

  • Инструмент Пошаговая пространственная автокорреляция измеряет пространственную автокорреляцию для последовательности приращений расстояния и для каждого приращения показывает соответствующие индекс Морана, Ожидаемый индекс, Дисперсию, z-оценку и p-значение. Значения записываются в виде сообщений при запуске инструмента. Сообщения также включают линейную диаграмму пространственной автокорреляции по расстоянию, на которой отображается z-оценка для каждого расстояния.

  • Если присутствует несколько статистически значимых пиков, на каждом из этих расстояний имеется выраженная кластеризация. Выберите пиковое расстояние, которое лучше всего соответствует масштабу нужного анализа. Часто это первый обнаруженный статистически значимый пик.

  • Значение параметра Входное поле должно содержать разные значения. Для математических расчетов, выполняемых в рамках этих статистических операций, требуется, чтобы исходные переменные были разными. Например, анализ не будет выполняться, если все входящие значения равны 1. Чтобы использовать данный инструмент для анализа пространственных закономерностей данных об инцидентах, попробуйте агрегировать данные об инцидентах.

  • Когда значение параметра Входной класс объектов не имеет проекции (т.е. когда координаты заданы в градусах, минутах и секундах), или когда в качестве выходной системы координат используется Географическая система координат, расстояния будут рассчитываться с помощью хордовых измерений. Измерения хордовых расстояний применяются постольку, поскольку они могут быть быстро вычислены и дают хорошие оценки истинных геодезических расстояний, по крайней мере для точек, расстояние между которыми в пределах порядка тридцати градусов. Хордовые расстояния основаны на эллипосиде вращения. Если взять две любые точки на поверхности Земли, то хордовым расстоянием между ними будет длина прямой линии, проходящей через трехмерное тело Земли и соединяющей эти две точки. Хордовые расстояния выражаются в метрах.

    Внимание:

    Следует обязательно проецировать данные, если область исследования превышает 30 градусов. Хордовые расстояния не обеспечивают точных оценок геодезических расстояний, превышающих 30 градусов.

  • Если в анализе используются хордовые расстояния, значения параметров Начальное расстояние и Приращение расстояния, если они указываются, должны быть выражены в метрах.

  • Для линейных или полигональных объектов, при расчете расстояний используются центроиды. Для мультиточек, полилиний или полигонов, состоящих их нескольких частей, центроид вычисляется с использованием средневзвешенного центра всех частей объекта. При определении весов точечные объекты имеют равный вес (1). Для линейных объектов это длина сегмента. Для полигональных – площадь.

  • Слои карты можно использовать для определения Входного класса объектов. Если в слое есть выборка, только выбранные объекты будут включены в анализ.

  • Для полигональных объектов почти всегда следует указывать Строка для параметра Стандартизация строк. Стандартизация строк нивелирует отклонение в ситуациях, когда количество соседей каждого объекта является функцией схемы агрегирования или процесса выборки, а не отражением реального пространственного распределения анализируемой переменной.

  • Если значение параметра Начальное расстояние не указано, значением по умолчанию является минимальное расстояние, необходимое для того, чтобы каждый объект в наборе данных имел хотя бы одного соседа (максимальное расстояние до ближайшего соседа среди всех объектов). Это может быть не самое подходящее начальное расстояние, если набор данных содержит выбросы.

  • Если значение параметра Приращение расстояния не указано, используется меньшее из значений среднего расстояния до ближайшего соседа или (Td - B) / I, где Td — максимальное пороговое расстояние, B – значение параметра Начальное расстояние и I – значение параметра Число диапазонов расстояний. Этот алгоритм гарантирует, что вычисления всегда будут выполняться для указанного значения Числа интервалов расстояний и что наибольший интервал расстояния не будет настолько велик, что у некоторых объектов соседями окажутся все или почти все остальные объекты.

  • Если значения параметра Начальное расстояние или Приращение расстояния приведут к тому, что диапазон расстояний окажется больше максимального порогового расстояния, значение Приращение расстояния будет автоматически уменьшено. Чтобы избежать этого, вы можете уменьшить значение Приращения расстояния или Количества диапазонов расстояний.

  • Во время работы инструмента может обнаружиться нехватка памяти. Обычно это происходит, когда вы указываете значение параметра Начальное расстояние или Приращение расстояния, в результате чего объекты имеют тысячи соседей. Лучше не создавать пространственные отношения, в которых объекты имеют тысячи соседей. Используйте меньшее значение для Приращения расстояния и временно удалите выбросы, чтобы начать с меньшего значения Начальное расстояние.

  • Даже когда инструмент вычисляет значения параметров Начальное расстояние и Приращение расстояния, время обработки может быть длительным для больших наборов данных. Вы можете улучшить производительность, выполнив следующие действия:

    • Временно удалите выбросы по местоположению (как указано выше).
    • Запустите анализ выбранных объектов в репрезентативной части исследуемой области, а не всех объектов.
    • Возьмите случайную выборку объектов из набора данных и запустите анализ для выбранных объектов.

  • Расстояния всегда должны основываться на параметре среды Выходная система координат. Опция по умолчанию для параметра среды Выходная система координат — Как у входных данных. Входные объекты проецируются в выходную систему координат перед запуском анализа.

  • Дополниетльное значение параметра Выходная таблица будет содержать значение расстояния на каждой итерации, значение индекса Морана I, ожидаемое значение индекса Морана I, дисперсию, z-оценку и значение p. Пиком будет увеличение z-оценки, за которым следует уменьшение z-оценки. Например, если инструмент находит z-оценки для расстояний 50, 100 и 150 метров (2.95, 3.68, 3.12), пик составит 100 метров. Выходная таблица также включает линейную диаграмму Пространственная автокорреляция по расстоянию, на которой отображается z-оценка каждого расстояния, которую можно использовать для идентификации пиков.

  • При использовании этого инструмента из Python объект-результат, возвращаемый при запуске инструмента, содержит следующие выходные данные:

    ПоложениеОписаниеТип данных

    0

    Первый пик

    Double

    1

    Макс. пик

    Double

Параметры

ПодписьОписаниеТип данных
Входные объекты

Класс объектов, для которого будет рассчитываться пространственная автокорреляция для последовательности расстояний.

Feature Layer
Входное поле

Числовое поле, которое будет использоваться при оценке пространственной автокорреляции.

Field
Число диапазонов расстояний

Сколько раз будет увеличен размер окрестности и сколько раз набор данных будет проанализирован для выявления пространственной автокорреляции. Начальная точка и размер приращения задаются параметрами Начальное расстояние и Приращение расстояния соответственно.

Long
Начальное расстояние
(Дополнительный)

Расстояние, на котором начнется анализ пространственной автокорреляции, и расстояние, от которого необходимо начать приращение. Значение, указанное для этого параметра, должно быть в единицах параметра среды Выходная система координат.

Double
Приращение расстояния
(Дополнительный)

Расстояние, на которое будет производиться увеличение после каждой итерации. Расстояние, используемое в анализе, начинается со значения параметра Начальное расстояние и увеличивается на величину, указанную в значении параметра Приращение расстояния. Значение, указанное для этого параметра, должно быть в единицах параметра среды Выходная система координат.

Double
Метод расстояний
(Дополнительный)

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • ЕвклидовоРасстояния будут рассчитываться с использованием расстояния по прямой между двумя точками (по прямой линии). Это значение по умолчанию
  • МанхэттенскоеРасстояния будут рассчитываться с использованием расстояния между двумя точками, измеренного вдоль осей под прямым углом (городской квартал), которое рассчитывается путем суммирования (абсолютных) разностей между координатами x и y.
String
Стандартизация строк
(Дополнительный)

Указывает, будут ли стандартизированы пространственные веса. Стандартизация строк рекомендуется в тех случаях, когда распределение объектов потенциально смещено из-за особенностей выборки или установленной схемы агрегации.

  • Отмечено — Пространственные веса будут стандартизированы. Каждый вес будет разделен на сумму его строки (сумму весов всех соседних объектов). Это значение по умолчанию
  • Не отмечено — Пространственные веса не будут стандартизированы.
Boolean
Выходная таблица
(Дополнительный)

Таблица, которая будет создана для каждого диапазона расстояний и связанного с ним результата z-оценки.

Table
Выходной файл отчета
(Дополнительный)

Будет создан файл .pdf, содержащий линейный график, обобщающий результаты.

File

Производные выходные данные

ПодписьОписаниеТип данных
Первый пик

Первая пиковая z-оценка.

Double
Максимальное пиковое

Максимальный пик z-оценки.

Double

arcpy.stats.IncrementalSpatialAutocorrelation(Input_Features, Input_Field, Number_of_Distance_Bands, {Beginning_Distance}, {Distance_Increment}, {Distance_Method}, {Row_Standardization}, {Output_Table}, {Output_Report_File})
ИмяОписаниеТип данных
Input_Features

Класс объектов, для которого будет рассчитываться пространственная автокорреляция для последовательности расстояний.

Feature Layer
Input_Field

Числовое поле, которое будет использоваться при оценке пространственной автокорреляции.

Field
Number_of_Distance_Bands

Сколько раз будет увеличен размер окрестности и сколько раз набор данных будет проанализирован для выявления пространственной автокорреляции. Начальная точка и размер приращения задаются параметрами Beginning_Distance и Distance_Increment соответственно.

Long
Beginning_Distance
(Дополнительный)

Расстояние, на котором начнется анализ пространственной автокорреляции, и расстояние, от которого необходимо начать приращение. Значение, указанное для этого параметра, должно быть в единицах параметра среды Выходная система координат.

Double
Distance_Increment
(Дополнительный)

Расстояние, на которое будет производиться увеличение после каждой итерации. Расстояние, используемое в анализе, начинается со значения параметра Beginning_Distance и увеличивается на величину, указанную в значении параметра Distance_Increment. Значение, указанное для этого параметра, должно быть в единицах параметра среды Выходная система координат.

Double
Distance_Method
(Дополнительный)

Определяет, как рассчитываются расстояния от одного объекта до соседнего объекта.

  • EUCLIDEANРасстояния будут рассчитываться с использованием расстояния по прямой между двумя точками (по прямой линии). Это значение по умолчанию
  • MANHATTANРасстояния будут рассчитываться с использованием расстояния между двумя точками, измеренного вдоль осей под прямым углом (городской квартал), которое рассчитывается путем суммирования (абсолютных) разностей между координатами x и y.
String
Row_Standardization
(Дополнительный)

Указывает, будут ли стандартизированы пространственные веса. Стандартизация строк рекомендуется в тех случаях, когда распределение объектов потенциально смещено из-за особенностей выборки или установленной схемы агрегации.

  • ROW_STANDARDIZATIONПространственные веса будут стандартизированы. Каждый вес будет разделен на сумму его строки (сумму весов всех соседних объектов). Это значение по умолчанию
  • NO_STANDARDIZATIONПространственные веса не будут стандартизированы.
Boolean
Output_Table
(Дополнительный)

Таблица, которая будет создана для каждого диапазона расстояний и связанного с ним результата z-оценки.

Table
Output_Report_File
(Дополнительный)

Будет создан файл .pdf, содержащий линейный график, обобщающий результаты.

File

Производные выходные данные

ИмяОписаниеТип данных
First_Peak

Первая пиковая z-оценка.

Double
Max_Peak

Максимальный пик z-оценки.

Double

Пример кода

IncrementalSpatialAutocorrelation, пример 1 (окно Python)

Скрипт окна Python, демонстрирующий использование функции IncrementalSpatialAutocorrelation.

import arcpy
arcpy.env.workspace = r"C:\ISA"
arcpy.stats.IncrementalSpatialAutocorrelation("911CallsCount.shp", "ICOUNT", 
                                              "20", "", "", "EUCLIDEAN",
                                              "ROW_STANDARDIZATION", 
                                              "outTable.dbf")
IncrementalSpatialAutocorrelation, пример 2 (автономный скрипт)

В следующем автономном скрипте Python показано использование функции IncrementalSpatialAutocorrelation.

# Hot Spot Analysis of 911 calls in a metropolitan area
# using the Incremental Spatial Autocorrelation and Hot Spot Analysis Tools

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables
workspace = r"C:\ISA"

try:
    # Set the current workspace (to avoid having to specify the full path to 
    # the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap together at 
    # 30 feet
    # Process: Copy Features and Integrate
    cf = arcpy.management.CopyFeatures("911Calls.shp", "911Copied.shp")
    integrate = arcpy.management.Integrate("911Copied.shp #", "30 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.stats.CollectEvents("911Copied.shp", "911Count.shp")

    # Use Incremental Spatial Autocorrelation to get the peak distance
    # Process: Incremental Spatial Autocorrelation
    isa = arcpy.stats.IncrementalSpatialAutocorrelation(ce, "ICOUNT", "20", "", 
                     "", "EUCLIDEAN", "ROW_STANDARDIZATION", "outTable.dbf", 
                     "outReport.pdf")

    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    distance = isa.getOutput(2)
    hs = arcpy.stats.HotSpots(ce, "ICOUNT", "911HotSpots.shp", "Fixed Distance Band",
                     "Euclidean Distance", "None",  distance, "", "")

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Параметры среды

Особые случаи

Выходная система координат

До начала анализа геометрия пространственных объектов проецируется в Выходную систему координат. Во всех математических вычислениях учитывается пространственная привязка Выходной системы координат. Если выходная система координат выражена в градусах, минутах и секундах, то геодезические расстояния рассчитываются с помощью хордовых расстояний.