При большом объеме анализируемых пространственных данных важен масштаб анализа. Например, значением по умолчанию для параметра Определение пространственных взаимоотношений инструмента Анализ горячих точек является полоса фиксированных расстояний. Многие инструменты обработки плотностей требуют значения радиуса. Расстояние, которое вы указываете, должно соответствовать масштабу вопроса, на который вы пытаетесь ответить, или масштабу устранения последствий, которые вы рассматриваете. Например, вы хотите проанализировать уровень ожирения среди детей. Каков масштаб данного анализа? Оно проводится на уровне отдельных семей или районов? Если да, расстояние, используемое для определения масштаба анализа, будет небольшим, чтобы охватить дома в одном или двух кварталах друг от друга. Или же, каким будет масштаб устранения последствий? Возможно, вопрос включает рассмотрение того, где необходимо расширить спортивные программы после школы, чтобы потенциально уменьшить детское ожирение. В таком случае расстояние, скорее всего, будет отражать школьные зоны. Иногда довольно легко определить подходящий масштаб анализа; если вы анализируете закономерности поездок на работу и знаете, что средний путь на работу составляет, например, 12 миль, то 12 миль — это подходящее расстояние для анализа. В других ситуациях обосновать расстояние анализа сложнее. В таком случае может оказаться полезным инструмент Пошаговая пространственная автокорреляция.
Когда вы видите пространственную кластеризацию в ландшафте, вы видите доказательства работы внутренних пространственных процессов. Знание о пространственном масштабе, в котором будут работать базовые процессы, может помочь вам выбрать необходимое расстояние анализа. Инструмент Пошаговая пространственная автокорреляция запускает инструмент Пространственная автокорреляция (Глобальный индекс Морана I) с последовательностью увеличивающихся расстояний для измерения интенсивности пространственной кластеризации для каждого расстояния. Интенсивность кластеризации определяется z-оценкой. Обычно при увеличении расстояния растет и z-оценка, что указывает на повышенную интенсивность кластеризации. Однако на определенном расстоянии z-показатель обычно достигает пика. Иногда пиков несколько.
Пиковые z-оценки соответствует расстояниям, при которых пространственные процессы, обеспечивающие пространственную кластеризацию, наиболее выражены. Цвет каждой точки на графике соответствует статистической значимости значений z-оценок.
Одна из стратегий для определения необходимого масштаба анализа – выбор расстояния, связанного со статистически значимым пиком, которое лучше всего отражает масштаб анализа. Зачастую это первый статистически значимый пик.
Определите значения начального расстояния и приращения расстояния
Все измерения расстояний основаны на центроидах объектов, а значение параметра Начальное расстояние по умолчанию — это наименьшее расстояние, которое гарантирует, что каждый объект имеет хотя бы один соседний объект. Как правило, это хороший вариант, если только набор данных не содержит выбросов по местоположению. Определите, есть ли выбросы по местоположению; затем выберите все объекты, кроме выбросов, и запустите Пошаговую пространственную автокорреляцию только для выбранных объектов. Если вы нашли пиковое расстояние для выбранного набора объектов, используйте это расстояние для создания файла матрицы пространственных весов на основе всех ваших объектов (даже выбросов). При запуске инструмента Построить матрицу пространственных весов для создания файла матрицы пространственных весов установите для параметра Количество соседей значение, чтобы все объекты имели как минимум такое количество соседних объектов.
Значение параметра Приращение расстояния по умолчанию — это среднее расстояние до ближайшего соседнего объекта каждого объекта. Если вы определили нужное начальное расстояние, используя стратегии, описанные выше, но не нашли пиковое расстояние, можно поэкспериментировать с меньшими или большими приращениями расстояния.
Нет пикового расстояния
В некоторых случаях вы можете использовать инструмент Пошаговая пространственная автокорреляция и получите график с z-оценкой, которая постоянно растет при увеличении расстояний; пикового значения нет. Это чаще всего происходит, когда данные были объединены, а масштаб процессов, влияющих на переменную Входное поле, меньше схемы агрегации. Вы можете попробовать уменьшить значение приращения расстояния, чтобы увидеть, появятся ли более выраженные пики. Однако иногда пик отсутствует, поскольку в исследуемой области происходит множество пространственных процессов, каждый из которых действует на разном расстоянии. Это часто происходит при работе с большими точечными наборами данных с множеством помех (без четкого пространственного шаблона для анализируемых данных). В этом случае необходимо обосновать масштаб анализа другими критериями.
Интерпретация результатов
При запуске инструмента Пошаговая пространственная автокорреляция результаты z-оценки для каждого расстояния записываются в виде сообщений. Чтобы получить доступ к сообщениям, поместите курсор мыши над индикатором выполнения и щелкните всплывающую кнопку или разверните раздел сообщений в панели Геообработка. Вы можете получить доступ к сообщениям для выполненного ранее инструмента через историю геообработки. Если вы указываете путь для дополнительного параметра Выходная таблица, создается таблица с полями Distance, Morans I, Expected I, variance, z_score и p_value.
Изучая линейную диаграмму Пространственная автокорреляция по расстоянию и значения z-оценок, записанные в виде сообщений, можно определить наличие пиковых расстояний. На изображении ниже диаграмма имеет две пиковые z-оценки, связанные с расстояниями 8100 и 11500 футов.
Если вы используете параметр Выходная таблица для создания таблицы значений автокорреляции, таблица будет включать линейную диаграмму Пространственная автокорреляция по расстоянию. Это та же самая диаграмма, которая появляется в сообщениях.
Дополнительные ресурсы
Дополнительные сведения см. в следующих ресурсах:
- Видео, демонстрирующие опыт применения анализа горячих точек:
- Учебное руководство Анализ пространственных структурных закономерностей описывает рабочий процесс анализа данных по лихорадке денге с использованием инструмента Пошаговая пространственная автокорреляция.
- См. Выбор диапазона фиксированных расстояний в разделе Моделирование пространственных отношений.
- Раздел Как работает Анализ горячих точек (Getis-Ord Gi*) включает обсуждение поиска подходящего масштаба анализа.
- Для получения актуального списка всех доступных ресурсов пространственной статистики перейдите на страницу Ресурсы пространственной статистики.