Практические примеры при выборе диапазона фиксированных расстояний

Фиксированное расстояние можно представить себе в виде движущегося окна, которое быстро фокусируется на каждом пространственном объекте и рассматривает этот объект в контексте его окрестностей. Следующие подсказки и практические примеры помогут вам выбрать подходящий диапазон фиксированных расстояний для анализа:

  • Выбирайте расстояние на основе знаний о географическом экстенте пространственных процессов, обеспечивающих кластеризацию изучаемого явления. Зачастую вы не можете точно определить это, но, если такая информация доступна, ее следует использовать для выбора диапазона расстояния. Предположим, например, вы знаете, что среднее расстояние ежедневного пути на работу составляет 15 миль. Для анализа этих данных, лучше использовать диапазон расстояний в 15 миль.
  • Используйте достаточно большой диапазон расстояний, чтобы каждый пространственный объект мог иметь как минимум одного соседа в окрестности, в противном случае результаты будут недействительными.
  • Если распределение данных смещено (кривая распределения значений на гистограмме не похожа на форму колокола), необходимо убедиться, что выбранный диапазон расстояний не является слишком малым (большинство пространственных объектов имеют только одного или двух соседей) или слишком большим (в окрестности несколько объектов входят все остальные пространственные объекты), поскольку это может привести к получению недостоверных z-оценок.
  • Z-оценки будут достоверны (даже при использовании смещенных данных) в тех случаях, когда выбран такой диапазон расстояний, в котором для каждого пространственного объекта можно идентифицировать несколько (примерно 8) соседей. Даже если ни у одного из объектов нет соседей среди других объектов, могут возникнуть проблемы с производительностью и даже потенциальные ограничения памяти, если в соответствии с указанным диапазоном расстояний у объектов будут тысячи соседей.
  • Иногда, если пытаться сделать так, чтобы у всех объектов был хотя бы один сосед, можно получить объекты с тысячами соседей, а это нежелательно. Это может произойти, если некоторые объекты являются пространственными выбросами. Чтобы устранить эту проблему, определите соответствующий диапазон расстояний для всех объектов, кроме выбросов и используйте инструмент Построить матрицу пространственных весов, чтобы создать файл матрицы пространственных весов с использованием этого расстояния. При запуске инструмента Построить матрицу пространственных весов укажите минимальное число соседей для параметра Количество соседей. Например: предположим, что вы оцениваете доступ к здоровой пище в округе Лос-Анджелеса с использованием данных переписи. Вы знаете, что более 90 процентов населения живут в пяти километрах от магазинов. Если вы проанализируете переписные участки, то вы обнаружите, что расстояние между ними (на основе центроидов районов) в центральном районе составляет в среднем около 1 000 метров, в то время как расстояния между участками в удаленных районах превышают 18 000 метров. Чтобы быть уверенным, что для каждого объекта можно идентифицировать хотя бы одного соседа, диапазон расстояний должен более 18000 метров. Такой масштаб анализа не подходит для исследуемого вопроса. Для решения задачи нужно создать файл матрицы пространственных весов для класса объектов района переписи с помощью инструмента Построить матрицу пространственных весов. Укажите такое значение для Диапазона расстояний или порогового расстояния, которое будет подходить для всех объектов, кроме пространственных выбросов – например, 4800 метров (приблизительно 3 мили) – и минимальное число соседей для параметра Число соседей (например, 2). Так окрестность в 4800 метров будет применена ко всем объектам, кроме объектов, у которых нет хотя бы двух соседей на этом расстоянии. Для отдаленных объектов (и только для них) расстояние будет увеличено так, чтобы у каждого объекта было, по крайней мере, два соседа.
  • Используйте диапазон расстояний, который отражает максимальную пространственную автокорреляцию. Когда вы видите пространственную кластеризацию ландшафта, вы видите проявление работы внутренних пространственных процессов. Диапазон расстояний, который представляет максимальную кластеризацию, измеренную инструментом Пошаговая пространственная автокорреляция, является расстоянием, на котором данный пространственный процесс проявляется наиболее активно или лучше выражен. Запустите инструмент Пошаговая пространственная автокорреляция и определите, при каком расстоянии полученные z-оценки будут максимальными. Используйте расстояние, обеспечивающее пиковые значения, для последующего анализа.
    Примечание:

    Введите значение расстояний в единицах, соответствующих единицам пространственной привязки слоя или указанному в параметре среды геообработки Выходная система координат.

    • Каждое максимальное значение соответствует расстоянию, при котором процессы, обеспечивающие пространственную кластеризацию, наиболее выражены. Часто имеется несколько максимальных значений. В основном, максимальные значения, связанные с большими расстояниями, отражают широкие тренды (широкий тренд с востока на запад, например, где запад является гигантской "горячей точкой", а восток – гигантской "холодной точкой"). В общем случае более интересны максимальные значения, связанные с меньшими расстояниями, как правило, первый максимум.
    • Малозаметный пик часто означает наличие нескольких различных пространственных процессов, действующих при различных пространственных масштабах. Возможно, следует изучить другие критерии, чтобы определить фиксированное расстояние, которое следует использовать для данного анализа (или более эффективное расстояние для исправления полученных результатов).
    • Если z-оценка не демонстрирует пиков (другими словами, продолжает возрастать), а вы используете сгруппированные данные (например, округа), это обычно означает, что схема группировки слишком груба; интересующие вас пространственные процессы действуют при меньшем масштабе, чем масштаб группируемых единиц. Если вы можете использовать меньший масштаб анализа (перейти от округов к районам, например), это поможет определить необходимую дистанцию. Если вы работаете с точечными данными и z-оценка не достигает пика, то это означает, что в наличии множество различных пространственных процессов на разных пространственных масштабах. Вам потребуется использовать другой критерий для определения фиксированного расстояния в анализе. Также необходимо убедиться, что значение Начальное расстояние при запуске инструмента Пошаговая пространственная автокорреляция не слишком велико.
    • Если не указать начальное расстояние, инструмент Пошаговая пространственная автокорреляция будет использовать расстояние, позволяющее получить для всех объектов хотя бы одного соседа. Если данные содержат пространственные выбросы, это расстояние может быть слишком большим для анализа, поэтому вы и не увидите выраженного пика в выходном файле отчета. Чтобы устранить эту проблему, запустите инструмент Пошаговая пространственная автокорреляция для выбранных объектов, из которых временно исключены все пространственные выбросы. Если после исключения выбросов удалось найти пик, используйте стратегию, описанную выше, с применением этого пикового расстояния ко всем объектам (в том числе пространственным выбросам) и укажите, чтобы у каждого объекта был минимум один или два соседа. Если вы не уверены в том, являются ли объекты пространственными выбросами, попробуйте следующее:
      • При работе с полигональными данными отображайте области полигонов с помощью схемы отображения Среднеквадратичное отклонение и считайте полигоны с областями более трех стандартных отклонений пространственными выбросами. Можно использовать инструмент Вычислить поле для создания поля с полигональными областями, если оно отсутствует.
      • Для точечных данных используйте инструмент Ближайший объект, который вычисляет расстояние до ближайшего соседа каждого объекта. Для этого установите для инструмента Ближайший объект параметры Входные объекты и Ближайшие объекты так, чтобы они указывали на ваш набор точечных данных. После получения поля с расстояниями до ближайшего соседа отобразите эти значения с помощью метода отображения Среднеквадратичное отклонение и считайте расстояния, превышающие три стандартных отклонения, пространственными выбросами.
    Иллюстрация инструмента Пошаговая пространственная автокорреляция
    Определите расстояние, при котором процессы, обеспечивающие пространственную кластеризацию, наиболее выражены.
  • Не следует считать, что существует только один правильный диапазон расстояний. В реальности все может быть сложнее. Весьма вероятно, что влияние на наблюдаемую кластеризацию оказывают несколько пространственных процессов. Вместо поиска одного диапазона расстояний, попытайтесь рассмотреть инструменты анализа структурных закономерностей в качестве эффективного метода изучения пространственных отношений при различных пространственных масштабах. Обратите внимание, что при изменении масштаба анализа (изменении значения диапазона расстояний), появляется возможность изучения других задач. Предположим, вы исследуете входные данные. С небольшими диапазонами расстояний можно изучить закономерности в ближайшем соседстве, средние диапазоны расстояний могут отражать закономерности на уровне поселения или города, самые большие диапазоны расстояний используются для определения региональных закономерностей.