Найти горячие точки

Значок инструмента Доступен в аналитике больших данных.

Инструмент Найти горячие точки Инструмент Найти горячие точки идентифицирует любые статистически значимые горячие точки и холодные точки в пространственной структуре ваших данных с использованием статистики Getis-Ord Gi*.

Схема рабочего процесса

Схема рабочего процесса инструмента Найти горячие точки

Примеры

  • Полицейское управление проводит анализ, чтобы определить, имеется ли связь между насильственными преступлениями и уровнем безработицы. В учебных заведениях в районах с высоким уровнем насильственных преступлений и высокой безработицей будет применена программа обеспечения занятости в летние каникулы. Инструмент Найти горячие точки может быть использован для определения районов со статистически значимыми горячими точками по уровням преступности и безработицы.
  • Сотрудник службы охраны окружающей среды изучает заболевания деревьев, чтобы определить области, где требуется обработка, и более подробно рассмотреть области, где имеется устойчивость. Инструмент Найти горячие точки может быть использован для поиска кластеров заболеваний (горячие точки) и здоровых кластеров (холодные точки).

Примечания по использованию

  • Входные объекты должны быть точками. Точки анализируются путём агрегирования пространственных объектов в пределах квадратной сетки (бинов).
  • В выходном слое появятся дополнительные поля, содержащие такую информацию, как статистическая значимость каждого объекта, p-значение и z-оценка.
  • В рамках анализа происходит агрегирование входных точек в бины заданного размера. Затем они анализируются с целью определения горячих точек. Бины агрегированных значений должны содержать разнообразие значений (число точек в каждом бине должно широко варьироваться).
  • Z-оценки и p-значения являются показателями статистической значимости, которые измеряют, насколько наблюдаемая пространственная кластеризация является чем-то большим, чем случайное распределение тех же значений. Вы сможете определить, можно или нет отклонить нулевую гипотезу с использованием агрегированных бинов. Поля p-значений и z-оценки не отражают коррекцию FDR (False Discovery Rate).
  • Высокая z-оценка и низкое р-значение для объекта свидетельствует о большой плотности инцидентов. Низкая отрицательная z-оценка и низкое р-значение для объекта свидетельствуют об отсутствии (незначительном присутствии) точек инцидентов. Чем выше (или ниже) z-оценка, чем сильнее интенсивность кластеризации. Z-оценка, стремящаяся к нулю, указывает на отсутствие очевидного объединения в кластеры.
  • z-оценка основана на вычислении гипотезы нулевой рандомизации. Дополнительные сведения о z-оценке см. в разделе Что такое z-оценка? Что такое p-значение?.
  • Инструмент Найти горячие точки позволяет выполнять анализ, используя временные шаги. Каждый временной шаг анализируется независимо от объектов вне этого шага. Чтобы использовать временной шаг, входные данные должны содержать информацию о времени и представлять момент времени. Когда применяются временные шаги, выходными объектами выступают интервалы времени, представленные полями StartTime и EndTime.
  • Для параметра Базовый временной шаг может быть указано значение даты и времени или только значение даты; только значение времени не может быть указано.

Параметры

ПараметрОписаниеТип данных

Входной слой

Точечные объекты, для которых будут вычислены горячие точки.

Объекты

Тип бина

Геометрия бина, которая будет использоваться для создания регулярных бинов. Значение по умолчанию – Квадратный.

String

Размер бина

Интервал расстояния, определяющий размер бинов, в которых будут анализироваться входные точки.

String

Размер соседства (необязательно)

Пространственный экстент области анализа соседей. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальную кластеризацию.

String

Интервал временного шага (необязательно)

Интервал временного шага. Этот параметр используется только в том случае, если схема входных точек содержит поле, помеченное как Start Time.

String

Выравнивание временного шага (необязательно)

Определяет, как будут выравниваться временные шаги. Этот параметр доступен только в том случае, если входные точки включены по времени и представляют собой момент времени.

  • Start Time – временной шаг выравнивается по первому временному событию и агрегируется вперед во времени.
  • End Time – временной шаг выравнивается по последнему событию и агрегируется назад во времени.
  • Базовое время – временные шаги выравниваются по указанным дате и времени. Если все точки во входных объектах имеют временную метку, которая больше, чем указанное базовое время (или точно соответствует начальному времени входных объектов), интервал временного шага начнется с этого времени, а агрегирование пойдет во времени вперед (так, как это происходит с выравниванием по начальному времени). Если все точки во входных объектах имеют временную метку, которая меньше, чем указанное время привязки (или точно соответствует конечному времени входных объектов), интервал временного шага начнется с этого времени, а агрегирование пойдет во времени назад (так, как это происходит с выравниванием по конечному времени). Если указанное базовое время будет находиться в середине временного экстента ваших данных, то интервал временного шаг создается по окончанию базового времени (так, как это происходит с выравниванием по конечному времени); дополнительные интервалы будут создаваться до и после базового времени, пока не будет охвачен весь временной экстент ваших данных.

String

Базовый временной шаг (необязательно)

Базовое время для временных шагов и временных интервалов для выравнивания. Этот параметр отображается только в том случае, если используется значение ReferenceTime параметра Выравнивание временного шага.

Date

Выходной слой

Выходной слой будет содержать следующее поле вместо исходных полей:

Имя поляОписаниеТип поля

value

Количество объектов в этом бине.

Float64

GiZScore

Z-оценка объектов в этом бине.

Float64

GiPValue

P-значение объектов в этом бине.

Float64

Gi_Bin

Уровень достоверности, используемый для определения статистически значимых горячих и холодных точек. Объекты со значением Gi_Bin +/-3 отражают статистическую значимость с уровнем достоверности 99 процентов; объекты со значением Gi_Bin +/-2 отражают уровень достоверности 95%; объекты со значением Gi_Bin +/-1 отражают уровень достоверности 90%; и кластеризация для объектов со значением Gi_Bin 0 не является статистически значимой.

Float64

Советы и ограничения

Входные данные должны включать точечный слой и должны быть агрегированы по ячейкам указанного размера до того, как приступить к анализу.