Доступен в аналитике больших данных.
Инструмент Найти горячие точки идентифицирует любые статистически значимые горячие точки и холодные точки в пространственной структуре ваших данных с использованием статистики Getis-Ord Gi*.
Схема рабочего процесса
Примеры
- Полицейское управление проводит анализ, чтобы определить, имеется ли связь между насильственными преступлениями и уровнем безработицы. В учебных заведениях в районах с высоким уровнем насильственных преступлений и высокой безработицей будет применена программа обеспечения занятости в летние каникулы. Инструмент Найти горячие точки может быть использован для определения районов со статистически значимыми горячими точками по уровням преступности и безработицы.
- Сотрудник службы охраны окружающей среды изучает заболевания деревьев, чтобы определить области, где требуется обработка, и более подробно рассмотреть области, где имеется устойчивость. Инструмент Найти горячие точки может быть использован для поиска кластеров заболеваний (горячие точки) и здоровых кластеров (холодные точки).
Примечания по использованию
- Входные объекты должны быть точками. Точки анализируются путём агрегирования пространственных объектов в пределах квадратной сетки (бинов).
- В выходном слое появятся дополнительные поля, содержащие такую информацию, как статистическая значимость каждого объекта, p-значение и z-оценка.
- В рамках анализа происходит агрегирование входных точек в бины заданного размера. Затем они анализируются с целью определения горячих точек. Бины агрегированных значений должны содержать разнообразие значений (число точек в каждом бине должно широко варьироваться).
- Z-оценки и p-значения являются показателями статистической значимости, которые измеряют, насколько наблюдаемая пространственная кластеризация является чем-то большим, чем случайное распределение тех же значений. Вы сможете определить, можно или нет отклонить нулевую гипотезу с использованием агрегированных бинов. Поля p-значений и z-оценки не отражают коррекцию FDR (False Discovery Rate).
- Высокая z-оценка и низкое р-значение для объекта свидетельствует о большой плотности инцидентов. Низкая отрицательная z-оценка и низкое р-значение для объекта свидетельствуют об отсутствии (незначительном присутствии) точек инцидентов. Чем выше (или ниже) z-оценка, чем сильнее интенсивность кластеризации. Z-оценка, стремящаяся к нулю, указывает на отсутствие очевидного объединения в кластеры.
- z-оценка основана на вычислении гипотезы нулевой рандомизации. Дополнительные сведения о z-оценке см. в разделе Что такое z-оценка? Что такое p-значение?.
- Инструмент Найти горячие точки позволяет выполнять анализ, используя временные шаги. Каждый временной шаг анализируется независимо от объектов вне этого шага. Чтобы использовать временной шаг, входные данные должны содержать информацию о времени и представлять момент времени. Когда применяются временные шаги, выходными объектами выступают интервалы времени, представленные полями StartTime и EndTime.
- Для параметра Базовый временной шаг может быть указано значение даты и времени или только значение даты; только значение времени не может быть указано.
Параметры
Параметр | Описание | Тип данных |
---|---|---|
Входной слой | Точечные объекты, для которых будут вычислены горячие точки. | Объекты |
Тип бина | Геометрия бина, которая будет использоваться для создания регулярных бинов. Значение по умолчанию – Квадратный. | String |
Размер бина | Интервал расстояния, определяющий размер бинов, в которых будут анализироваться входные точки. | String |
Размер соседства (необязательно) | Пространственный экстент области анализа соседей. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальную кластеризацию. | String |
Интервал временного шага (необязательно) | Интервал временного шага. Этот параметр используется только в том случае, если схема входных точек содержит поле, помеченное как Start Time. | String |
Выравнивание временного шага (необязательно) | Определяет, как будут выравниваться временные шаги. Этот параметр доступен только в том случае, если входные точки включены по времени и представляют собой момент времени.
| String |
Базовый временной шаг (необязательно) | Базовое время для временных шагов и временных интервалов для выравнивания. Этот параметр отображается только в том случае, если используется значение ReferenceTime параметра Выравнивание временного шага. | Date |
Выходной слой
Выходной слой будет содержать следующее поле вместо исходных полей:
Имя поля | Описание | Тип поля |
---|---|---|
value | Количество объектов в этом бине. | Float64 |
GiZScore | Z-оценка объектов в этом бине. | Float64 |
GiPValue | P-значение объектов в этом бине. | Float64 |
Gi_Bin | Уровень достоверности, используемый для определения статистически значимых горячих и холодных точек. Объекты со значением Gi_Bin +/-3 отражают статистическую значимость с уровнем достоверности 99 процентов; объекты со значением Gi_Bin +/-2 отражают уровень достоверности 95%; объекты со значением Gi_Bin +/-1 отражают уровень достоверности 90%; и кластеризация для объектов со значением Gi_Bin 0 не является статистически значимой. | Float64 |
Советы и ограничения
Входные данные должны включать точечный слой и должны быть агрегированы по ячейкам указанного размера до того, как приступить к анализу.