Доступен в аналитике больших данных.
Инструмент Найти горячие точки идентифицирует любые статистически значимые горячие точки и холодные точки в пространственной структуре ваших данных с использованием статистики Getis-Ord Gi*.
Схема рабочего процесса
Примеры
Ниже приведены примеры использования инструмента Найти горячие точки:
- Полицейское управление проводит анализ, чтобы определить, имеется ли связь между насильственными преступлениями и уровнем безработицы. В учебных заведениях в районах с высоким уровнем насильственных преступлений и высокой безработицей будет применена программа обеспечения занятости в летние каникулы. Инструмент Найти горячие точки может быть использован для определения районов со статистически значимыми горячими точками по уровням преступности и безработицы.
- Сотрудник службы охраны окружающей среды изучает заболевания деревьев, чтобы определить области, где требуется обработка, и более подробно рассмотреть области, где имеется устойчивость. Инструмент Найти горячие точки может быть использован для поиска кластеров заболеваний (горячие точки) и здоровых кластеров (холодные точки).
Примечания по использованию
При работе с инструментом Найти горячие точки помните следующее:
- Входные объекты должны быть точечным слоем. Перед выполнением анализа точки будут объединены в квадратную сетку (бины) указанного размера
- В выходном слое появятся дополнительные поля, содержащие такую информацию, как статистическая значимость каждого объекта, p-значение и z-оценка.
- В рамках анализа происходит агрегирование входных точек в бины заданного размера. Затем они анализируются с целью определения горячих точек. Бины агрегированных значений должны содержать разнообразие значений (число точек в каждом бине должно широко варьироваться).
- Z-оценки и p-значения являются показателями статистической значимости, которые измеряют, насколько наблюдаемая пространственная кластеризация является чем-то большим, чем случайное распределение тех же значений. Вы сможете определить, можно или нет отклонить нулевую гипотезу с использованием агрегированных бинов. Поля p-значений и z-оценки не отражают коррекцию FDR (False Discovery Rate).
- Высокая z-оценка и низкое р-значение для объекта свидетельствует о большой плотности инцидентов. Низкая отрицательная z-оценка и низкое р-значение для объекта свидетельствуют об отсутствии (незначительном присутствии) точек инцидентов. Чем выше (или ниже) z-оценка, чем сильнее интенсивность кластеризации. Z-оценка, стремящаяся к нулю, указывает на отсутствие очевидного объединения в кластеры.
- z-оценка основана на вычислении гипотезы нулевой рандомизации. Дополнительные сведения о z-оценке см. в разделе Что такое z-оценка? Что такое p-значение?.
- Инструмент Найти горячие точки позволяет выполнять анализ, используя временные шаги. Каждый временной шаг анализируется независимо от объектов вне этого шага. Чтобы использовать временной шаг, входные данные должны содержать информацию о времени и представлять момент времени. Когда применяются временные шаги, выходными объектами выступают интервалы времени, представленные полями StartTime и EndTime.
- Для параметра Базовый временной шаг может быть указано значение даты и времени или только значение даты; только значение времени не может быть указано.
Параметры
Ниже приводятся параметры инструмента Найти горячие точки:
Параметр | Описание | Тип данных |
---|---|---|
Входной слой | Точечные объекты, для которых будут вычислены горячие точки. | Возможности |
Тип бина | Геометрия бина, которая будет использоваться для создания регулярных бинов. Значение по умолчанию – Квадратный. | Строка |
Размер бина | Интервал расстояния, определяющий размер бинов, в которых будут анализироваться входные точки. | Строка |
Размер соседства (необязательно) | Пространственный экстент области анализа соседей. Это значение определяет, какие объекты будут проанализированы вместе, чтобы оценить локальную кластеризацию. | Строка |
Интервал временного шага (необязательно) | Интервал временного шага. Этот параметр используется только в том случае, если схема входных точек содержит поле, помеченное как Start Time. | Строка |
Выравнивание временного шага (необязательно) | Определяет, как будут выравниваться временные шаги. Этот параметр доступен только в том случае, если входные точки включены по времени и представляют собой момент времени.
| Строка |
Базовый временной шаг (необязательно) | Базовое время для временных шагов и временных интервалов для выравнивания. Этот параметр отображается только в том случае, если используется значение ReferenceTime параметра Выравнивание временного шага. | Дата |
Выходной слой
Выходной слой будет содержать следующее поле вместо исходных полей:
Имя поля | Описание | Тип поля |
---|---|---|
value | Количество объектов в этом бине. | Float64 |
GiZScore | Z-оценка объектов в этом бине. | Float64 |
GiPValue | P-значение объектов в этом бине. | Float64 |
Gi_Bin | Уровень достоверности, используемый для определения статистически значимых горячих и холодных точек. Объекты со значением Gi_Bin +/-3 отражают статистическую значимость с уровнем достоверности 99 процентов; объекты со значением Gi_Bin +/-2 отражают уровень достоверности 95%; объекты со значением Gi_Bin +/-1 отражают уровень достоверности 90%; и кластеризация для объектов со значением Gi_Bin 0 не является статистически значимой. | Float64 |