Доступен в аналитике больших данных.
Инструмент Агрегировать точки может собирать и суммировать точечные объекты в пределах площадных объектов. Границы полигональных объектов используются для выбора точек, которые попали в каждый из полигонов, и вычисления по ним дальнейшей статистики. Итоговый слой содержит количество точек в пределах каждого полигона, а также итоговые вычисления.
Схема рабочего процесса
Пример
Торнадо – это разрушительный тип штормов, которые возникают в США. Вам нужно узнать, каковы могут быть последствия торнадо, включая человеческие жертвы, число пострадавших, повреждения имущества и финансовые потери в каждом штате и каждом округе. У вас есть доступ к данным о прохождении торнадо, но нужен наиболее удобный способ визуализации данных в определенных областях. Можно агрегировать данные торнадо по границам штатов и округов и нормализовать их по населению, чтобы понять, какие территории больше всего пострадают от торнадо.
Примечания по использованию
При работе с инструментом Агрегировать точки следует учитывать следующее:
- Выходной слой всегда является полигональным. Возвращаются только полигональные бины или объекты, в которых встречаются точки.
- Можно предоставить полигональный слой для использования в анализе или создать бины определенного размера и формы (шестиугольник или квадрат), в пределах которых будет происходить агрегирование точек. Размер бина определяет величину бинов. Если агрегация выполняется по шестиугольникам, то размер равен высоте каждого шестиугольника, а ширина получившегося шестиугольника в два раза больше высоты, деленной на квадратный корень из 3. Если агрегирование выполняется в квадраты, размером бина будет высота квадрата, которая равна ширине.
- Если для входного слоя активировано время, можно применить пошаговый временной анализ к вашим данным.
- В самом простом варианте при агрегации подсчитывается количество точек в каждой области. Данные статистики (Количество, Сумма, Минимум, Максимум, Диапазон, Среднее значение, Среднеквадратическое отклонение и Дисперсия) также могут вычисляться для числовых полей, а данные статистики (Количество, Любое) могут вычисляться для текстовых полей. Для каждой области статистика вычисляется отдельно.
- Когда к полю применяется Количество, в нем отображается число не пустых (nonnull) значений, имеющихся в данном поле.
- Когда к текстовому полю применяется Любое, в нем отображается единственная строка, присутствующая в данном поле.
- Инструмент Агрегировать точки позволяет при необходимости выполнять анализ с использованием временных шагов. Каждый временной шаг анализируется независимо от объектов вне этого шага. Чтобы использовать временной шаг, входные данные должны содержать информацию о времени и представлять момент времени. Когда применяются временные шаги, выходными объектами выступают интервалы времени, представленные полями StartTime и EndTime.
- Если вы указываете временной шаг, повтор временного шага или базовое время, но время не включено для ваших данных, инструмент возвращает ошибку.
- Для параметра Базовый временной шаг может быть указано значение даты и времени или только значение даты; только значение времени не может быть указано.
Параметры
Ниже приведены параметры инструмента Агрегировать точки:
Параметр | Описание | Тип данных |
---|---|---|
Входной слой | Точечные объекты, которые агрегируются в Бины или Полигоны. | Объекты |
Тип бина | Форма бина, используемого для создания регулярной сетки бинов. Варианты: Квадрат или Шестиугольник. Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не отображается или не является обязательным. | Строка |
Размер бина | Интервал расстояния, определяющий размер бинов, в границах которых объединяются входные точки. Для квадратных бинов, размер соответствует высоте квадрата. Используется по умолчанию. Для шестиугольных бинов размер бина соответствует высоте шестиугольника между двумя параллельными сторонами. Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не отображается или не является обязательным. | Строка |
Интервал (дополнительно) | Значение длительности временного шага. Опция доступна, только если для входных точек включено время, и точечные события соответствуют элементам времени. Временные шаги могут применяться, только если во входных данных используется время. | Строка |
Повторение (дополнительно) | Значение, задающее частоту интервалов временного шага. Опция доступна, только если для входных точек включено время, и точечные события соответствуют элементам времени. | Строка |
Привязка (дополнительно) (дополнительно) | Дата, задающая базовое время, по которому выравниваются временные шаги. По умолчанию 1 января 1970 г., 12:00. Эта опция доступна только в том случае, если для входных точек включено время и они представляют собой момент времени. | Int64 |
Поля суммирования | Статистика, вычисляемая по указанным полям. Доступны различные типы статистики в зависимости от того, является ли указываемое поле строковым, числовым или полем типа дата.
| Строка |
Выходной слой
Выходной слой содержит все исходные поля из объектов области, а также поле COUNT . Если вы решите настроить поля суммирования, то эти поля также будут рассчитываться для выходного слоя.
Имя поля | Описание | Тип поля |
---|---|---|
COUNT | Количество точечных объектов из входного слоя, которые были объединены в этот полигональный объект. | Float64 |
Советы и ограничения
Инструмент Агрегировать точки не позволяет выполнять агрегацию линий в пределах полигонов.