Агрегировать точки

Значок инструмента Доступен в аналитике больших данных.

Инструмент Агрегировать точки Инструмент Агрегировать точки может собирать и суммировать точечные объекты в пределах площадных объектов. Границы полигональных объектов используются для выбора точек, которые попали в каждый из полигонов, и вычисления по ним дальнейшей статистики. Итоговый слой содержит количество точек в пределах каждого полигона, а также итоговые вычисления.

Схема рабочего процесса

Схема работы инструмента Агрегировать точки

Пример

Торнадо – это разрушительный тип штормов, которые возникают в США. Вам нужно узнать, каковы могут быть последствия торнадо, включая человеческие жертвы, число пострадавших, повреждения имущества и финансовые потери в каждом штате и каждом округе. У вас есть доступ к данным о прохождении торнадо, но нужен наиболее удобный способ визуализации данных в определенных областях. Можно агрегировать данные торнадо по границам штатов и округов и нормализовать их по населению, чтобы понять, какие территории больше всего пострадают от торнадо.

Примечания по использованию

  • Выходной слой всегда является полигональным. Возвращаются только полигональные бины или объекты, в которых встречаются точки.
  • Можно предоставить полигональный слой для использования в анализе или создать бины определенного размера и формы (шестиугольник или квадрат), в пределах которых будет происходить агрегирование точек. Размер бина определяет величину бинов. Если агрегация выполняется по гексагональной сетке, размером является высота каждого шестиугольника, а ширина полученного шестиугольника будет равна 2 высотам, деленным на квадратный корень из 3. Если агрегирование выполняется в квадраты, размером бина будет высота квадрата, которая равна ширине.

    Агрегировать точки высота шестиугольника бина

  • Если для входного слоя активировано время, вы можете применить пошаговый временной анализ к вашим данным. Дополнительные сведения см. в разделе Как работает пошаговый временной анализ.
  • В самом простом варианте при агрегации будет подсчитано количество точек в каждой области. Данные статистики (количество, минимум, максимум, диапазон, среднее, стандартное отклонение и дисперсия) могут также вычисляться для числовых полей, а данные статистики (количество, любые другие) могут вычисляться для текстовых полей. Для каждой области статистика будет вычислена отдельно.
    • Когда к полю применяется количество, в нем отображается число ненулевых значений, имеющихся в данном поле.
    • Когда к текстовому полю применяется любые, в нем отображается единственная строка, присутствующая в данном поле.
  • Агрегировать точки позволяет выполнять анализ, используя временные шаги. Каждый временной шаг анализируется независимо от объектов вне этого шага. Чтобы использовать временной шаг, входные данные должны содержать информацию о времени и представлять момент времени. Когда применяются временные шаги, выходными объектами выступают интервалы времени, представленные полями StartTime и EndTime.
  • Если вы указываете временной шаг, повтор временного шага или базовое время, но время не включено для ваших данных, инструмент возвращает ошибку.
  • Для параметра Базовый временной шаг может быть указано значение даты и времени или только значение даты; только значение времени не может быть указано.

Параметры

ПараметрОписаниеТип данных

Входной слой

Точечные объекты, которые будут агрегированы в Бины или Полигоны.

Объекты

Тип бина

Геометрия бина, которая будет использоваться для создания регулярных бинов. Варианты: Квадрат или Шестиугольник.

Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не будет отображаться или не будет обязательным.

String

Размер бина

Интервал расстояния, определяющий размер бинов, в границах которых будут объединены входные точки. Для квадратных бинов, размер соответствует высоте квадрата. Используется по умолчанию. Для шестиугольных бинов размер бина соответствует высоте шестиугольника между двумя параллельными сторонами.

Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не будет отображаться или не будет обязательным.

String

Интервал (дополнительно)

Значение длительности временного шага. Опция доступна, только если для входных точек включено время, и точечные события соответствуют элементам времени.

Временные шаги могут применяться, только если во входных данных используется время. Дополнительные сведения см. в разделе Как работает пошаговый временной анализ.

String

Повторение (дополнительно)

Значение, задающее частоту интервалов временного шага. Опция доступна, только если для входных точек включено время, и точечные события соответствуют элементам времени.

String

Привязка (дополнительно)

Дата, задающая базовое время, по которому выравниваются временные шаги. По умолчанию 1 января 1970 г., 12:00. Эта опция доступна только в том случае, если для входных точек включено время и они представляют собой момент времени.

Int64

Поля суммирования

Статистика, которая будет рассчитываться для указанных полей. Доступны различные типы статистики в зависимости от того, является ли указываемое поле строковым, числовым или полем типа дата.

  • Любой – это пример строки из текстового поля.
  • Количество – вычисляет количество ненулевых значений. Может использоваться с числовыми или текстовыми полями. Количество [null, 0, 2] – это 2.
  • Количество (отличающихся) – вычисляет количество уникальных ненулевых значений. Может использоваться с числовыми или текстовыми полями. Результатом подсчета количества уникальных значений для ряда [null, 4, 3, 4] будет 2.
  • Сумма – сумма числовых значений в поле. Сумма для ряда [null, null, 3] равна 3.
  • Сумма квадратов – Сумма, по всем наблюдениям, квадратов разностей каждого наблюдения от общего среднего значения. Сумма квадратов для ряда [null, 2.2, 3.1, 4.7] равна 3.206.
  • Мин – минимальное значение числового поля. Минимальное значение [0, 2, null] равно 0.
  • Макс – максимальное значение числового поля. Максимальное значение [0, 2, null] равно 2.
  • Среднее – среднее арифметическое числовых значений. Среднее для ряда [0, 2, null] равно 1.
  • Диапазон – диапазон числового поля. Вычисляется вычитанием минимального значения из максимального. Диапазон [0, null, 1] равен 1. Диапазон [null, 4] равен 0.
  • Дисперсия – дисперсия по числовому полю в треке. Дисперсия ряда [1] равна null. Дисперсия [null, 1,1,1] равна 1.
  • Среднеквадратическое отклонение – Среднеквадратическое отклонение числового поля. Среднеквадратическое отклонение [1] равно null. Среднеквадратическое отклонение [null, 1,1,1] равно 1.

String

Выходной слой

Выходной слой будет содержать все исходные поля из объектов области, а также поле COUNT. Если вы решите настроить поля суммирования, то эти поля также будут рассчитываться для выходного слоя.

Имя поляОписаниеТип поля

COUNT

Количество точечных объектов из входного слоя, которые были объединены в этот полигональный объект.

Float64

Советы и ограничения

Инструмент Агрегировать точки не позволяет выполнять агрегацию линий в пределах полигонов.