Агрегировать точки

Значок инструмента Доступен в аналитике больших данных.

Инструмент Агрегировать точки Инструмент Агрегировать точки может собирать и суммировать точечные объекты в пределах площадных объектов. Границы полигональных объектов используются для выбора точек, которые попали в каждый из полигонов, и вычисления по ним дальнейшей статистики. Итоговый слой содержит количество точек в пределах каждого полигона, а также итоговые вычисления.

Схема рабочего процесса

Схема работы инструмента Агрегировать точки

Пример

Торнадо – это разрушительный тип штормов, которые возникают в США. Вам нужно узнать, каковы могут быть последствия торнадо, включая человеческие жертвы, число пострадавших, повреждения имущества и финансовые потери в каждом штате и каждом округе. У вас есть доступ к данным о прохождении торнадо, но нужен наиболее удобный способ визуализации данных в определенных областях. Можно агрегировать данные торнадо по границам штатов и округов и нормализовать их по населению, чтобы понять, какие территории больше всего пострадают от торнадо.

Примечания по использованию

При работе с инструментом Агрегировать точки следует учитывать следующее:

  • Выходной слой всегда является полигональным. Возвращаются только полигональные бины или объекты, в которых встречаются точки.
  • Можно предоставить полигональный слой для использования в анализе или создать бины определенного размера и формы (шестиугольник или квадрат), в пределах которых будет происходить агрегирование точек. Размер бина определяет величину бинов. Если агрегация выполняется по шестиугольникам, то размер равен высоте каждого шестиугольника, а ширина получившегося шестиугольника в два раза больше высоты, деленной на квадратный корень из 3. Если агрегирование выполняется в квадраты, размером бина будет высота квадрата, которая равна ширине.

    Агрегировать точки высота шестиугольника бина

  • Если для входного слоя активировано время, можно применить пошаговый временной анализ к вашим данным.
  • В самом простом варианте при агрегации подсчитывается количество точек в каждой области. Данные статистики (Количество, Сумма, Минимум, Максимум, Диапазон, Среднее значение, Среднеквадратическое отклонение и Дисперсия) также могут вычисляться для числовых полей, а данные статистики (Количество, Любое) могут вычисляться для текстовых полей. Для каждой области статистика вычисляется отдельно.
    • Когда к полю применяется Количество, в нем отображается число не пустых (nonnull) значений, имеющихся в данном поле.
    • Когда к текстовому полю применяется Любое, в нем отображается единственная строка, присутствующая в данном поле.
  • Инструмент Агрегировать точки позволяет при необходимости выполнять анализ с использованием временных шагов. Каждый временной шаг анализируется независимо от объектов вне этого шага. Чтобы использовать временной шаг, входные данные должны содержать информацию о времени и представлять момент времени. Когда применяются временные шаги, выходными объектами выступают интервалы времени, представленные полями StartTime и EndTime.
  • Если вы указываете временной шаг, повтор временного шага или базовое время, но время не включено для ваших данных, инструмент возвращает ошибку.
  • Для параметра Базовый временной шаг может быть указано значение даты и времени или только значение даты; только значение времени не может быть указано.

Параметры

Ниже приведены параметры инструмента Агрегировать точки:

ПараметрОписаниеТип данных

Входной слой

Точечные объекты, которые агрегируются в Бины или Полигоны.

Объекты

Тип бина

Форма бина, используемого для создания регулярной сетки бинов. Варианты: Квадрат или Шестиугольник.

Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не отображается или не является обязательным.

Строка

Размер бина

Интервал расстояния, определяющий размер бинов, в границах которых объединяются входные точки. Для квадратных бинов, размер соответствует высоте квадрата. Используется по умолчанию. Для шестиугольных бинов размер бина соответствует высоте шестиугольника между двумя параллельными сторонами.

Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не отображается или не является обязательным.

Строка

Интервал (дополнительно)

Значение длительности временного шага. Опция доступна, только если для входных точек включено время, и точечные события соответствуют элементам времени.

Временные шаги могут применяться, только если во входных данных используется время.

Подробнее о работе пошагового временного анализа

Строка

Повторение (дополнительно)

Значение, задающее частоту интервалов временного шага. Опция доступна, только если для входных точек включено время, и точечные события соответствуют элементам времени.

Строка

Привязка (дополнительно) (дополнительно)

Дата, задающая базовое время, по которому выравниваются временные шаги. По умолчанию 1 января 1970 г., 12:00. Эта опция доступна только в том случае, если для входных точек включено время и они представляют собой момент времени.

Int64

Поля суммирования

Статистика, вычисляемая по указанным полям. Доступны различные типы статистики в зависимости от того, является ли указываемое поле строковым, числовым или полем типа дата.

  • Любой – это пример строки из текстового поля.
  • Количество – вычисляет количество ненулевых значений. Может использоваться с числовыми или текстовыми полями. Количество [null, 0, 2] – это 2.
  • Количество (отличающихся) – вычисляет количество уникальных ненулевых значений. Может использоваться с числовыми или текстовыми полями. Результатом подсчета количества уникальных значений для ряда [null, 4, 3, 4] будет 2.
  • Сумма – сумма числовых значений в поле. Сумма для ряда [null, null, 3] равна 3.
  • Сумма квадратов – Сумма, по всем наблюдениям, квадратов разностей каждого наблюдения от общего среднего значения. Сумма квадратов для ряда [null, 2.2, 3.1, 4.7] равна 3.206.
  • Мин – минимальное значение числового поля. Минимальное значение [0, 2, null] равно 0.
  • Макс – максимальное значение числового поля. Максимальное значение [0, 2, null] равно 2.
  • Среднее – среднее арифметическое числовых значений. Среднее для ряда [0, 2, null] равно 1.
  • Диапазон – диапазон числового поля. Вычисляется вычитанием минимального значения из максимального. Диапазон [0, null, 1] равен 1. Диапазон [null, 4] равен 0.
  • Дисперсия – дисперсия по числовому полю в треке. Дисперсия ряда [1] равна null. Дисперсия [null, 1,1,1] равна 1.
  • Среднеквадратическое отклонение – Среднеквадратическое отклонение числового поля. Среднеквадратическое отклонение [1] равно null. Среднеквадратическое отклонение [null, 1,1,1] равно 1.

Строка

Выходной слой

Выходной слой содержит все исходные поля из объектов области, а также поле COUNT . Если вы решите настроить поля суммирования, то эти поля также будут рассчитываться для выходного слоя.

Имя поляОписаниеТип поля

COUNT

Количество точечных объектов из входного слоя, которые были объединены в этот полигональный объект.

Float64

Советы и ограничения

Инструмент Агрегировать точки не позволяет выполнять агрегацию линий в пределах полигонов.