Агрегировать точки

Значок инструмента Доступен в аналитике больших данных.

Инструмент Агрегировать точки собирает и суммирует точечные объекты в пределах площадных объектов. Границы полигональных объектов используются для выбора точек, которые попали в каждый из полигонов; далее они используются для вычисления статистики. Итоговый слой содержит количество точек в пределах каждого полигона, а также итоговые вычисления.

Схема рабочего процесса

Точки, агрегированные в группы в пределах площадных объектов

Пример

Ниже приводится пример случая использования инструмента:

Торнадо – это разрушительный тип штормов, которые возникают в США. Вам нужно узнать, каковы могут быть последствия торнадо, включая человеческие жертвы, число пострадавших, повреждения имущества и финансовые потери в каждом штате и каждом округе. У вас есть доступ к данным о прохождении торнадо, но нужен наиболее удобный способ визуализации данных в определенных областях. Можно агрегировать данные торнадо по границам штатов и округов и нормализовать их по населению, чтобы понять, какие территории больше всего пострадают от торнадо.

Примечания по использованию

При работе с инструментом следует учитывать следующее:

  • Выходной слой всегда является полигональным. Возвращаются только полигональные бины или объекты, в которых встречаются точки.
  • Для анализа можно предоставить как полигональный слой, так и создать бины определённого размера и формы (шестиугольник или квадрат), в пределах которых будет происходить агрегирование точечных объектов. Размер бина определяет величину бинов. Если агрегация выполняется по шестиугольникам, то размер равен высоте каждого шестиугольника, а ширина получившегося шестиугольника в два раза больше высоты, деленной на квадратный корень из 3. Если агрегирование выполняется в квадраты, размером бина будет высота квадрата, которая равна ширине.

    Расчеты Агрегировать точки высота бина для шестиугольных и квадратных бинов

  • Если в целевых данных включено время, можно применять временные шаги в анализе.
  • В самом простом варианте при агрегировании подсчитывается число точек в каждой области. Данные статистики - включая Количество, Сумма, Минимум, Максимум, Диапазон, Среднее значение и Среднеквадратическое отклонение - могут вычисляться для числовых полей, а данные статистики, такие как Количество и Любое, могут вычисляться для текстовых полей. Для каждой области статистика вычисляется отдельно.

    Ниже перечислены примеры возвращаемых значений:

    • Когда к полю применяется Количество, в нем отображается число не пустых (nonnull) значений, имеющихся в данном поле.
    • Когда к текстовому полю применяется Любое, в нем отображается единственная строка, присутствующая в данном поле.
  • Инструмент Агрегировать точки позволяет выполнять анализ с использованием временных шагов. Каждый временной шаг анализируется независимо от объектов вне этого шага. Для использования временных шагов целевые данные должны содержать информацию о времени и представлять момент времени. Когда используются временные шаги, выходными объектами выступают интервалы времени, представленные полями StartTime и EndTime.
  • Если указать параметр временного шага Интервал, Повтор или Выравнивание, а время в данных не включено, при запуске инструмента возникнет ошибка.
  • Параметры временного шага могут быть представлены значением даты и времени или только значением даты; они не могут быть представлены только значением времени.
  • Для инструмента Агрегировать точки требуется, чтобы целевые данные были спроецированы или чтобы целевые данные были заданы в спроецированной системе координат. Если целевые данные не находятся в системе координат проекции и вы ее не задали, инструмент автоматически применяет к анализируемым данным систему координат Мировой цилиндрической равновеликой проекции.

Параметры

Ниже приведены параметры этого инструмента:

ПараметрОписаниеТип данных

Целевые данные

Точечные объекты, которые агрегируются в Бины или Полигоны.

Возможности

Данные соединения

(дополнительно)

Полигональные объекты, с которыми агрегируются целевые данные. Для агрегирования данных в полигоны необходим источник данных объединения.

Возможности

Агрегирование точек в

Задает, как будут агрегироваться целевые данные. Возможны следующие опции:

  • Бины — целевые данные будут агрегированы в квадратные или шестиугольные бины. Для этой опции необходим параметр Целевые данные.
  • Полигоны — целевые данные будут агрегированы в полигоны из данных соединения. Для этой опции необходим параметр Данные соединения.

Строка

Тип бина

(дополнительно)

Форма бина, которая будет использоваться для создания бинов. Варианты - Квадрат (по умолчанию) и Шестиугольник.

Если источник подключен к порту соединения, этот параметр недоступен.

Примечание:

Этот параметр доступен только в том случае, если для параметра Агрегировать точки в (Полигон или Бин) задано значение Бины.

Строка

Размер бина

(дополнительно)

Интервал расстояния, определяющий размер бинов, в границах которых будут объединены целевые данные Для квадратных бинов, размер соответствует высоте квадрата. Для шестиугольных бинов размер бина соответствует высоте шестиугольника между двумя параллельными сторонами.

Если источник подключен к порту соединения, этот параметр недоступен.

Примечание:

Этот параметр доступен только в том случае, если для параметра Агрегировать точки в (Полигон или Бин) задано значение Бины.

Строка

Интервал (дополнительно)

Продолжительность временного шага.

Используйте эту опцию, только если целевые данные содержат информацию о времени и представляют момент времени.

Подробнее о том как работает временной шаг

Строка

Повторение (дополнительно)

Определяет, как часто возникает интервал временного шага.

Используйте эту опцию, только если целевые данные содержат информацию о времени и представляют момент времени.

Строка

Alignment

(дополнительно)

Базовое время, с которым необходимо выровнять временные шаги. По умолчанию это 1 января 1970, 00:00 часов. Отметьте этот параметр, чтобы выбрать диапазон даты и времени.

Используйте эту опцию, только если целевые данные содержат информацию о времени и представляют момент времени.

Int64

Поле суммирования (дополнительно)

Статистика, которая будет рассчитываться для указанных полей. Доступны различные типы статистики в зависимости от того, является ли указываемое поле строковым, числовым или полем типа дата.

  • Любой - вычисляет пример строки из текстового поля.
  • Количество – вычисляет количество ненулевых значений. Может использоваться с числовыми или текстовыми полями. Количество [null, 0, 2] – это 2.
  • Количество (отличающихся) – вычисляет количество ненулевых значений. Может использоваться с числовыми или текстовыми полями. Результатом подсчета количества уникальных значений для ряда [null, 4, 3, 4] будет 2.
  • Сумма – вычисляет сумму числовых значений в поле. Сумма для ряда [null, null, 3] равна 3.
  • Сумма квадрата – вычисляет сумму квадратов разностей между каждым наблюдением и общим средним значением. Сумма квадратов для ряда [null, 2.2, 3.1, 4.7] равна 3.206.
  • Минимальное – вычисляет минимальное значение числового поля. Минимальное значение [0, 2, null] равно 0.
  • Максимальное – вычисляет максимальное значение числового поля. Максимальное значение [0, 2, null] равно 2.
  • Среднее – вычисляет среднее арифметическое числовых значений. Среднее для ряда [0, 2, null] равно 1.
  • Диапазон — вычисляет диапазон числового поля путем вычитания минимального значения из максимального значения. Диапазон [0, null, 1] равен 1. Диапазон [null, 4] равен 0.
  • Дисперсия — вычисляет дисперсию числового поля в треке. Дисперсия ряда [1] равна null. Дисперсия [null, 1,1,1] равна 1.
  • Среднеквадратичное отклонение — вычисляет среднеквадратичное отклонение числового поля. Среднеквадратическое отклонение [1] равно null. Среднеквадратическое отклонение [null, 1,1,1] равно 1.

Строка

Выходной слой

Выходной слой содержит все исходные поля из объектов области и поле COUNT. Поле COUNT представляет собой количество точечных объектов из целевых данных, агрегированных в этот полигональный объект. Тип данный поля COUNT Float64. Если вы настроите поля суммирования, то эти поля также вычислены для данного выходного слоя.

Рекомендации и ограничение

Инструмент Агрегировать точки не позволяет выполнять агрегацию линий и полигонов в пределах границ областей.