Суммировать атрибуты

Значок инструмента Доступен в аналитике больших данных.

Инструмент Суммировать атрибутыЗначок инструмента Суммировать атрибуты суммирует похожие значения полей, чтобы создать сводную таблицу. Итоговый слой отображает количество суммированных объектов, а также любую дополнительную статистику, которая была указана.

Схема рабочего процесса

Схема рабочего процесса инструмента Суммировать атрибуты

Пример

Торнадо и ураганы – это одни из самых разрушительных типов штормов в США. Вы хотите проанализировать материальный ущерб и финансовые потери от торнадо и ураганов, чтобы сравнить, насколько различается их воздействие. У вас есть доступ к данным торнадо и ураганов по США в виде отдельного набора данных, и вы хотите суммировать всю информацию, чтобы увидеть сводную информацию по значениям для всех ураганов и сводную информацию по значениям для всех торнадо. Вы можете суммировать данные, используя тип шторма, чтобы определить статистику для каждого типа шторма.

Примечания по использованию

  • Инструмент Суммировать атрибуты – это инструмент табличного анализа, не пространственного. Выходная таблица будет состоять из полей, содержащих результат статистической операции.
  • Используя параметр Поля, вы можете дополнительно указать одно или несколько полей, по которым будет выполняться суммирование, или суммировать все объекты. Когда вы суммируете по одному полю, статистика вычисляется для каждого уникального значения атрибута. Когда вы суммируете по нескольким полям, статистика будет вычисляться для каждой уникальной комбинации значений атрибутов.
  • Выходные данные этого инструмента всегда будут включать в себя количество объектов, которые были просуммированы.
  • Дополнительную статистику можно рассчитать с помощью параметра Поля суммирования. Доступные типы статистики зависят от типа поля, которое суммируется. Строковое атрибутивное поле может использовать типы статистики: любое, количество и количество уникальных значений. Числовое атрибутивное поле может использовать типы статистики: любое, количество, количество уникальных значений, сумма, сумма квадратов, минимальное, максимальное, диапазон, дисперсия и стандартное отклонение. Атрибутивное поле типа дата может использовать типы статистики: любой, количество, минимум, максимум и диапазон.

Как работает инструмент Суммировать атрибуты

Далее следует описание работы инструмента Суммировать атрибуты:

Уравнения

Дисперсия вычисляется по следующему уравнению:

Уравнение дисперсии
Переменные дисперсии

Стандартное отклонение вычисляется как квадратный корень из дисперсии.

Вычисления

Входные слои будут суммированы в группы по совпадающим значениям полей. Результаты будут получены в виде таблицы, поэтому их нельзя отобразить на карте.

В таблицах ниже показаны статистические расчеты слоя, который суммирован с использованием одинаковых значений полей. Поле VO2 использовалось для вычисления числовой статистики (Количество, Сума, Минимум, Максимум, Диапазон, Среднее, Стандартное отклонение и Дисперсия) для слоя. Поле Rating использовалось для вычисления текстовой статистики (Количество и Любые другие) для слоя.

Входной слой, подлежащий суммированию
Показан входной слой, подлежащий суммированию.

Таблица выше была суммирована с использованием поля Designation, а поле VO2 использовалось для вычисления числовой статистики (Количество, Сумма, Минимум, Максимум, Диапазон, Среднее, Стандартное отклонение и Дисперсия) для данного слоя. Поле Rating использовалось для вычисления текстовой статистики (Количество и Любые другие) для слоя. Результатом будет таблица с двумя объектами, отображающими конкретные значения Designation.

Входной слой, который был суммирован по полю Designation
Показан входной слой, суммированный по полю Designation.

В следующей таблице показано, как появляются первые несколько полей, когда слой суммируется по полям Designation и Age Group. Статистические данные вычисляются с использованием тех же методов, что и в предыдущем примере.

Входной слой, суммированный с использованием полей Designation и Age Group
Входной слой просуммирован по полям Designation и Age Group.

Количественная статистика (для строковых и числовых полей) подсчитывает количество ненулевых значений. Количество следующих значений равно 5: [0, 1, 10, 5, null, 6] = 5. Количество этого набора значений равно 3: [Primary, Primary, Secondary, null] = 3.

Параметры

ПараметрОбъяснениеТип данных

Входной слой

Точечные объекты, для которых будет рассчитываться плотность.

Объекты

Поля (дополнительно)

Одно или более полей, которые используются для суммирования аналогичных объектов. К примеру, если вы выберете отдельное поле PropertyType со значениями commercial и residential, то будут просуммированы все поля residential с вычислением суммарной статистики и все поля commercial.

Если выбрано несколько полей, то каждая уникальная комбинация значений будет просуммирована вместе для вычисления суммарной статистики. Например, рассмотрим первое поле PropertyType со значениями commercial и residential, а второе поле Occupied со значениями Yes или No. Возможны четыре комбинации, которые можно суммировать для вычисления суммарной статистики.

String

Поле суммирования (дополнительно)

Статистика, которая будет рассчитываться для указанных полей. Доступны различные типы статистики в зависимости от того, является ли указываемое поле строковым, числовым или полем типа дата.

Доступны следующие типы статистики:

  • Любой – это пример строки из текстового поля.
  • Количество – вычисляет количество ненулевых значений. Может использоваться с числовыми или текстовыми полями. Количество [null, 0, 2] – это 2.
  • Количество (отличающихся) – вычисляет количество уникальных ненулевых значений. Может использоваться с числовыми или текстовыми полями. Результатом подсчета количества уникальных значений для ряда [null, 4, 3, 4] будет 2.
  • Сумма – сумма числовых значений в поле. Сумма для ряда [null, null, 3] равна 3.
  • Сумма квадратов – сумма квадратов отклонений каждого наблюдения от среднего значения для всех наблюдений. Сумма квадратов для ряда [null, 2.2, 3.1, 4.7] равна 3.206.
  • Мин – минимальное значение числового поля. Минимальное значение [0, 2, null] равно 0.
  • Макс – максимальное значение числового поля. Максимальное значение [0, 2, null] равно 2.
  • Среднее – среднее арифметическое числовых значений. Среднее для ряда [0, 2, null] равно 1.
  • Диапазон – диапазон числового поля. Вычисляется вычитанием минимального значения из максимального. Диапазон [0, null, 1] равен 1. Диапазон [null, 4] равен 0.
  • Дисперсия – дисперсия по числовому полю в треке. Дисперсия ряда [1] равна null. Дисперсия [null, 1,1,1] равна 1.
  • Среднеквадратическое отклонение – Среднеквадратическое отклонение числового поля. Среднеквадратическое отклонение [1] равно null. Среднеквадратическое отклонение [null, 1,1,1] равно 1.

String

Выходной слой

Выходной слой будет представлять собой таблицу, содержащую поля, указанные в параметре Поля, атрибут COUNT с количеством объектов, суммированных в этой строке, и любые суммированные атрибуты, указанные в параметре Поля суммирования.

Советы и ограничения

  • Входные данные могут быть табличным слоем или слоем с геометрией (точки, линии или площади).
  • Вы можете использовать этот инструмент с пространственными данными, однако результат будет табличным. Затем вы можете присоединить результаты к пространственным данным, используя инструмент Присоединить объекты.