Суммировать в пределах

Значок инструмента Доступен в аналитике больших данных.

Инструмент Суммировать в пределах Инструмент Суммировать в пределах вычисляет статистику площадей, в которых входной слой находится в пределах или перекрывает слой границы. Суммируемая область может быть площадным слоем или шестиугольным или квадратным бином.

Схема рабочего процесса

Схема рабочего процесса Суммировать в пределах

Примеры

Ниже приведены примеры использования инструмента Суммировать в пределах:

  • Интернет-провайдер запускает пилотный проект по обеспечению недорогим доступом в интернет студентов колледжей с низкими доходами. Инструмент Суммировать в пределах по бинам может применяться для определения числа студентов с низким доходом в квадратных ячейках определенного размера, чтобы интернет-провайдер мог определить подходящий район для своего пилотного проекта.
  • Для эффективного выполнения текущих проектов технического обслуживания город использует инструмент Суммировать в пределах для подсчета уличных фонарей и суммирования длины велосипедных дорожек в пределах каждого района обслуживания. Затем может быть оценены материал и персонал для выполнения работ в каждом районе.

Примечания по использованию

При работе с инструментом Суммировать в пределах учитывайте следующее:

  • Входным слоем для суммирования может быть точечный, линейный или полигональный слой.
  • Выходной слой всегда представляет собой полигональную область или слой бинов, и возвращаются только те области или объекты бины, где произошло суммирование объектов.
  • Вы можете представить себе суммирование в пределах так, будто вы берете два слоя - полигональные объекты и входные объекты суммирования, и накладываете их друг на друга. После наложения этих слоев вы просматриваете будто сквозь наложения и подсчитываете количество входных объектов суммирования, попадающих в полигоны. Помимо количества объектов, вы также можете вычислить несложную статистику атрибутов входных объектов, которые суммируются: сумму, среднее значение, максимум, минимум и т.д.
  • Вы можете использовать инструмент Суммировать в пределах для вычисления стандартной и географически взвешенной статистики. Стандартная статистика суммирует значения статистики без какого-либо взвешивания. Взвешенная статистика вычисляет значения, используя географически взвешенные значения пропорции линий в пределах полигона или пропорции полигонов в полигоне. Взвешенная статистика не применима по отношению к точкам в полигоне.

Как работает инструмент Суммировать в пределах

Далее следует описание работы инструмента Суммировать в пределах.

Уравнения

Для суммируемых линейных и площадных объектов в взвешенную статистику включены веса Области суммирования. Для точечных объектов статистика не взвешивается. В следующей таблице показаны уравнения для вычисления дисперсии, взвешенного среднего и взвешенного стандартного отклонения.

СтатистикаУравнениеПеременныеОбъекты

Дисперсия

Уравнение дисперсииПеременные дисперсии

Точки

Взвешенное среднее

Уравнение взвешенного среднего

Переменные взвешенного среднего

Веса вычисляются как доля объекта в процентах к области суммирования.

Линии и площади

Взвешенное стандартное отклонение

Уравнение взвешенного стандартного отклонения

Переменные взвешенного стандартного отклонения

Веса вычисляются как доля объекта в процентах к области суммирования.

Линии и площади

Точки

Точечные слои суммируются, используя только точечные объекты, находящиеся в пределах Области суммирования. Взвешенную статистику нельзя применить при суммировании точек.

На рисунке и в таблице объяснены статистические вычисления для точечного Суммируемого слоя в пределах гипотетических областей. Для вычисления статистики (Количество, Сумма, Минимум, Максимум, Диапазон, Среднее, Стандартное отклонение и Дисперсия) для данного слоя использовалось поле Population.

Суммирование точечного слоя
Точечные слои суммируются, используя только точки, находящиеся в пределах области слоя. Пример таблицы атрибутов отображает значения, которые будут использоваться в гипотетических статистических расчетах.

Числовая статистикаРезультаты. Округ A

Количество

Количество:

[280, 408, 356, 361, 450, 713] = 6

Сумма

280 + 408 + 356 + 361 + 450 + 713 = 2,568

Минимум

Минимум:

[280, 408, 356, 361, 450, 713] = 280

Максимум

Максимум:

[280, 408, 356, 361, 450, 713] = 713

Диапазон

713 - 280 = 433

Среднее

2568/6 = 428

Дисперсия

Дисперсия точек
= 22737.2

Стандартное отклонение

Среднеквадратичное отклонение точек
= 150.7886

Статистика строкиРезультаты. Округ A

Количество

= 6

Любые

= Средняя школа

Примечание:

Количественная статистика (для строковых и числовых полей) подсчитывает количество ненулевых значений. Например, количество [0, 1, 10, 5, null, 6] равно 5. Количество [Primary, Primary, Secondary, null] - 3.

Настоящая ситуация, в которой этот анализ может использоваться, – определение общего числа студентов в каждом округе со школой. Каждая точка соответствует школе. Поле Type содержит тип школы (начальная, школа второй ступени или средняя), а поле количества студентов – число обучающихся в каждой школе студентов. Вычисления и результаты для Округа A представлены в расположенной выше таблице. Из результатов вы увидите, что в Округе A обучаются 2568 студентов. При запуске инструмента Суммировать в пределах будут получены также результаты для Округа B.

Линии

Для взвешенной статистики линейные слои суммируются только с помощью пропорций линейных объектов, находящихся внутри Области суммирования. Стандартная (не взвешенная) статистика суммирует все линии, пересекающие Область суммирования. При суммировании линий с помощью взвешенной статистики используйте количества (а не отношения и индексы), чтобы вычисления пропорций вашего анализа были логичны.

На рисунке и в таблице объяснены статистические вычисления для линейного Суммируемого слоя в пределах гипотетической Области суммирования. Для вычисления статистики (Количество, Сумма, Минимум, Максимум, Диапазон, Среднее, Стандартное отклонение и Дисперсия) для данного слоя использовалось поле Volume. Стандартная статистика вычисляется с использованием линий, пересекающих границу, а взвешенная - при помощи отношения линий внутри Области суммирования.

Суммирование линейного слоя
Линейные слои суммируются с использованием стандартной статистики и взвешенной статистики.

Числовая статистикаСтандартная статистикаВзвешенная статистика

Вычисление весов

Не применяется

Вес коричневой линии (значение = 600):

2/3 = .6667

Вес синей линии (значение = 1000):

3/6 = .5

Количество

Количество:

[1000, 600] = 2

Количество:

1 x (3/6) + 1 x (2/3) = 1.1667

Сумма

1000 + 600 = 1600
1000 x (3/6) + 600 x (2/3) = 900

Минимум

Минимум:

[1000, 600] = 600

Минимум:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 400

Максимум

Максимум:

[1000, 600] = 1000

Максимум:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 500

Диапазон

1000 - 600 = 600
500 - 400 = 100

Среднее

(1000 + 600)/2 = 800
(1000 x (3/6) + 600 x (2/3))/(3/6 + 2/3)
(500 + 400)/(7/6) = 771.4286

Дисперсия

Дисперсия линий
= 80000
Взвешенная дисперсия линий
= 1268571.4286

Стандартное отклонение

Стандартное отклонение линий
= 282.8427
Взвешенное стандартное отклонение линий
= 1126.3088

Ситуация в которой данный анализ может применяться, – определение общего объёма воды в реках в пределах границ национального парка. Каждая линия отображает реку, частично расположенную в парке. В результатах вы увидите, что в парке есть 5 миль рек, общий объем которых составляет 900 единиц.

Области

Площадные слои суммируются, используя только части площадных объектов, находящиеся в пределах входной границы. При суммировании площадей используйте поля с абсолютными значениями, чтобы пропорциональные вычисления при выполнении анализа не теряли логического смысла.

Взвешенная статистика для суммируемых площадных слоев основывается на частях объектов Суммируемой области, находящихся внутри Слоя суммирования. При суммировании областей используйте количества (а не отношения и индексы), чтобы вычисления пропорций вашего анализа были логичны.

На рисунке и в таблице объяснены статистические вычисления для площадного слоя в пределах гипотетической Суммируемой области. Для вычисления статистики (Количество, Сумма, Минимум, Максимум, диапазон, Среднее, Стандартное отклонение и Дисперсия) для данного слоя использовалось поле населения. Стандартная статистика вычисляется с помощью областей, пересекающих Область суммирования, а взвешенная - с помощью частей суммируемых областей в пределах каждого Суммируемого слоя.

Суммирование площадного слоя
Суммарная статистика вычисляется в слое суммирования для областей, пересекающих области суммирования. Веса рассчитываются на основе пропорции областей суммирования, которые перекрывают объекты суммируемого слоя.

Числовая статистикаСтандартная статистика: результаты окрестность 1Взвешенная статистика: результаты окрестность 1

Вычисление весов

Вес желтой области (значение = 3200):

4/(2+4) = 4/6

Вес зеленой области (значение = 4700):

4/(2+4) = 2/3

Вес розовой области (значение = 1000):

1/(1+1.5) = 2/5

Вес синей области (значение = 4500):

6/(2+6) = 3/4

Вес оранжевой области (значение = 3600):

2/(2+2) = 1/2

Количество

Количество:

[3200, 4700, 1000, 4500, 3600] = 5

Количество:

(2/3)+(2/3)+ (2/5)+(3/4)+ (1/2) = 2.98

Сумма

3200 + 4700 + 1000 + 4500 + 3600 = 17000
(3/4) x 3200 +(2/3) x 4700 + (2/5) x 1000 +(3/4) x 4500 + (1/2) x 3600 = 10841.67

Минимум

Минимум:

[3200, 4700, 1000, 4500, 3600] = 1000

Минимум:

[(2/3) x 3200, (2/3) x 4700, (2/5) x 1000, (3/4) x 4500, (1/2) x 3600]
[2133.33, 3133.33, 400, 3375, 1800] = 400

Максимум

Максимум:

3200, 4700, 1000, 4500, 3600] = 4700

Максимум:

[2133.33, 3133.33, 400, 3375, 1800] = 3375

Диапазон

4700 - 1000 = 3700
3375 - 400 = 2,975

Среднее

(17000)/5 = 3400
(10841.67)/[2.9833] = 3634.12

Дисперсия

Дисперсия областей
= 2185000
Взвешенная дисперсия областей
= 1727137.5112

Стандартное отклонение

Стандартное отклонение областей
= 1478.175
Взвешенное стандартное отклонение площадей
= 1314.2060

Параметры

Ниже приведены параметры инструмента Суммировать в пределах:

ПараметрОписаниеТип данных

Входной слой

Суммируемые точечные, линейные или полигональные объекты, которые будут суммироваться в пределах областей.

Возможности

Тип бина

Геометрия бина, которая будет использоваться для создания регулярных бинов. Варианты - Квадрат и Шестиугольник.

Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не будет отображаться или не будет обязательным.

Строка

Размер бина

Интервал расстояния, определяющий размер бинов, в границах которых будут объединены входные точки. Для квадратных бинов, размер соответствует высоте квадрата. Используется по умолчанию. Для шестиугольных бинов размер бина соответствует высоте шестиугольника между двумя параллельными сторонами.

Если источник полигонов подключен к порту соединения этого инструмента, этот параметр не будет отображаться или не будет обязательным.

Строка

Суммирование геометрии

Указывает, будет ли информация о геометрии суммироваться как часть анализа (длина линий или площадь полигонов). Если входными данными являются точки, то нет информации о геометрии, которую можно было бы суммировать. Добавляется только количество точек в пределах каждого полигонального объекта.

Boolean

Единицы измерения объектов

Единицы, в которых будут вычисляться суммированные атрибуты объекта. Если входными объектами суммирования являются линии, укажите единицу измерения длины. Если входными данными являются полигоны, укажите единицу измерения площади.

Строка

Поля суммирования

Статистика, которая будет рассчитываться для указанных полей. Доступны различные типы статистики в зависимости от того, является ли указываемое поле строковым, числовым или полем типа дата.

  • Любой – пример строки из текстового поля.
  • Количество – вычисляет количество ненулевых значений. Может использоваться с числовыми или текстовыми полями. Количество [null, 0, 2] – это 2.
  • Количество (отличающихся) – вычисляет количество уникальных ненулевых значений. Может использоваться с числовыми или текстовыми полями. Результатом подсчета количества уникальных значений для ряда [null, 4, 3, 4] будет 2.
  • Сумма – сумма числовых значений в поле. Сумма для ряда [null, null, 3] равна 3.
  • Сумма квадратов – Сумма, по всем наблюдениям, квадратов разностей каждого наблюдения от общего среднего значения. Сумма квадратов для ряда [null, 2.2, 3.1, 4.7] равна 3.206.
  • Мин – минимальное значение числового поля. Минимальное значение [0, 2, null] равно 0.
  • Макс – максимальное значение числового поля. Максимальное значение [0, 2, null] равно 2.
  • Среднее – среднее арифметическое числовых значений. Среднее [0, 2, null] равно 1.
  • Диапазон – диапазон числового поля. Вычисляется вычитанием минимального значения из максимального. Диапазон [0, null, 1] равен 1. Диапазон [null, 4] равен 0.
  • Дисперсия – дисперсия по числовому полю в треке. Дисперсия ряда [1] равна null. Дисперсия ряда [null, 1, 1, 1] равна null.
  • Среднеквадратическое отклонение – Среднеквадратическое отклонение числового поля. Среднеквадратическое отклонение [1] равно null. Среднеквадратическое отклонение [null, 1, 1, 1] равно 1.

Строка

Взвешенная статистика

Географически взвешенная статистика, которая будет рассчитываться для указанных полей. Взвешенная статистика вычисляет значения, используя географически взвешенные значения пропорции линий в пределах полигона или пропорции полигонов в полигоне. Взвешенная статистика не применима по отношению к точкам в полигоне. Доступны различные типы статистики в зависимости от того, является ли указываемое поле строковым, числовым или полем типа дата.

  • Количество – вычисляет количество ненулевых значений. Может использоваться с числовыми или текстовыми полями. Количество [null, 0, 2] – это 2.
  • Сумма – сумма числовых значений в поле. Сумма для ряда [null, null, 3] равна 3.
  • Мин – минимальное значение числового поля. Минимальное значение [0, 2, null] равно 0.
  • Макс – максимальное значение числового поля. Максимальное значение [0, 2, null] равно 2.
  • Среднее – среднее арифметическое числовых значений. Среднее [0, 2, null] равно 1.
  • Диапазон – диапазон числового поля. Вычисляется вычитанием минимального значения из максимального. Диапазон [0, null, 1] равен 1. Диапазон [null, 4] равен 0.

Строка

Выходной слой

Выходной слой будет содержать следующие поля вместо исходных полей. Если вы настроите поля суммирования, то эти поля также будут вычислены для данного выходного слоя.

Имя поляОписаниеТип поля

COUNT

Количество объектов входного слоя, которые были суммированы в этом полигональном бине.

Float64

sum_length_<units>

Если входной слой является полилинейным объектом, а для параметра Суммирование геометрии задано значение Да, то в результате будет создано поле, в котором будет указана общая длина полилинейных объектов в каждом бине в единицах измерения, заданных параметром Единицы измерения объектов.

Float64

sum_area_<units>

Если входной слой является полигональным, а параметр Суммирование геометрии задан как Да, то в выходных данных будет создано это поле, отображающее общую площадь полигональных объектов в каждом бине в единицах измерения, заданных параметром Единицы измерения объектов.

Float64

Советы и ограничения

При суммировании линий и площадей используются их части. Поэтому лучше суммировать абсолютные значения (например, численность населения), чем относительные (такие как средний доход) при суммировании линий и площадей.