Пространственная агрегация вычисляет статистику для областей, в которых входной слой перекрывает слой границы.
Пример
Бизнес аналитик консорциума колледжей изучает маркетинговые кампании в штатах, где расположены колледжи с высокой стоимостью обучения, и хочет выяснить, в каком штате больше всего колледжей с высокой рентабельностью инвестиций (ROI). Пространственную агрегацию можно использовать для агрегирования колледжей по штатам, чтобы найти количество колледжей с ROI выше среднего.
Запуск пространственной агрегации
Пространственная агрегация может выполняться на картах с двумя слоями: один слой области с границами, которые будут использоваться для агрегации (например, округа, районы переписи или полицейские округа) и один слой с данными для агрегирования.
Выполните следующие действия, чтобы вычислить пространственную статистику:
- Если необходимо, щелкните карточку карты, чтобы активировать ее.
Карточка активна, когда появляются панель инструментов и кнопка Действие .
- Щелкнитe кнопку Действие и выберите Пространственная агрегация.
- Для параметра Выберите полигональный слой выберите слой границ, а для параметра Выберите слой для суммирования - слой для агрегирования.
- Для параметра Стиль по выберите поле или статистику для вычисления и отображения.
- Вы можете использовать Дополнительные опции для выбора дополнительных полей и статистики.
- Щелкните Запустить.
Подсказка:
Пространственное агрегирование можно также запустить, перетащив набор данных в область Пространственная агрегация на существующей карте.
Примечания по использованию
Используйте параметры Выберите полигональный слой и Выберите слой для суммирования для выбора слоя границ и слоя для суммирования. Для параметра Выберите полигональный слой доступны только слои с площадными объектами.
Используйте параметр Стиль по для изменения вычисляемой статистики. Статистика по умолчанию зависит от типа суммируемого слоя. Используйте ниспадающее меню, чтобы выбрать другой вариант стиля. В следующей таблице приведены опции Стиль по для каждого типа слоя:
Тип суммируемого слоя | Опция стиля по умолчанию | Другие опции стиля |
---|---|---|
Точка | Количество | Числовое поле или поле доля/отношение (сумма, минимум, максимум, среднее или мода) Строковое поле (мода) |
Линия | Числовое поле (сумма) или поле доля/отношение (среднее) | Числовое поле или поле доля/отношение (сумма, минимум, максимум, среднее или мода) Строковое поле (мода) Суммарная длина (метры, километры, футы или мили) |
Площадь | Числовое поле (сумма) или поле доля/отношение (среднее) | Числовое поле или поле доля/отношение (сумма, минимум, максимум, среднее или мода) Строковое поле (мода) Суммарная площадь (квадратные метры, квадратные километры, квадратные футы или квадратные мили) |
Примечание:
При расчете статистики для линий и площадей рекомендуется использовать числа, а не доли/отношения, чтобы пропорциональные вычисления имели логический смысл. Для получения более подробной информации см. расположенный ниже раздел Как работает Пространственное агрегирование.
Вы можете расширить параметр Дополнительные опции и назначить дополнительную статистику. Каждый раз, когда поле добавляется к списку суммарной статистике, появляется новое поле под списком.
Ограничения
Когда вы выполняете пространственное агрегирование или пространственную фильтрацию на данных из того же подключения к базе данных, вы должны убедиться, что все эти данные хранятся в одной системе пространственной привязки. Данные наборов данных из SQL Server также должны быть данными одного типа (география или геометрия).
Следующие ограничения применяются к Google BigQuery, Snowflake и платформам баз данных, которые не поддерживаются без настройки:
- Пространственная агрегация, использующая линейные и площадные объекты в качестве параметра Выбрать слой для суммирования, не поддерживается в подключениях только для чтения.
- Оба входных слоя должны поступать из одного и того же подключения к базе данных.
Google BigQuery не поддерживает вычисление моды.
Как работает Пространственное агрегирование
Среднее рассчитывается с использованием взвешенного среднего для линейных и площадных объектов. Для вычисления взвешенного среднего используется следующее уравнение:
где: N = число наблюдений xi = наблюдения Wi = веса
Точки
Точечные слои суммируются, используя только точечные объекты, находящиеся в пределах входной границы. Ни одно из вычислений не взвешивается.
На рисунке и в таблице объяснены статистические вычисления для точечного слоя в пределах гипотетических границ. Поле Population использовалось для расчета числовой статистики (количество, сумма, минимум, максимум и среднее), а поле Type использовалось для моды.
Поле | Статистика | Результаты. Округ A | Результаты. Округ B |
---|---|---|---|
Population | Количество | 6 | 6 |
Сумма |
|
| |
Минимум | Минимум:
| Минимум:
| |
Максимум | Максимум:
| Максимум:
| |
Среднее |
|
| |
Type | Режим | Начальная школа | Начальная школа |
Настоящая ситуация, в которой этот анализ может использоваться, – определение общего числа студентов в каждом округе со школой. Каждая точка соответствует школе. Поле Type содержит тип школы (начальная, школа второй ступени или средняя), а поле Population – число обучающихся в каждой школе студентов. Вычисления и результаты представлены в расположенной выше таблице. Результаты показывают, что в округе A обучаются 2568 студентов, а в округе B - 3400.
Линии
Линейные слои численно суммируются, используя только части линейных объектов, находящиеся в пределах входной границы. При суммировании линий используйте поля с числами и количеством (а не отношения и уровни), чтобы вычисления пропорций анализа были логичны. Результаты отображаются с помощью градуированных символов.
Мода линейных слоев основана на числе объектов, которые пересекают границу. Линии не обязательно должны полностью быть в пределах границ, чтобы войти в подсчет моды, каждая линия считается как один объект, независимо от размера ее части, которая находится в пределах границы. Результаты отображаются с использованием уникальных символов.
На рисунке и в таблице ниже показаны статистические вычисления для линейного слоя в пределах гипотетических границ. Для вычисления статистики слоя использовался объем (сумма, минимум, максимум и среднее). При вычислении статистики используются только части линий, находящиеся в пределах границы. Мода вычисляется для типов водных объектов.
Статистика | Поле | Результат |
---|---|---|
Сумма длин | Длина |
Примечание:Длина также может быть рассчитана в футах, метрах и километрах. |
Сумма | Объём |
|
Минимум | Минимум:
| |
Максимум | Максимум:
| |
Среднее |
| |
Режим | Тип | Река |
Ситуация в которой данный анализ может применяться, – определение общего объёма воды в реках в пределах границ национального парка. Каждая линия отображает реку, частично расположенную в парке. Результаты показывают, что в парке есть 6,5 миль рек, общий объем которых составляет 1200 единиц.
Области
Площадные слои суммируются, используя только части площадных объектов, находящиеся в пределах входной границы. При суммировании областей используйте поля с числами и количеством (а не отношения и уровни), чтобы вычисления пропорций анализа были логичны. Результаты отображаются с помощью градуированных символов.
Мода полигональных слоев основана на числе объектов, которые пересекают границу. Полигоны не обязательно должны быть полностью в пределах границ, чтобы войти в подсчет моды, каждый полигон считается как один объект, независимо от размера его части, которая находится в пределах границы. Результаты отображаются с использованием уникальных символов.
На рисунке и в таблице ниже показаны статистические вычисления для полигонального слоя в пределах гипотетических границ. Для расчета статистики слоя использовалось население (сумма, минимум, максимум и среднее). При вычислении статистики используются только части площадей, находящиеся в пределах границы. Мода вычисляется с использованием назначений сегментов tapestry для каждой площади.
Статистика | Поле | Результат |
---|---|---|
Сумма площадей | Площадь |
Примечание:Площадь также может быть рассчитана в квадратных футах, метрах и километрах. |
Сумма | Численность населения |
|
Минимум | Минимум:
| |
Максимум | Максимум:
| |
Среднее |
| |
Режим | Сегмент | Сегмент 2 |
Ситуацией, в которой будет применим этот анализ, является определение численности населения кварталов города. Синим показана граница квартала, а маленькими площадями – кварталы переписи. Результаты показывают, что численность населения кварталов города – 10481 человек, а средняя численность квартала переписи – 2666 человек.