Инструмент Соединение объединяет наборы данных на основе указанных отношений. Наборы данных можно объединять, используя совпадающие атрибуты, пространственные отношения, временные отношения или любую их комбинацию.
Примеры
Инструмент Соединение можно использовать в следующих сценариях:
- Соединять полигоны округов с данными переписи округа на основе совпадающих значений полей countyID.
- Соединять записи, которые происходят в относительное время и в определенном месте, используя как временное, так и пространственное отношение.
Параметры
В следующей таблице приводится описание параметров, используемых в инструменте Соединение:
Параметр | Описание |
---|---|
Целевой набор данных | Набор данных, к которому будут присоединены записи. |
Присоединяемый набор данных | Набор данных, который будет присоединен к целевому набору данных. |
Операция соединения | Указывает, будут ли все совпадающие записи соединяться (один ко многим) или все сопоставленные записи будут суммироваться (один к одному). |
Тип соединения | Указывает, возвращаются ли в выходных данных целевые записи, у которых нет соответствующей присоединяемой записи. |
Поля суммирования | Определяет, для каких полей присоединяемого набора данных будет рассчитываться статистика. |
Использовать сопоставление полей | Указывает, будет ли использоваться отношение атрибутов. |
Целевое поле | Поле из целевого набора данных, которое будет использоваться для сопоставления записей в присоединяемом наборе данных. |
Поле соединения | Поле из присоединяемого набора данных, которое будет использоваться для сопоставления записей в целевом наборе данных. |
Использовать пространственное отношение | Указывает, будет ли использоваться пространственное отношение. |
Пространственное отношение | Указывает тип пространственного отношения, который будет использоваться для определения условия соединения между целевым набором данных и присоединяемым набором данных. |
Кратчайшее расстояние | Пороговое значение линейного расстояния, которое будет использоваться для определения местоположений, расположенных рядом друг с другом. Этот параметр доступен только для пространственных отношений типа Рядом на плоскости или Рядом геодезически. |
Единица измерения кратчайшего расстояния | Единица измерения порога линейного расстояния. Этот параметр доступен только для пространственных отношений типа Рядом на плоскости или Рядом геодезически. |
Целевая геометрия | Поле геометрии из целевого набора данных, которое будет использоваться для определения пространственных отношений с присоединяемым набором данных. |
Присоединяемая геометрия | Поле геометрии из набора данных соединения, которое будет использоваться для определения пространственных отношений с целевым набором данных. |
Использовать временное отношение | Указывает, будет ли использоваться временная связь. |
Временное отношение | Указывает тип временного отношения, который будет использоваться для определения условия соединения между целевым набором данных и присоединяемым набором данных. |
Кратчайшее расстояние | Пороговое значение временного расстояния, которое будет использоваться для определения записей, близких друг к другу во времени. Этот параметр доступен только для временных отношений типа Ближе, Ближе до или Ближе после. |
Единица измерения кратчайшего расстояния | Единица измерения временного порога расстояния. Этот параметр доступен только для временных отношений типа Ближе, Ближе до или Ближе после. |
Целевое время начала | Поле даты и времени из целевого набора данных, которое будет использоваться для указания времени начала записи. |
Целевое время окончания | Поле даты и времени из целевого набора данных, которое будет использоваться для указания времени окончания записи. Этот параметр является обязательным, если вы хотите присоединить, используя время интервального типа. Подробнее см. в разделе Временные отношения вData Pipelines. |
Время начала соединения | Поле даты и времени из присоединяемого набора данных, которое будет использоваться для указания времени начала записи. |
Время окончания соединения | Поле даты и времени из присоединяемого набора данных, которое будет использоваться для указания времени окончания записи. Этот параметр является обязательным, если вы хотите присоединить, используя время интервального типа. Подробнее см. в разделе Временные отношения вData Pipelines. |
Примечания по использованию
Используйте параметр Целевой набор данных, чтобы указать набор данных, к которому будут присоединены записи. Используйте параметр Присоединяемый набор данных, чтобы определить набор данных, содержащий записи, которые будут присоединены к целевым записям.
Если несколько присоединяемых записей соответствуют одной и той же целевой записи, вы можете указать, будут ли все совпадающие записи присоединяться (опция Присоединить один-ко-многим) или все совпадающие записи будут объединены вместе (опция Присоединить один-к-одному) следующим образом:
- Присоединить один-ко-многим - все сопоставленные записи в присоединяемом наборе данных будут присоединены к целевому набору данных. Выходной набор данных будет содержать несколько записей для целевой записи.
- Присоединить один-к-одному - все совпадающие записи в присоединяемом наборе будут суммированы с каждой записью в целевом наборе данных. Только те записи, которые совпадают, будут включены в суммирование и результат. Количество присоединенных записей будет добавлено. По умолчанию в классе выходных записей (внутреннее соединение) будут поддерживаться только те целевые записи, которые содержат указанные отношения. Если отмечено Левое соединение, все входные целевые записи будут записываться в класс выходных записей (это называется левым внешним соединением).
Параметр Поля суммирования определяет, какие поля из присоединяемого набора данных будут суммированы. Параметр Поля суммирования доступен, если операцией присоединения является Присоединить один-ко-многим. Доступны следующие показатели суммарной статистики:
- Сумма – сумма числовых значений в поле. Сумма [null, 1, 3] равна 4.
- Мин – минимальное значение числового поля или поля даты. Минимальное значение [0, 2, null] равно 0.
- Макс – максимальное значение числового поля или поля даты. Максимум [0, 2, null] равно 2.
- Среднее – среднее арифметическое числовых значений. Среднее [0, 2, null] равно 1.
- Среднеквадратическое отклонение – среднеквадратическое отклонение числового поля. Среднеквадратическое отклонение [null, 1, 1, 1] равно 0.
- Количество – количество не пустых значений. Его можно использовать на поле любого типа. Число [null, "hello", "world"] равняется 2.
- Любой – выборочное значение из поля любого типа.
Вы можете соединять записи на основании пространственного отношения, временного отношения, атрибутивного отношения или любой их комбинации. Пространственное соединение сопоставляет записи (строки) из входных записей (значения параметров Целевой набор данных и Присоединяемый набор данных) на основе их пространственного положения. Временное соединение сопоставляет записи из входных записей на основе их временных отношений. Соединение атрибутов сопоставляет записи на основе значений полей. В следующей таблице описаны все типы отношений соединения:
Отношение | Описание |
---|---|
Атрибут | Атрибутивное отношение, определяющее, будут ли записи присоединяться друг к другу. Записи сопоставляются, когда значения полей в присоединяемом наборе данных равны значениям полей в целевом наборе данных. Рекомендуется использовать поля одного типа. |
Пространственный | Пространственное отношение, определяющее, будут ли записи присоединяться друг к другу. Доступные отношения будут зависеть от типа геометрии (точки, линии, полигоны) соединяемых наборов данных. Доступны следующие пространственные отношения:
|
Временной | Временное отношение, определяющее, будут ли записи присоединяться друг к другу. Доступные отношения будут зависеть от типа времени (момент или интервал) соединяемых наборов данных. Доступны следующие временные отношения:
|
Если целевая и присоединяемая геометрия находятся в разных системах координат, при анализе пространственных отношений будет использоваться система координат целевого набора данных.
Если для параметра Пространственное отношение установлено значение Ближайший на плоскости, значение параметра Целевая геометрия должно быть в системе координат проекции.
Выходные данные
При запуске соединения один-ко-многим в выходные данные будут включены все поля из целевого набора данных и присоединенного набора данных. Если в обоих наборах данных существует одно и то же имя поля, объединенное поле будет начинаться с добавленного слова join (например, join_fieldname).
При запуске соединения один-к-одному в дополнение ко всем полям (включая геометрию) из целевого набора данных в выходные данные будут включены следующие поля:
Имя поля | Описание |
---|---|
COUNT | Число записей, которые были объединены. Всегда включено в выходные данные. |
STATISTIC_fieldname | Каждая указанная статистика создаст поле атрибута, названное в следующем формате: STATISTIC_имя_поля. Например, максимальное значение поля id будет MAX_id. |
START_DATETIME | Это поле представляет время начала и включается только при использовании временных соединений. |
END_DATETIME | Это поле представляет время окончания и включается только при использовании временных соединений со значениями времени интервала. |
Лицензионные требования
Требуется следующее лицензии и конфигурации:
- Тип пользователя Creator или Professional
- Роль Издатель, Посредник или Администратор, или эквивалентная пользовательская роль
Подробнее о системных требованиях Data Pipelines см. раздел Требования
Связанные разделы
Дополнительную информацию см. в следующих темах: