Инструмент Соединение объединяет наборы данных на основе указанных отношений. Наборы данных можно объединять, используя совпадающие атрибуты, пространственные отношения, временные отношения или любую их комбинацию.
Примеры
Инструмент Соединение можно использовать в следующих сценариях:
- Соединять полигоны округов с данными переписи округа на основе совпадающих значений полей countyID.
- Соединять записи, которые происходят в относительное время и в определенном месте, используя как временное, так и пространственное отношение.
Параметры
В следующей таблице приводится описание параметров, используемых в инструменте Соединение:
Параметр | Описание |
---|---|
Целевой набор данных | Набор данных, к которому будут присоединены записи. |
Присоединяемый набор данных | Набор данных, который будет присоединен к целевому набору данных. |
Операция соединения | Указывает, будут ли все совпадающие записи соединяться (один ко многим) или все сопоставленные записи будут суммироваться (один к одному). |
Тип соединения | Указывает, возвращаются ли в выходных данных целевые записи, у которых нет соответствующей присоединяемой записи. |
Поля суммирования | Определяет, для каких полей присоединяемого набора данных будет рассчитываться статистика. |
Использовать сопоставление полей | Указывает, будет ли использоваться отношение атрибутов. |
Целевое поле | Поле из целевого набора данных, которое будет использоваться для сопоставления записей в присоединяемом наборе данных. |
Поле соединения | Поле из присоединяемого набора данных, которое будет использоваться для сопоставления записей в целевом наборе данных. |
Использовать пространственное отношение | Указывает, будет ли использоваться пространственное отношение. |
Пространственное отношение | Указывает тип пространственного отношения, который будет использоваться для определения условия соединения между целевым набором данных и присоединяемым набором данных. |
Кратчайшее расстояние | Пороговое значение линейного расстояния, которое будет использоваться для определения местоположений, расположенных рядом друг с другом. Этот параметр доступен только для пространственных отношений типа Рядом на плоскости или Рядом геодезически. |
Единица измерения кратчайшего расстояния | Единица измерения порога линейного расстояния. Этот параметр доступен только для пространственных отношений типа Рядом на плоскости или Рядом геодезически. |
Целевая геометрия | Поле геометрии из целевого набора данных, которое будет использоваться для определения пространственных отношений с присоединяемым набором данных. |
Присоединяемая геометрия | Поле геометрии из набора данных соединения, которое будет использоваться для определения пространственных отношений с целевым набором данных. |
Использовать временное отношение | Указывает, будет ли использоваться временная связь. |
Временное отношение | Указывает тип временного отношения, который будет использоваться для определения условия соединения между целевым набором данных и присоединяемым набором данных. |
Кратчайшее расстояние | Пороговое значение временного расстояния, которое будет использоваться для определения записей, близких друг к другу во времени. Этот параметр доступен только для временных отношений типа Ближе, Ближе до или Ближе после. |
Единица измерения кратчайшего расстояния | Единица измерения временного порога расстояния. Этот параметр доступен только для временных отношений типа Ближе, Ближе до или Ближе после. |
Целевое время начала | Поле даты и времени из целевого набора данных, которое будет использоваться для указания времени начала записи. |
Целевое время окончания | Поле даты и времени из целевого набора данных, которое будет использоваться для указания времени окончания записи. Этот параметр является обязательным, если вы хотите присоединить, используя время интервального типа. Подробнее см. в разделе Временные отношения вData Pipelines. |
Время начала соединения | Поле даты и времени из присоединяемого набора данных, которое будет использоваться для указания времени начала записи. |
Время окончания соединения | Поле даты и времени из присоединяемого набора данных, которое будет использоваться для указания времени окончания записи. Этот параметр является обязательным, если вы хотите присоединить, используя время интервального типа. Подробнее см. в разделе Временные отношения вData Pipelines. |
Примечания по использованию
Используйте параметр Целевой набор данных, чтобы указать набор данных, к которому будут присоединены записи. Используйте параметр Присоединяемый набор данных, чтобы определить набор данных, содержащий записи, которые будут присоединены к целевым записям.
Если несколько присоединяемых записей соответствуют одной и той же целевой записи, вы можете указать, будут ли все совпадающие записи присоединяться (опция Присоединить один-ко-многим) или все совпадающие записи будут объединены вместе (опция Присоединить один-к-одному) следующим образом:
- Присоединить один-ко-многим - все сопоставленные записи в присоединяемом наборе данных будут присоединены к целевому набору данных. Выходной набор данных будет содержать несколько записей для целевой записи.
- Присоединить один-к-одному - все совпадающие записи в присоединяемом наборе будут суммированы с каждой записью в целевом наборе данных. Только те записи, которые совпадают, будут включены в суммирование и результат. Количество присоединенных записей будет добавлено. По умолчанию в классе выходных записей (внутреннее соединение) будут поддерживаться только те целевые записи, которые содержат указанные отношения. Если отмечено Левое соединение, все входные целевые записи будут записываться в класс выходных записей (это называется левым внешним соединением).
Параметр Поля суммирования определяет, какие числовые поля присоединяемого набора данных следует суммировать. Для числовых полей поддерживается следующая статистика: сумма, минимум, максимум, среднее и стандартное отклонение. Для полей даты и времени (datetime) поддерживается следующая статистика: минимум и максимум. Параметр Поля суммирования доступен, если операцией присоединения является Присоединить один-ко-многим.
Вы можете соединять записи на основании пространственного отношения, временного отношения, атрибутивного отношения или любой их комбинации. Пространственное соединение сопоставляет записи (строки) из входных записей (значения параметров Целевой набор данных и Присоединяемый набор данных) на основе их пространственного положения. Временное соединение сопоставляет записи из входных записей на основе их временных отношений. Соединение атрибутов сопоставляет записи на основе значений полей. В следующей таблице описаны все типы отношений соединения:
Отношение | Описание |
---|---|
Атрибут | Атрибутивное отношение, определяющее, будут ли записи присоединяться друг к другу. Записи сопоставляются, когда значения полей в присоединяемом наборе данных равны значениям полей в целевом наборе данных. Рекомендуется использовать поля одного типа. |
Пространственный | Пространственное отношение, определяющее, будут ли записи присоединяться друг к другу. Доступные отношения будут зависеть от типа геометрии (точки, линии, полигоны) соединяемых наборов данных. Доступны следующие пространственные отношения:
|
Временной | Временное отношение, определяющее, будут ли записи присоединяться друг к другу. Доступные отношения будут зависеть от типа времени (момент или интервал) соединяемых наборов данных. Доступны следующие временные отношения:
|
Если целевая и присоединяемая геометрия находятся в разных системах координат, при анализе пространственных отношений будет использоваться система координат целевого набора данных.
Если для параметра Пространственное отношение установлено значение Ближайший на плоскости, значение параметра Целевая геометрия должно быть в системе координат проекции.
Выходные данные
Все поля из целевого набора данных и объединенного набора данных будут включены в выходные записи при выполнении соединения один-ко-многим. Если в обоих наборах данных существует одно и то же имя поля, объединенное поле будет начинаться с добавленного слова join (например, join_fieldname).
В дополнение ко всем полям (включая геометрию) из целевого набора данных следующие поля будут включены в выходные записи при выполнении соединения один-к-одному:
Имя поля | Описание |
---|---|
count | Число записей, которые были объединены. Всегда включено в выходные данные. |
statistic_fieldname | Каждая заданная статистика создает поле атрибута с именем в следующем формате: statistics_fieldname. Например, максимальное значение поля id будет MAX_id. |
start_datetime | Это поле представляет время начала и включается только при использовании временных соединений. |
end_datetime | Это поле представляет время окончания и включается только при использовании временных соединений со значениями времени интервала. |
Лицензионные требования
Требуется следующее лицензии и конфигурации:
- Тип пользователя Creator или Professional
- Роль Издатель, Посредник или Администратор, или эквивалентная пользовательская роль
Подробнее о системных требованиях Data Pipelines см. раздел Требования
Связанные разделы
Дополнительную информацию см. в следующих темах: