Skip To Content

Unión

La herramienta Unir une datasets basándose en las relaciones especificadas. Los datasets pueden unirse utilizando atributos coincidentes, relaciones espaciales, relaciones temporales o cualquier combinación de las tres.

Ejemplos

La herramienta Unir puede utilizarse en situaciones como las siguientes:

  • Unir polígonos de condado con datos censales de condado basándose en valores de campo countyID coincidentes.
  • Unir registros que se producen en un momento y lugar relativos utilizando tanto una relación temporal como una relación espacial.

Parámetros

La siguiente tabla muestra los parámetros utilizados en la herramienta Unir:

ParámetroDescripción

Dataset destino

El dataset al que se unirán los registros.

Dataset de unión

El dataset que se unirá al dataset de destino.

Operación de unión

Especifica si se unirán todos los registros coincidentes (uno a muchos) o si se integrarán todos los registros coincidentes (uno a uno).

Tipo de unión

Especifica si los registros de destino que no tienen un registro de unión coincidente se devuelven en el resultado.

Campos de resumen

Determina los campos de datasets de unión para los que se calcularán estadísticas.

Utilizar campos coincidentes

Especifica si se utilizará una relación de atributos.

Campo de destino

El campo del dataset de destino que se utilizará para hacer coincidir registros en el dataset de unión.

Campo de unión

El campo del dataset de unión que se utilizará para hacer coincidir registros en el dataset de destino.

Usar relación espacial

Especifica si se utilizará una relación espacial.

Relación espacial

Especifica el tipo de relación espacial que se utilizará para definir la condición de unión entre los datasets de destino y de unión.

Distancia cercana

El umbral de distancia lineal que se utilizará para determinar las ubicaciones cercanas entre sí. Este parámetro solo está disponible para las relaciones espaciales de tipo Cercano planar o Cercano geodésico.

Unidad de distancia cercana

La unidad del umbral de distancia lineal. Este parámetro solo está disponible para las relaciones espaciales de tipo Cercano planar o Cercano geodésico.

Geometría de destino

El campo geométrico del dataset de destino que se utilizará para identificar las relaciones espaciales con el dataset de unión.

Geometría de unión

El campo geométrico del dataset de unión que se utilizará para identificar las relaciones espaciales con el dataset de destino.

Utilizar relación temporal

Especifica si se utilizará una relación temporal.

Relación temporal

Especifica el tipo de relación temporal que se utilizará para definir la condición de unión entre los datasets de destino y de unión.

Distancia cercana

El umbral de distancia temporal que se utilizará para determinar los registros cercanos entre sí en el tiempo. Este parámetro solo está disponible para relaciones temporales del tipo Cerca, Cerca de antes o Cerca de después.

Unidad de distancia cercana

La unidad del umbral de distancia temporal. Este parámetro solo está disponible para relaciones temporales del tipo Cerca, Cerca de antes o Cerca de después.

Hora de inicio de destino

El campo datetime del dataset de destino que se utilizará para especificar la hora de inicio de un registro.

Hora de finalización del objetivo

El campo datetime del dataset de destino que se utilizará para especificar la hora de finalización de un registro. Este parámetro es necesario si desea unir utilizando tiempos de tipo intervalo. Consulte Relaciones temporales en Data Pipelines para obtener más detalles.

Hora de inicio de unión

El campo datetime del dataset de unión que se utilizará para especificar la hora de inicio de un registro.

Hora de finalización de unión

El campo datetime del dataset de unión que se utilizará para especificar la hora de finalización de un registro. Este parámetro es necesario si desea unir utilizando tiempos de tipo intervalo. Consulte Relaciones temporales en Data Pipelines para obtener más detalles.

Notas de uso

Utilice el parámetro Dataset de destino para identificar el dataset al que se unirán los registros. Utilice el parámetro Unir dataset para identificar el dataset que contiene los registros que se unirán a los registros de destino.

Si varios registros de unión coinciden con el mismo registro de destino, puede especificar si se unirán todos los registros coincidentes (opción Unir uno a muchos) o si se integrarán todos los registros coincidentes (opción Unir uno a uno), como sigue:

  • Unir uno a muchos: los registros coincidentes del dataset de unión se unirán al dataset de destino. El dataset de salida contendrá varios registros del registro de destino.
  • Unir uno a uno: los registros coincidentes del dataset de unión se resumirán y se unirán a un único registro del dataset de destino. Solo los registros que tengan una coincidencia se incluirán en el resumen y en la salida. Se agregará el recuento de registros unidos. Por defecto, solo los registros de destino que tengan las relaciones especificadas se mantendrán en la clase de registro de salida (unión interna). Si se especifica Unión izquierda, todos los registros de destino de entrada se escribirán en la clase de registro de salida (esto se conoce como unión externa izquierda).
Ejemplos de unión uno a muchos y uno a uno
En este ejemplo, la unión uno a uno solo incluye el recuento.

El parámetro Campos de resumen determina qué campos numéricos o de fecha y hora del dataset de unión se resumirán. Para los campos numéricos, las estadísticas de resumen admitidas incluyen suma, mínimo, máximo, valor medio y desviación estándar. Para los campos de fecha y hora, las estadísticas de resumen admitidas incluyen mínimo y máximo. El parámetro Campos de resumen está disponible si la operación de unión es Unión de uno a muchos.

Puede unir registros basándose en una relación espacial, una relación temporal, una relación de atributos o una combinación de las tres. Una unión espacial hace coincidir registros (filas) de los registros de entrada (los valores de los parámetros Dataset de destino y Dataset de unión) en función de sus ubicaciones espaciales. Una unión temporal hace coincidir registros de los registros de entrada basándose en sus relaciones temporales. Un atributo de unión hace coincidir registros según los valores de campo. La siguiente tabla describe cada tipo de relación de unión:

RelaciónDescripción

Atributo

La relación de atributos que determinará si los registros se unen entre sí. Los registros se cotejan si los valores de campo del dataset de unión son iguales a los valores de campo del dataset de destino. Se recomienda utilizar campos del mismo tipo.

Espacial

La relación espacial que determinará si los registros se van a unir entre sí. Las relaciones disponibles dependen del tipo de geometría (punto, línea o área) de los datasets que se unen. Las relaciones espaciales disponibles son las siguientes:

  • Interseca
  • Es igual a
  • Cercano planar: utiliza distancias planares
  • Cercano geodésico: utiliza distancias geodésicas
  • Contiene
  • Dentro de
  • Toca
  • Cruza
  • Superpone

Temporal

La relación temporal que determinará si los registros se van a unir entre sí. Las relaciones disponibles dependen del tipo de tiempo (instante o intervalo) de los datasets que se unen. Las relaciones temporales disponibles son las siguientes:

  • Cumple
  • Alcanzado por
  • Superpone
  • Superpuesto por
  • Durante
  • Contiene
  • Es igual a
  • Finaliza
  • Finalizado por
  • Se inicia
  • Iniciado por
  • Interseca
  • Cerca
  • Justo antes
  • Justo después

Si las geometrías de destino y de unión están en sistemas de coordenadas diferentes, se utilizará el sistema de coordenadas del dataset de destino para analizar las relaciones espaciales.

Cuando el valor del parámetro Relación espacial es Cercano planar, el valor del parámetro Geometría de destino debe estar en un sistema de coordenadas proyectado.

Salidas

Todos los campos del dataset de destino y del dataset unido se incluirán en los registros de salida cuando se ejecute una unión de uno a muchos. Si existe el mismo nombre de campo en ambos datasets, el campo unido comenzará con la palabra unión incorporada (por ejemplo, join_fieldname).

Además de todos los campos (incluida la geometría) del dataset de destino, los siguientes campos se incluirán en los registros de salida al ejecutar una unión uno a uno:

Nombre de campoDescripción

count

Recuento de registros que se han unido. Se incluye siempre en la salida.

statistic_fieldname

Cada una de las estadísticas especificadas creará un campo de atributo con el siguiente formato: nombre_ampo_estadística. Por ejemplo, el máximo del campo id es MAX_id.

start_datetime

Este campo representa la hora de inicio y solo se incluye cuando se utilizan uniones temporales.

end_datetime

Este campo representa la hora de finalización y solo se incluye cuando se utilizan uniones temporales con valores de tiempo de intervalo.

Requisitos de licencia

Se requieren las siguientes licencias y configuraciones:

  • Tipo de usuario Creator o Professional
  • Rol de publicador, moderador o administrador, o rol personalizado equivalente

Para obtener más información sobre los requisitos de Data Pipelines, consulte Requisitos.

Temas relacionados

Consulte los siguientes temas para obtener información adicional: