La herramienta Unir une datasets basándose en las relaciones especificadas. Los datasets pueden unirse utilizando atributos coincidentes, relaciones espaciales, relaciones temporales o cualquier combinación de las tres.
Ejemplos
La herramienta Unir puede utilizarse en situaciones como las siguientes:
- Unir polígonos de condado con datos censales de condado basándose en valores de campo countyID coincidentes.
- Unir registros que se producen en un momento y lugar relativos utilizando tanto una relación temporal como una relación espacial.
Parámetros
La siguiente tabla muestra los parámetros utilizados en la herramienta Unir:
Parámetro | Descripción |
---|---|
Dataset destino | El dataset al que se unirán los registros. |
Dataset de unión | El dataset que se unirá al dataset de destino. |
Operación de unión | Especifica si se unirán todos los registros coincidentes (uno a muchos) o si se integrarán todos los registros coincidentes (uno a uno). |
Tipo de unión | Especifica si los registros de destino que no tienen un registro de unión coincidente se devuelven en el resultado. |
Campos de resumen | Determina los campos de datasets de unión para los que se calcularán estadísticas. |
Utilizar campos coincidentes | Especifica si se utilizará una relación de atributos. |
Campo de destino | El campo del dataset de destino que se utilizará para hacer coincidir registros en el dataset de unión. |
Campo de unión | El campo del dataset de unión que se utilizará para hacer coincidir registros en el dataset de destino. |
Usar relación espacial | Especifica si se utilizará una relación espacial. |
Relación espacial | Especifica el tipo de relación espacial que se utilizará para definir la condición de unión entre los datasets de destino y de unión. |
Distancia cercana | El umbral de distancia lineal que se utilizará para determinar las ubicaciones cercanas entre sí. Este parámetro solo está disponible para las relaciones espaciales de tipo Cercano planar o Cercano geodésico. |
Unidad de distancia cercana | La unidad del umbral de distancia lineal. Este parámetro solo está disponible para las relaciones espaciales de tipo Cercano planar o Cercano geodésico. |
Geometría de destino | El campo geométrico del dataset de destino que se utilizará para identificar las relaciones espaciales con el dataset de unión. |
Geometría de unión | El campo geométrico del dataset de unión que se utilizará para identificar las relaciones espaciales con el dataset de destino. |
Utilizar relación temporal | Especifica si se utilizará una relación temporal. |
Relación temporal | Especifica el tipo de relación temporal que se utilizará para definir la condición de unión entre los datasets de destino y de unión. |
Distancia cercana | El umbral de distancia temporal que se utilizará para determinar los registros cercanos entre sí en el tiempo. Este parámetro solo está disponible para relaciones temporales del tipo Cerca, Cerca de antes o Cerca de después. |
Unidad de distancia cercana | La unidad del umbral de distancia temporal. Este parámetro solo está disponible para relaciones temporales del tipo Cerca, Cerca de antes o Cerca de después. |
Hora de inicio de destino | El campo datetime del dataset de destino que se utilizará para especificar la hora de inicio de un registro. |
Hora de finalización del objetivo | El campo datetime del dataset de destino que se utilizará para especificar la hora de finalización de un registro. Este parámetro es necesario si desea unir utilizando tiempos de tipo intervalo. Consulte Relaciones temporales en Data Pipelines para obtener más detalles. |
Hora de inicio de unión | El campo datetime del dataset de unión que se utilizará para especificar la hora de inicio de un registro. |
Hora de finalización de unión | El campo datetime del dataset de unión que se utilizará para especificar la hora de finalización de un registro. Este parámetro es necesario si desea unir utilizando tiempos de tipo intervalo. Consulte Relaciones temporales en Data Pipelines para obtener más detalles. |
Notas de uso
Utilice el parámetro Dataset de destino para identificar el dataset al que se unirán los registros. Utilice el parámetro Unir dataset para identificar el dataset que contiene los registros que se unirán a los registros de destino.
Si varios registros de unión coinciden con el mismo registro de destino, puede especificar si se unirán todos los registros coincidentes (opción Unir uno a muchos) o si se integrarán todos los registros coincidentes (opción Unir uno a uno), como sigue:
- Unir uno a muchos: los registros coincidentes del dataset de unión se unirán al dataset de destino. El dataset de salida contendrá varios registros del registro de destino.
- Unir uno a uno: los registros coincidentes del dataset de unión se resumirán y se unirán a un único registro del dataset de destino. Solo los registros que tengan una coincidencia se incluirán en el resumen y en la salida. Se agregará el recuento de registros unidos. Por defecto, solo los registros de destino que tengan las relaciones especificadas se mantendrán en la clase de registro de salida (unión interna). Si se especifica Unión izquierda, todos los registros de destino de entrada se escribirán en la clase de registro de salida (esto se conoce como unión externa izquierda).
El parámetro Campos de resumen determina qué campos del dataset de unión se resumirán. El parámetro Campos de resumen está disponible si la operación de unión es Unión de uno a muchos. Están disponibles las siguientes estadísticas de resumen:
- Suma: la suma de valores numéricos en un campo. La suma de [null, 1, 3] es 4.
- Min: valor mínimo de un campo numérico o de fecha. El mínimo de [0, 2, null] es 0.
- Máx: valor máximo de un campo numérico o de fecha. El máximo de [0, 2, null] es 2.
- Valor medio: el valor medio de los valores numéricos. La media de [0, 2, null] es 1.
- Desviación estándar: desviación estándar de un campo numérico. La desviación estándar de [null, 1, 1, 1] es 0.
- Recuento: número de valores no nulos. Se puede utilizar en un campo de cualquier tipo. El recuento de [null, "hello", "world"] es 2.
- Cualquiera: valor de muestra de un campo de cualquier tipo.
Puede unir registros basándose en una relación espacial, una relación temporal, una relación de atributos o una combinación de las tres. Una unión espacial hace coincidir registros (filas) de los registros de entrada (los valores de los parámetros Dataset de destino y Dataset de unión) en función de sus ubicaciones espaciales. Una unión temporal hace coincidir registros de los registros de entrada basándose en sus relaciones temporales. Un atributo de unión hace coincidir registros según los valores de campo. La siguiente tabla describe cada tipo de relación de unión:
Relación | Descripción |
---|---|
Atributo | La relación de atributos que determinará si los registros se unen entre sí. Los registros se cotejan si los valores de campo del dataset de unión son iguales a los valores de campo del dataset de destino. Se recomienda utilizar campos del mismo tipo. |
Espacial | La relación espacial que determinará si los registros se van a unir entre sí. Las relaciones disponibles dependen del tipo de geometría (punto, línea o área) de los datasets que se unen. Las relaciones espaciales disponibles son las siguientes:
|
Temporal | La relación temporal que determinará si los registros se van a unir entre sí. Las relaciones disponibles dependen del tipo de tiempo (instante o intervalo) de los datasets que se unen. Las relaciones temporales disponibles son las siguientes:
|
Si las geometrías de destino y de unión están en sistemas de coordenadas diferentes, se utilizará el sistema de coordenadas del dataset de destino para analizar las relaciones espaciales.
Cuando el valor del parámetro Relación espacial es Cercano planar, el valor del parámetro Geometría de destino debe estar en un sistema de coordenadas proyectado.
Salidas
Cuando se ejecute una unión de uno a muchos, todos los campos del dataset de destino y del dataset unido se incluirán en la salida. Si existe el mismo nombre de campo en ambos datasets, el campo unido comenzará con la palabra unión incorporada (por ejemplo, join_fieldname).
Cuando se ejecute una unión de uno a uno, además de todos los campos (incluida la geometría) del dataset de destino, se incluirán los siguientes campos en la salida:
Nombre de campo | Descripción |
---|---|
COUNT | Recuento de registros que se han unido. Se incluye siempre en la salida. |
STATISTIC_fieldname | Cada una de las estadísticas especificadas creará un campo de atributo con el siguiente formato: STATISTIC_fieldname. Por ejemplo, el máximo del campo id es MAX_id. |
START_DATETIME | Este campo representa la hora de inicio y solo se incluye cuando se utilizan uniones temporales. |
END_DATETIME | Este campo representa la hora de finalización y solo se incluye cuando se utilizan uniones temporales con valores de tiempo de intervalo. |
Requisitos de licencia
Se requieren las siguientes licencias y configuraciones:
- Tipo de usuario Creator o Professional
- Rol de publicador, moderador o administrador, o rol personalizado equivalente
Para obtener más información sobre los requisitos de Data Pipelines, consulte Requisitos.
Temas relacionados
Consulte los siguientes temas para obtener información adicional: