Disponible en análisis en tiempo real y de big data.
La herramienta Unir entidades transfiere atributos de las entidades de un feed, capa o tabla a otras entidades del mismo feed o a las de otro feed o dataset en función de las relaciones espaciales, temporales y de atributos o de alguna combinación de las tres. Opcionalmente, puede calcular estadísticas para las entidades unidas.
Diagrama de flujo de trabajo
Ejemplos
- Un analista tiene datos sobre incidentes delictivos en una ciudad. Para analizar y estudiar el impacto de estos delitos, es necesario comprender la relación que las ubicaciones de los delitos tienen con las diversas jurisdicciones de la ciudad, por ejemplo, distritos escolares, distritos policiales y vecindarios. Utilizando la herramienta Unir entidades, se puede incorporar información adicional sobre cada ubicación en cada uno de los delitos, y el impacto sobre las diversas jurisdicciones se puede estudiar y analizar en mayor profundidad.
- Cuando un buque de transporte proveniente de un feed entra en una celda meteorológica adversa proveniente de otro feed, el buque se enriquece con atributos de la entidad de eventos de meteorología adversa.
Notas de uso
- Puede unir entidades basándose en una relación espacial, una relación temporal, una relación de atributos o una combinación de las tres.Si varias entidades coinciden con la misma entidad de destino, puede determinar si todas las entidades coincidentes se unirán (Unión de uno a muchos) o si todas las entidades coincidentes se resumirán juntas (Unión de uno a uno), como sigue:
Opción Descripción Relación espacial
La relación espacial que determina si las entidades se van a unir entre sí. Las relaciones disponibles dependen del tipo de geometría (punto, línea o área) de las capas que se unen. Entre las relaciones espaciales disponibles se incluyen las siguientes:
- interseca
- entrar
- igual a
- salir
- cerca de planar
- cerca de geodésico
- contiene
- dentro de
- toca
- cruza
- superpone
Nota:
Una entidad de destino debe satisfacer su relación espacial contra todas las entidades de unión cuando se ha especificado una salida y hay más de una entidad de unión. En el caso de cualquier otra relación espacial y en el que haya más de una entidad de unión, una entidad de destino puede satisfacer su relación espacial con cualquier entidad de unión individual.
Relación temporal
La relación temporal que determina si las entidades se van a unir entre sí. Las relaciones disponibles dependen del tipo de tiempo (instante o intervalo) de las capas que se unen. Entre las relaciones temporales disponibles se incluyen las siguientes:
- cumple
- cumplido por
- superpone
- superpuesto por
- durante
- contiene
- igual a
- termina
- terminado por
- inicia
- iniciado por
- interseca
- cerca
Relación de atributos
La relación de atributo que determina si las entidades se van a unir entre sí. Las entidades se cotejan si los valores de campo de la capa de unión son iguales a los valores de campo de la capa de destino.
- Unión de uno a uno: esta opción resume todas las entidades de unión coincidentes con cada entidad de la capa de destino. Solo las entidades de destino que tengan una coincidencia se incluirán en la salida. El recuento de entidades unidas se agregará junto con otras estadísticas como, por ejemplo, suma, mínimo, máximo, rango, valor medio, varianza y desviación estándar. El resumen de estadísticas solo se puede calcular si se especifica una operación Unión de uno a uno.
- Unión de uno a muchos: esta opción une todas las entidades coincidentes de la capa de unión con la capa de destino. La capa resultante contendrá varios registros de la entidad de destino.
Se muestran ejemplos de unión de uno a muchos y de uno a uno. En este ejemplo, en la unión de uno a uno solo se incluye el recuento; las estadísticas adicionales que se pueden calcular se muestran a continuación en la sección Cómo funciona Unir entidades: cálculos. Cuando el parámetro Operación de unión está definido como Unir de uno a muchos, puede haber más de una fila en la clase de entidad de salida para cada entidad de destino.
- Al configurar la herramienta Unir entidades en una unión de uno a uno, puede elegir la opción conservar únicamente las entidades que están unidas o conservar todas las entidades independientemente de los resultados de unión.
- Si elige solo se conservan las entidades que están unidas, solo estarán presentes en la salida las entidades que pudieron unirse correctamente con una entidad del dataset de unión.
- Si elige conservar todas las entidades independientemente de los resultados de unión, todas las entidades del dataset de destino existirán en la salida, independientemente de si había atributos unidos.
- Al conservar todas las entidades, si se conserva una entidad, pero no había unión para esa entidad, el valor COUNT será 0 y cualquier valor de atributo de campo de resumen será nulo.
- Esta opción solo está disponible para uniones de uno a uno.
- Si las entidades de destino y de unión están en sistemas de coordenadas diferentes, se usará el sistema de coordenadas de la entidad de destino.
- Si una entidad de unión tiene una relación espacial con varias entidades de destino, se cuenta tantas veces como coincidencias con la entidad de destino haya. Por ejemplo, si un punto está dentro de tres polígonos, el punto se cuenta tres veces, una vez por cada polígono.
- Cuando la Relación espacial está establecida en Cerca de geodésico o Cerca de planar, la capa de destino de debe proyectar o el sistema de coordenadas de salida se debe establecer en un sistema de coordenadas proyectadas.
- Opcionalmente, cree una expresión para unir entidades. Si especifica una expresión, solo se van a utilizar las entidades que cumplan esta condición. Por ejemplo, puede unir solo entidades de destino del campo Magnitude si son mayores que la entidad de unión con un campo denominado Explosion, utilizando la expresión $target["Magnitude"] > $join["Explosion"]. Más información sobre expresiones de Arcade con Unir entidades.
- Si Relación espacial está definida como entrada o salida en un análisis en tiempo real, estas afirmaciones son verdaderas:
- La herramienta funcionará con estados, lo que permite comparar las observaciones secuenciales entre sí para detectar un cambio de estado, por ejemplo, si una condición actual es distinta de la de la observación anterior. Con otras relaciones espaciales en análisis en tiempo real, la herramienta no necesita comparar ninguna observación con las anteriores para que se pueda ejecutar sin estado, lo cual consume menos recursos.
- Cuando funciona con estados, Unir entidades conserva un almacén de estado de la observación actual para cada Id. de rastreo. Cuando se recibe una nueva observación, se compara con la observación actual del mismo Id. de rastreo, si está presente. Si la nueva observación tiene una marca de tiempo más reciente que la observación actual en el almacén de estado, se sustituirá la observación actual. Si tiene una marca de tiempo idéntica a la observación actual para el mismo Id. de rastreo, la herramienta no distingue entre ambas observaciones. Significa que la herramienta no reemplazará la observación actual del almacén de estado por la nueva observación, la nueva observación no se agregará al almacén de estado y las futuras observaciones de este Id. de rastreo se compararán con la observación actual que permanezca en el almacén de estado hasta que llegue una nueva observación con una marca de tiempo posterior. La herramienta registrará una advertencia de que esto ocurrió.
- Al activar La primera observación puede desencadenar la entrada o La primera observación puede desencadenar la salida, se indica que la primera entidad de destino recibida satisface la condición del filtro si está dentro de cualquier entidad de unión (en el caso de entrar) o fuera (en el caso de salir), aunque no tenga ninguna entidad de destino anterior con la que comparar la ubicación de la entidad de destino actual. El valor predeterminado es false (no activado).
- El parámetro Ventana de tiempo de destino de un análisis en tiempo real debe ser siempre al menos tan largo como el intervalo más largo esperado entre observaciones de cualquier recorrido determinado. Las observaciones anteriores a esta duración se eliminarán de la memoria para administrar los recursos.
- Si un feed está conectado al puerto de unión, los cálculos de distancia se realizarán dinámicamente en función de las entidades cambiantes de los feeds de unión y de destino.
- Cuando se utilizan barreras geográficas dinámicas, se debe definir el parámetro Ventana de tiempo de unión. Si el feed de unión no tiene un campo etiquetado como END_TIME y la última observación conocida de una entidad de unión es más antigua que esta ventana, se eliminará de la memoria de la herramienta y no se incluirá en el análisis. Si el feed de unión tiene un campo etiquetado como END_TIME, la entidad se descarta por antigüedad del almacén de barreras geográficas de acuerdo con el valor del campo etiquetado como END_TIME o al cerrar la ventana de tiempo de unión, lo que ocurra primero.
- Las estadísticas se calculan solo para aquellas entidades que cumplen la relación espacial, temporal o de atributos utilizada en la operación de Unión de uno a uno. Puede calcular estadísticas numéricas y de cadena de caracteres.
Parámetros
Parámetro | Descripción | Tipo de datos |
---|---|---|
Capa de destino | La capa de destino que contiene las entidades que se desea procesar. | Entidades |
Capa de unión | La capa cuyas entidades se unirán a las de la capa de destino. | Entidades |
Operación de unión | Especifica si la unión debe ser de uno a uno o de uno a muchos.
| Cadena de caracteres |
Retener todas las entidades | Especifique si solo se conservarán las entidades de las uniones correctas o si se conservarán todas las entidades independientemente de si se realizó correctamente o no una unión para esas entidades. Esta opción solo está disponible para uniones de uno a uno. Para las uniones de uno a muchos, esta opción no está disponible y solo se devuelven las entidades con uniones correctas. Si se conservan todas las entidades, para las entidades en las que no había ninguna unión, el recuento será 0 y cualquier valor de campo de resumen será nulo. | Cadena de caracteres |
Relación espacial | Especifica los criterios que se utilizan para unir entidades espacialmente. Este parámetro está disponible si Espacial está activado. | Cadena de caracteres |
Distancia de cercanía espacial | Las entidades de unión que se encuentren dentro de esta distancia especificada respecto de una entidad de destino se consideran para la unión espacial. Una distancia de cercanía espacial solo es válida cuando la relación espacial está definida en Cerca de geodésico o Cerca de planar. | Unidad lineal |
Relación temporal | Especifica los criterios de tiempo que se utilizan para la coincidencia de las entidades. Este parámetro está disponible si Temporal está activado. Se ofrecen diferentes criterios temporales dependiendo de las entidades de tiempo de Instante o Intervalo.
| Cadena de caracteres |
Distancia de cercanía temporal | La cantidad de tiempo entre eventos. Las uniones se producirán entre eventos que ocurren dentro de esta ventana de tiempo entre sí. Este parámetro está disponible si Relación temporal está establecida en Cerca. | Unidad de tiempo |
Relación de atributos | Une las entidades en función de los valores de un campo de atributos. Especifique qué campo de atributo de la capa de destino coincide con un campo de atributo de la capa de unión. Este parámetro está disponible si Atributo está activado.
| Cadena de caracteres |
Campos de resumen | Especifica las estadísticas que se calcularán en campos especificados de las entidades de unión. Las estadísticas se calculan para uniones de uno a uno. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.
| Cadena de caracteres |
Condición de unión | Aplica una condición a los campos especificados. Solo se unirán las entidades con campos que cumplan estas condiciones. Por ejemplo, puede aplicar una unión a las entidades en las que el HealthSpendingatributo de la capa de unión es mayor que el 20 por ciento del atributo Income de la capa de destino. La condición de unión para aplicar esta expresión es: $join["HealthSpending"] > $target["Income"] * .2. | Cadena de caracteres |
La primera observación puede desencadenar la entrada/salida | Especifica si la primera entidad de destino recibida cumple la condición de relación espacial si está dentro de cualquier entidad de unión en el caso de entrar o fuera de todas las entidades de unión en el caso de salir, a pesar de no tener ninguna entidad de destino anterior con la que comparar la ubicación de la entidad de destino actual. El valor predeterminado es false (no activado). | Booleano |
Cambiar la geometría de la entidad de destino a la geometría de la entidad de unión | Cambia la geometría de la entidad de destino a la geometría de la entidad de unión. Por ejemplo, si la entidad de destino es un punto y la entidad de unión con la que se une es un polígono, la entidad de destino asumirá la geometría de polígono de la entidad de unión. El valor predeterminado es falso. Si la entidad de destino no tiene una geometría, asumirá la geometría de la entidad de unión con la que está unida. Si la entidad de destino tiene una geometría y la entidad de unión con la que se une no tiene una geometría, la entidad de destino perderá su geometría y se convertirá en tabular. Nota:Este parámetro no es válido cuando Retener todas las entidades se establece como true. Las entidades de salida no pueden tener geometrías diferentes. | Booleano |
Ventana de tiempo de destino | Especifique un valor como mínimo siempre y cuando el intervalo establecido más largo entre las observaciones de un recorrido determinado. Las observaciones anteriores a esta duración se eliminarán de la memoria para administrar los recursos. Este parámetro solo es válido cuando Relación espacial se define como entrar o salir. | Cadena de caracteres |
Ventana de tiempo de unión | La ventana de tiempo del feed de unión (barreras geográficas dinámicas). Si la última observación conocida de una entidad de unión es más antigua que la ventana de tiempo especificada, se elimina y no se incluye en el análisis. Si el feed de unión presenta un campo etiquetado como END_TIME, este parámetro es opcional. | Cadena de caracteres |
Consideraciones y limitaciones
- Las estadísticas de resumen solo se calculan si se especifica la operación de Unión de uno a uno.
- El nombre de campo COUNT se utilizará para representar el número de entidades unidas para una unión de uno a uno. Si el nombre de campo COUNT ya existe en el esquema de destino, el campo se denomina join_COUNT. Si está realizando varias uniones consecutivas, los nombres de campo serán COUNT, join_COUNT, join_COUNT1, join_COUNT2, etc., para evitar conflictos con los nombres de campo.