Disponible en análisis en tiempo real y de big data.
El botón Unir entidades transfiere atributos de las entidades de un feed, capa o tabla a otras entidades del mismo feed o a las de otro feed o dataset en función de las relaciones espaciales, temporales y de atributos o de alguna combinación de las tres. Opcionalmente, puede calcular estadísticas para las entidades unidas.
Diagrama de flujo de trabajo
Ejemplos
A continuación, se muestran ejemplos de uso de la herramienta Unir entidades:
- Un analista tiene datos sobre incidentes delictivos en una ciudad. Para analizar y estudiar el impacto de estos delitos, es necesario comprender la relación que las ubicaciones de los delitos tienen con las diversas jurisdicciones de la ciudad, por ejemplo, distritos escolares, distritos policiales y vecindarios. Utilizando la herramienta Unir entidades, se puede incorporar más información sobre cada ubicación en cada uno de los delitos, y el impacto sobre las diversas jurisdicciones se puede estudiar y analizar en mayor profundidad.
- Cuando un buque de transporte proveniente de un feed entra en una celda meteorológica adversa proveniente de otro feed, el buque se enriquece con atributos de la entidad de eventos de meteorología adversa.
Notas de uso
Tenga en cuenta lo siguiente al trabajar con la herramienta Unir entidades:
- Puede unir entidades basándose en una relación espacial, una relación temporal, una relación de atributos o una combinación de las tres.
Opción Descripción Relación espacial
Relación espacial que determina si las entidades se van a unir entre sí. Las relaciones disponibles dependen del tipo de geometría (punto, línea o área) de las capas que se unen. Entre las relaciones espaciales disponibles se incluyen las siguientes:
- Interseca
- Intro
- Es igual a
- Salir
- Cerca de planar
- Cerca de geodésico
- Contiene
- Dentro de
- Toca
- Cruza
- Superpone
Nota:
Una entidad de destino debe satisfacer su relación espacial contra todas las entidades de unión cuando se ha especificado una salida y hay más de una entidad de unión. En el caso de cualquier otra relación espacial y en el que haya más de una entidad de unión, una entidad de destino puede satisfacer su relación espacial con cualquier entidad de unión individual.
Relación temporal
Relación temporal que determina si las entidades se van a unir entre sí. Las relaciones disponibles dependen del tipo de tiempo (instante o intervalo) de las capas que se unen. Entre las relaciones temporales disponibles se incluyen las siguientes:
- Cumple
- Alcanzado por
- Superpone
- Superpuesto por
- Durante
- Contiene
- Es igual a
- Finaliza
- Finalizado por
- Se inicia
- Iniciado por
- Interseca
- Cerca
Relación de atributos
La relación de atributo determina si las entidades se van a unir entre sí. Las entidades se cotejan si los valores de campo de la capa de unión son iguales a los valores de campo de la capa de destino.
- Si varias entidades coinciden con la misma entidad de destino, puede determinar si todas las entidades coincidentes se unirán (Unión de uno a muchos) o si todas las entidades coincidentes se resumirán juntas (Unión de uno a uno), como sigue:
- Unión de uno a uno: esta opción resume todas las entidades de unión coincidentes con cada entidad de la capa de destino. Solo las entidades de destino que tienen una coincidencia se incluyen en la salida. El recuento de entidades unidas se agrega junto con otras estadísticas como, por ejemplo, suma, mínimo, máximo, rango, valor medio, varianza y desviación estándar. El resumen de estadísticas solo se puede calcular si se especifica una operación Unión de uno a uno.
- Unión de uno a muchos: esta opción une todas las entidades coincidentes de la capa de unión con la capa de destino. La capa resultante contiene varios registros de la entidad de destino.
Cuando el parámetro Operación de unión está definido como Unir de uno a muchos, puede haber más de una fila en la clase de entidad de salida para cada entidad de destino.
- Al configurar la herramienta Unir entidades en una unión de uno a uno, puede elegir la opción conservar únicamente las entidades que están unidas o conservar todas las entidades independientemente de los resultados de unión.
- Si elige solo se conservan las entidades que están unidas, en la salida están presentes las entidades que pudieron unirse correctamente con una entidad del dataset de unión.
- Si elige conservar todas las entidades independientemente de los resultados de unión, todas las entidades del dataset de destino existen en la salida, independientemente de si había atributos unidos.
- Al conservar todas las entidades, si se conserva una entidad, pero no había unión para esa entidad, el valor COUNT es 0 y cualquier valor de atributo de campo de resumen es nulo.
- Esta opción solo está disponible para uniones de uno a uno.
- Si las entidades de destino y de unión están en sistemas de coordenadas diferentes, se usa el sistema de coordenadas de la entidad de destino.
- Si una entidad de unión tiene una relación espacial con varias entidades de destino, se cuenta tantas veces como coincidencias con la entidad de destino haya. Por ejemplo, si un punto está dentro de tres polígonos, el punto se cuenta tres veces, una vez por cada polígono.
- Cuando la Relación espacial está establecida en Cerca de geodésico o Cerca de planar, la capa de destino de debe proyectar o el sistema de coordenadas de salida se debe establecer en un sistema de coordenadas proyectadas.
- Opcionalmente, cree una expresión para unir entidades. Si especifica una expresión, solo se van a utilizar las entidades que cumplan esta condición. Por ejemplo, puede unir solo entidades de destino del campo Magnitude si son mayores que la entidad de unión con un campo denominado Explosion, utilizando la expresión $target["Magnitude"] > $join["Explosion"].
Más información sobre expresiones de Arcade con Unir entidades
- Si Relación espacial está definida como entrada o salida en un análisis en tiempo real, estas afirmaciones son verdaderas:
- La herramienta funciona con estados, lo que permite comparar las observaciones secuenciales entre sí para detectar un cambio de estado, por ejemplo, si una condición actual es distinta de la de la observación anterior. Con otras relaciones espaciales en análisis en tiempo real, la herramienta no necesita comparar ninguna observación con las anteriores para que se pueda ejecutar sin estado, lo cual consume menos recursos.
- Cuando funciona con estados, la herramienta Unir entidades conserva un almacén de estado de la observación actual para cada Id. de rastreo. Cuando se recibe una nueva observación, se compara con la observación actual del mismo Id. de rastreo, si está presente. Si la nueva observación tiene una marca de tiempo más reciente que la observación actual en el almacén de estado, se sustituye la observación actual. Si tiene una marca de tiempo idéntica a la observación actual para el mismo Id. de rastreo, la herramienta no distingue entre ambas observaciones. Significa que la herramienta no reemplaza la observación actual del almacén de estado por la nueva observación, la nueva observación no se agrega al almacén de estado y las futuras observaciones de este Id. de rastreo se comparan con la observación actual que ha permanecido en el almacén de estado hasta la llegada de una nueva observación con una marca de tiempo posterior. La herramienta registra una advertencia de que esto ocurrió.
- Al activar La primera observación puede desencadenar la entrada o La primera observación puede desencadenar la salida, se indica que la primera entidad de destino recibida satisface la condición del filtro si está dentro de cualquier entidad de unión (en el caso de entrar) o fuera (en el caso de salir), aunque no tenga ninguna entidad de destino anterior con la que comparar la ubicación de la entidad de destino actual. El valor predeterminado es false (no activado).
- El parámetro Ventana de tiempo de destino debe configurarse en el intervalo previsto más largo entre observaciones de un recorrido determinado como mínimo. Las observaciones anteriores a esta duración se eliminan de la memoria para administrar los recursos.
- Se recomienda que configure este valor por exceso, ya que un valor demasiado bajo puede resultar en la eliminación de registros del almacén de entidades antes de que lleguen nuevas observaciones. Esto significa que la información histórica se elimina del almacén de entidades y la entidad siguiente se trata como la observación inicial. En otras palabras, las observaciones nunca entrarían o saldrían de la herramienta Unir herramientas porque el análisis no tendría conocimiento de la observación anterior.
- Cuando se utilizan barreras geográficas dinámicas, se debe definir el parámetro Ventana de tiempo de unión. Si el feed de unión no tiene un campo etiquetado como END_TIME y la última observación conocida de una entidad de unión es más antigua que esta ventana, se elimina de la memoria de la herramienta y no se incluye en el análisis. Si el feed de unión tiene un campo etiquetado como END_TIME, la entidad caduca desde el almacén de barreras geográficas de acuerdo con el valor del campo etiquetado como END_TIME o al cerrar la ventana de tiempo de unión, lo que ocurra primero.
- Las estadísticas se calculan solo para aquellas entidades que cumplen la relación espacial, temporal o de atributos utilizada en la operación de Unión de uno a uno. Puede calcular estadísticas numéricas y de cadena de caracteres.
Parámetros
Tenga en cuenta lo siguiente al trabajar con la herramienta Unir entidades:
Parámetro | Descripción | Tipo de datos |
---|---|---|
Capa de destino | La capa de destino que contiene las entidades que se desea procesar. | Entidades |
Capa de unión | La capa cuyas entidades se unen a las de la capa de destino. | Entidades |
Operación de unión | Especifica si la unión es de uno a uno o de uno a muchos.
| Cadena de caracteres |
Retener todas las entidades | Especifique si solo se conservan las entidades de las uniones correctas o si se conservan todas las entidades independientemente de si se realizó correctamente o no una unión para esas entidades. Esta opción solo está disponible para uniones de uno a uno. Para las uniones de uno a muchos, esta opción no está disponible y solo se devuelven las entidades con uniones correctas. Si se conservan todas las entidades, para las entidades sin ninguna unión, el recuento es cero y cualquier valor de campo de resumen es nulo. | Cadena de caracteres |
Relación espacial | Especifica los criterios que se utilizan para unir entidades espacialmente. Si se activa este parámetro, los criterios espaciales diferentes están disponibles.
| Cadena de caracteres |
Distancia de cercanía espacial | Las entidades de unión que se encuentren dentro de esta distancia especificada respecto de una entidad de destino se consideran para la unión espacial. Una distancia de cercanía espacial solo es válida cuando la relación espacial está definida en Cerca de geodésico o Cerca de planar. | Unidad lineal |
Relación temporal | Especifica los criterios de tiempo que se utilizan para la coincidencia de las entidades. Este parámetro está disponible si Temporal está activado. Se ofrecen diferentes criterios temporales dependiendo de las entidades de tiempo de Instante o Intervalo.
| Cadena de caracteres |
Distancia de cercanía temporal | La cantidad de tiempo entre eventos. Las uniones se producen entre eventos que ocurren dentro de esta ventana de tiempo entre sí. Este parámetro está disponible si Relación temporal está establecida en Cerca. | Unidad de tiempo |
Relación de atributos | Une las entidades en función de los valores de un campo de atributos. Especifique qué campo de atributo de la capa de destino coincide con un campo de atributo de la capa de unión. Este parámetro está disponible si Atributo está activado.
| Cadena de caracteres |
Campos de resumen | Especifica las estadísticas que se calcularán en campos especificados de las entidades de unión. Las estadísticas se calculan para uniones de uno a uno. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.
| Cadena de caracteres |
Condición de unión | Aplica una condición a los campos especificados. Solo se unen las entidades con campos que cumplan estas condiciones. Por ejemplo, puede aplicar una unión a las entidades en las que el atributo HealthSpending de la capa de unión es mayor que el 20 por ciento del atributo Income de la capa de destino. La condición de unión para aplicar esta expresión es: $join["HealthSpending"] > $target["Income"] * .2. | Cadena de caracteres |
La primera observación puede desencadenar la entrada/salida | Especifica si la primera entidad de destino recibida cumple la condición de relación espacial si está dentro de cualquier entidad de unión en el caso de entrar o fuera de todas las entidades de unión en el caso de salir, a pesar de no tener ninguna entidad de destino anterior con la que comparar la ubicación de la entidad de destino actual. El valor predeterminado es false (no activado). | Booleano |
Cambiar la geometría de la entidad de destino a la geometría de la entidad de unión | Cambia la geometría de la entidad de destino a la geometría de la entidad de unión. Por ejemplo, si la entidad de destino es un punto y la entidad de unión con la que se une es un polígono, la entidad de destino asume la geometría de polígono de la entidad de unión. El valor predeterminado es falso. Si la entidad de destino no tiene una geometría, asume la geometría de la entidad de unión con la que está unida. Si la entidad de destino tiene una geometría y la entidad de unión con la que se une no tiene una geometría, la entidad de destino pierde su geometría y se convierte en tabular. Nota:Este parámetro no es válido cuando Retener todas las entidades se establece como true. Las entidades de salida no pueden tener geometrías diferentes. | Booleano |
Ventana de tiempo de destino | Este parámetro debe configurarse en el intervalo previsto más largo entre observaciones de un recorrido determinado como mínimo. Las observaciones anteriores a esta duración se eliminan de la memoria para administrar los recursos. Este parámetro solo es válido cuando Relación espacial se define como entrar o salir. | Cadena de caracteres |
Ventana de tiempo de unión | La ventana de tiempo del feed de unión (barreras geográficas dinámicas). Si la última observación conocida de una entidad de unión es más antigua que la ventana de tiempo especificada, se elimina y no se incluye en el análisis. Si el feed de unión presenta un campo etiquetado como END_TIME, este parámetro es opcional. | Cadena de caracteres |
Consideraciones y limitaciones
Las siguientes son consideraciones y limitaciones que se deben tener en cuenta a la hora de utilizar la herramienta Unir entidades:
- El resumen de estadísticas solo se calcula si se especifica la operación Unión de uno a uno.
- El nombre de campo COUNT representa el número de entidades unidas para una unión de uno a uno. Si el nombre de campo COUNT ya existe en el esquema de destino, el campo se denomina join_COUNT. Si está realizando varias uniones consecutivas, los nombres de campo son COUNT, join_COUNT, join_COUNT1, join_COUNT2, etc., para evitar conflictos con los nombres de campo.