Unir entidades

Icono de la herramienta Disponible en análisis en tiempo real y de big data.

La herramienta Unir entidades herramienta Unir entidades transfiere atributos de las entidades de un feed, capa o tabla a otras entidades del mismo feed o a las de otro feed o dataset en función de las relaciones espaciales, temporales y de atributos o de alguna combinación de las tres. Opcionalmente, puede calcular estadísticas para las entidades unidas.

Diagrama de flujo de trabajo

Diagrama del flujo de trabajo de Unir entidades

Ejemplos

  • Un analista tiene datos sobre incidentes delictivos en una ciudad. Para analizar y estudiar el impacto de estos delitos, es necesario comprender la relación que las ubicaciones de los delitos tienen con las diversas jurisdicciones de la ciudad, por ejemplo, distritos escolares, distritos policiales y vecindarios. Utilizando la herramienta Unir entidades, se puede incorporar información adicional sobre cada ubicación en cada uno de los delitos, y el impacto sobre las diversas jurisdicciones se puede estudiar y analizar en mayor profundidad.
  • Cuando un buque de transporte proveniente de un feed entra en una celda meteorológica adversa proveniente de otro feed, el buque se enriquece con atributos de la entidad de eventos de meteorología adversa.

Notas de uso

  • Puede unir entidades basándose en una relación espacial, una relación temporal, una relación de atributos o una combinación de las tres.

    OpciónDescripción
    Relación espacial

    Relación espacial

    La relación espacial que determina si las entidades se van a unir entre sí. Las relaciones disponibles dependen del tipo de geometría (punto, línea o área) de las capas que se unen. Entre las relaciones espaciales disponibles se incluyen las siguientes:

    • interseca
    • entrar
    • igual a
    • salir
    • cerca de planar
    • cerca de geodésico
    • contiene
    • dentro de
    • toca
    • cruza
    • superpone
    Nota:

    Una entidad de destino debe satisfacer su relación espacial contra todas las entidades de unión cuando se ha especificado una salida y hay más de una entidad de unión. En el caso de cualquier otra relación espacial y en el que haya más de una entidad de unión, una entidad de destino puede satisfacer su relación espacial con cualquier entidad de unión individual.

    Relación temporal

    Relación temporal

    La relación temporal que determina si las entidades se van a unir entre sí. Las relaciones disponibles dependen del tipo de tiempo (instante o intervalo) de las capas que se unen. Entre las relaciones temporales disponibles se incluyen las siguientes:

    • cumple
    • cumplido por
    • superpone
    • superpuesto por
    • durante
    • contiene
    • igual a
    • termina
    • terminado por
    • inicia
    • iniciado por
    • interseca
    • cerca
    Relación de atributos

    Relación de atributos

    La relación de atributo que determina si las entidades se van a unir entre sí. Las entidades se cotejan si los valores de campo de la capa de unión son iguales a los valores de campo de la capa de destino.

    Si varias entidades coinciden con la misma entidad de destino, puede determinar si todas las entidades coincidentes se unirán (Unión de uno a muchos) o si todas las entidades coincidentes se resumirán juntas (Unión de uno a uno), como sigue:
    • Unión de uno a uno: esta opción resume todas las entidades de unión coincidentes con cada entidad de la capa de destino. Solo las entidades de destino que tengan una coincidencia se incluirán en la salida. El recuento de entidades unidas se agregará junto con otras estadísticas como, por ejemplo, suma, mínimo, máximo, rango, valor medio, varianza y desviación estándar. El resumen de estadísticas solo se puede calcular si se especifica una operación Unión de uno a uno.
    • Unión de uno a muchos: esta opción une todas las entidades coincidentes de la capa de unión con la capa de destino. La capa resultante contendrá varios registros de la entidad de destino.

      Unir entidades de uno a uno y de uno a muchos

      Se muestran ejemplos de unión de uno a muchos y de uno a uno. En este ejemplo, en la unión de uno a uno solo se incluye el recuento; las estadísticas adicionales que se pueden calcular se muestran a continuación en la sección Cómo funciona Unir entidades: cálculos.

      Cuando el parámetro Operación de unión está definido como Unir de uno a muchos, puede haber más de una fila en la clase de entidad de salida para cada entidad de destino.

  • Al configurar la herramienta Unir entidades en una unión de uno a uno, puede elegir la opción conservar únicamente las entidades que están unidas o conservar todas las entidades independientemente de los resultados de unión.
    • Si elige solo se conservan las entidades que están unidas, solo estarán presentes en la salida las entidades que pudieron unirse correctamente con una entidad del dataset de unión.
    • Si elige conservar todas las entidades independientemente de los resultados de unión, todas las entidades del dataset de destino existirán en la salida, independientemente de si había atributos unidos.
    • Al conservar todas las entidades, si se conserva una entidad, pero no había unión para esa entidad, el valor COUNT será 0 y cualquier valor de atributo de campo de resumen será nulo.
    • Esta opción solo está disponible para uniones de uno a uno.
  • Si las entidades de destino y de unión están en sistemas de coordenadas diferentes, se usará el sistema de coordenadas de la entidad de destino.
  • Si una entidad de unión tiene una relación espacial con varias entidades de destino, se cuenta tantas veces como coincidencias con la entidad de destino haya. Por ejemplo, si un punto está dentro de tres polígonos, el punto se cuenta tres veces, una vez por cada polígono.
  • Cuando la Relación espacial está establecida en Cerca de geodésico o Cerca de planar, la capa de destino de debe proyectar o el sistema de coordenadas de salida se debe establecer en un sistema de coordenadas proyectadas.
  • Opcionalmente, cree una expresión para unir entidades. Si especifica una expresión, solo se van a utilizar las entidades que cumplan esta condición. Por ejemplo, puede unir solo entidades de destino del campo Magnitude si son mayores que la entidad de unión con un campo denominado Explosion, utilizando la expresión $target["Magnitude"] > $join["Explosion"]. Más información sobre expresiones de Arcade con Unir entidades.
  • Si Relación espacial está definida como entrada o salida en un análisis en tiempo real, estas afirmaciones son verdaderas:
    • La herramienta funcionará con estados, lo que permite comparar las observaciones secuenciales entre sí para detectar un cambio de estado, por ejemplo, si una condición actual es distinta de la de la observación anterior. Con otras relaciones espaciales en análisis en tiempo real, la herramienta no necesita comparar ninguna observación con las anteriores para que se pueda ejecutar sin estado, lo cual consume menos recursos.
    • Cuando funciona con estados, Unir entidades conserva un almacén de estado de la observación actual para cada Id. de rastreo. Cuando se recibe una nueva observación, se compara con la observación actual del mismo Id. de rastreo, si está presente. Si la nueva observación tiene una marca de tiempo más reciente que la observación actual en el almacén de estado, se sustituirá la observación actual. Si tiene una marca de tiempo idéntica a la observación actual para el mismo Id. de rastreo, la herramienta no distingue entre ambas observaciones. Significa que la herramienta no reemplazará la observación actual del almacén de estado por la nueva observación, la nueva observación no se agregará al almacén de estado y las futuras observaciones de este Id. de rastreo se compararán con la observación actual que permanezca en el almacén de estado hasta que llegue una nueva observación con una marca de tiempo posterior. La herramienta registrará una advertencia de que esto ocurrió.
    • Al activar La primera observación puede desencadenar la entrada o La primera observación puede desencadenar la salida, se indica que la primera entidad de destino recibida satisface la condición del filtro si está dentro de cualquier entidad de unión (en el caso de entrar) o fuera (en el caso de salir), aunque no tenga ninguna entidad de destino anterior con la que comparar la ubicación de la entidad de destino actual. El valor predeterminado es false (no activado).
    • El parámetro Ventana de tiempo de destino de un análisis en tiempo real debe ser siempre al menos tan largo como el intervalo más largo esperado entre observaciones de cualquier recorrido determinado. Las observaciones anteriores a esta duración se eliminarán de la memoria para administrar los recursos.
  • Si un feed está conectado al puerto de unión, los cálculos de distancia se realizarán dinámicamente en función de las entidades cambiantes de los feeds de unión y de destino.
  • Cuando se utilizan barreras geográficas dinámicas, se debe definir el parámetro Ventana de tiempo de unión. Si el feed de unión no tiene un campo etiquetado como END_TIME y la última observación conocida de una entidad de unión es más antigua que esta ventana, se eliminará de la memoria de la herramienta y no se incluirá en el análisis. Si el feed de unión tiene un campo etiquetado como END_TIME, la entidad se descarta por antigüedad del almacén de barreras geográficas de acuerdo con el valor del campo etiquetado como END_TIME o al cerrar la ventana de tiempo de unión, lo que ocurra primero.
  • Las estadísticas se calculan solo para aquellas entidades que cumplen la relación espacial, temporal o de atributos utilizada en la operación de Unión de uno a uno. Puede calcular estadísticas numéricas y de cadena de caracteres.

Parámetros

ParámetroDescripciónTipo de datos

Capa de destino

La capa de destino que contiene las entidades que se desea procesar.

Entidades

Capa de unión

La capa cuyas entidades se unirán a las de la capa de destino.

Entidades

Operación de unión

Especifica si la unión debe ser de uno a uno o de uno a muchos.

  • Unir uno a uno: las uniones siempre devuelven el mismo número de resultados que las entidades de destino o menos, si hay entidades de destino que no coinciden con ninguna entidad de unión. Los atributos de las entidades de unión se resumen como se especifica en el parámetro Campos de resumen.
  • Unir uno a muchos: las uniones devuelven un registro de cada coincidencia entre entidades de destino y de unión. No se resumen los atributos de las entidades de unión.

Cadena de caracteres

Retener todas las entidades

Especifique si solo se conservarán las entidades de las uniones correctas o si se conservarán todas las entidades independientemente de si se realizó correctamente o no una unión para esas entidades. Esta opción solo está disponible para uniones de uno a uno.

Para las uniones de uno a muchos, esta opción no está disponible y solo se devuelven las entidades con uniones correctas.

Si se conservan todas las entidades, para las entidades en las que no había ninguna unión, el recuento será 0 y cualquier valor de campo de resumen será nulo.

Cadena de caracteres

Relación espacial

Especifica los criterios que se utilizan para unir entidades espacialmente. Este parámetro está disponible si Espacial está activado.

Cadena de caracteres

Distancia de cercanía espacial

Las entidades de unión que se encuentren dentro de esta distancia especificada respecto de una entidad de destino se consideran para la unión espacial. Una distancia de cercanía espacial solo es válida cuando la relación espacial está definida en Cerca de geodésico o Cerca de planar.

Unidad lineal

Relación temporal

Especifica los criterios de tiempo que se utilizan para la coincidencia de las entidades. Este parámetro está disponible si Temporal está activado. Se ofrecen diferentes criterios temporales dependiendo de las entidades de tiempo de Instante o Intervalo.

  • cumple: cuando el final de un intervalo de tiempo de destino es igual al inicio de un intervalo de tiempo de unión, el tiempo de destino alcanza el tiempo de unión.
  • cumplido por: cuando el inicio de un intervalo de tiempo de destino es igual que el final del intervalo de tiempo de unión, el tiempo de unión alcanza el tiempo de destino.
  • superpone: cuando el intervalo de tiempo de destino comienza y finaliza antes del inicio y fin del intervalo de tiempo de unión, el tiempo de destino se superpone con el tiempo de unión.
  • superpuesto por: cuando el intervalo de tiempo de destino comienza y finaliza después de la hora de inicio y fin del intervalo de tiempo de unión, el tiempo de destino se ve superpuesto por el tiempo de unión.
  • durante: Cuando el tiempo de destino ocurre entre el inicio y el fin del intervalo de tiempo de unión, el tiempo de destino se da durante el tiempo de unión.
  • contiene: cuando un tiempo de entidad de unión ocurre entre el inicio y el fin del intervalo de tiempo de destino, el tiempo de destino contiene el tiempo de unión.
  • igual a: dos tiempos se consideran igual si sus instantes o intervalos son idénticos.
  • termina: cuando un tiempo de destino termina a la vez que un tiempo de unión, y el tiempo de destino comenzó después del tiempo de unión, el tiempo de destino termina el tiempo de unión.
  • terminado por: cuando un tiempo de entidad de unión termina en el mismo momento que un tiempo de destino y el tiempo de unión comienza después del tiempo de destino, el tiempo de destino lo termina el tiempo de unión.
  • inicia: cuando un tiempo de destino comienza a la vez que el inicio del intervalo de tiempo de unión y termina antes del fin del intervalo de tiempo de unión, el tiempo de destino inicia el tiempo de unión.
  • iniciado por: cuando el tiempo de un intervalo de destino comienza a la vez que el tiempo de unión y termina después del tiempo de unión, el tiempo de unión inicia el tiempo de destino.
  • interseca: si alguna parte de un tiempo de destino se produce a la vez que el tiempo de unión, el tiempo de destino se interseca con el tiempo de unión.
  • cerca: cuando un tiempo de destino está dentro de un rango de tiempo especificado con respecto al tiempo de unión, el tiempo de destino estará cerca del tiempo de unión.
  • justo antes: cuando un tiempo de destino es anterior al tiempo de unión, pero dentro de un rango de tiempo especificado con respecto al tiempo de unión, el tiempo de destino está justo antes que el tiempo de unión.
  • justo después: cuando un tiempo de destino es posterior al tiempo de unión, pero dentro de un rango especificado con respecto al tiempo de unión, el tiempo de destino está justo después que el tiempo de unión.

Cadena de caracteres

Distancia de cercanía temporal

La cantidad de tiempo entre eventos. Las uniones se producirán entre eventos que ocurren dentro de esta ventana de tiempo entre sí. Este parámetro está disponible si Relación temporal está establecida en Cerca.

Unidad de tiempo

Relación de atributos

Une las entidades en función de los valores de un campo de atributos. Especifique qué campo de atributo de la capa de destino coincide con un campo de atributo de la capa de unión. Este parámetro está disponible si Atributo está activado.

  • Campo de destino: un campo de atributo de la capa de destino que contiene los valores que se deben hacer coincidir.
  • Campo de unión: un campo de atributo de la capa de unión que contiene los valores que se deben hacer coincidir.

Cadena de caracteres

Campos de resumen

Especifica las estadísticas que se calcularán en campos especificados de las entidades de unión. Las estadísticas se calculan para uniones de uno a uno. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.

  • Cualquiera: una cadena de caracteres de un campo de tipo cadena de caracteres.
  • Recuento: calcula el número de valores no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El recuento de [nulo, 0, 2] es 2.
  • Recuento de valores diferenciados: calcula el número de valores distintos y no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El resultado de Count distinct de [nulo, 4, 3, 4] es 2.
  • Suma: la suma de valores numéricos en un campo. La suma de [nulo, 1, 3] es 4.
  • Suma cuadrática: la suma, sobre todas las observaciones, de las diferencias al cuadrado de cada observación respecto del valor medio general. La suma de cuadrados de [nulo, 2,2, 3,1, 4,7] es 3,206.
  • Mín: el valor mínimo de un campo numérico. El mínimo de [0, 2, nulo] es 0.
  • Máx: el valor máximo de un campo numérico. El máximo de [0, 2, nulo] es 2.
  • Valor medio: el valor medio de los valores numéricos. El valor medio de [0,2, nulo] es 1.
  • Rango: el rango de un campo numérico. Se calcula como el valor mínimo restado del valor máximo. El rango de [0, nulo, 1] es 1. El rango de [nulo, 4] es 0.
  • Varianza: la varianza de un campo numérico en un recorrido. La varianza de [1] es nulo. La varianza de [nulo, 1,1,1] es 1.
  • Desviación estándar: la desviación estándar de un campo numérico. La desviación estándar de [1] es nulo. La desviación estándar de [nulo, 1,1,1] es 1.

Cadena de caracteres

Condición de unión

Aplica una condición a los campos especificados. Solo se unirán las entidades con campos que cumplan estas condiciones.

Por ejemplo, puede aplicar una unión a las entidades en las que el HealthSpendingatributo de la capa de unión es mayor que el 20 por ciento del atributo Income de la capa de destino. La condición de unión para aplicar esta expresión es: $join["HealthSpending"] > $target["Income"] * .2.

Cadena de caracteres

La primera observación puede desencadenar la entrada/salida

Especifica si la primera entidad de destino recibida cumple la condición de relación espacial si está dentro de cualquier entidad de unión en el caso de entrar o fuera de todas las entidades de unión en el caso de salir, a pesar de no tener ninguna entidad de destino anterior con la que comparar la ubicación de la entidad de destino actual. El valor predeterminado es false (no activado).

Booleano

Cambiar la geometría de la entidad de destino a la geometría de la entidad de unión

Cambia la geometría de la entidad de destino a la geometría de la entidad de unión. Por ejemplo, si la entidad de destino es un punto y la entidad de unión con la que se une es un polígono, la entidad de destino asumirá la geometría de polígono de la entidad de unión. El valor predeterminado es falso.

Si la entidad de destino no tiene una geometría, asumirá la geometría de la entidad de unión con la que está unida.

Si la entidad de destino tiene una geometría y la entidad de unión con la que se une no tiene una geometría, la entidad de destino perderá su geometría y se convertirá en tabular.

Nota:

Este parámetro no es válido cuando Retener todas las entidades se establece como true. Las entidades de salida no pueden tener geometrías diferentes.

Booleano

Ventana de tiempo de destino

Especifique un valor como mínimo siempre y cuando el intervalo establecido más largo entre las observaciones de un recorrido determinado. Las observaciones anteriores a esta duración se eliminarán de la memoria para administrar los recursos.

Este parámetro solo es válido cuando Relación espacial se define como entrar o salir.

Cadena de caracteres

Ventana de tiempo de unión

La ventana de tiempo del feed de unión (barreras geográficas dinámicas). Si la última observación conocida de una entidad de unión es más antigua que la ventana de tiempo especificada, se elimina y no se incluye en el análisis. Si el feed de unión presenta un campo etiquetado como END_TIME, este parámetro es opcional.

Cadena de caracteres

Consideraciones y limitaciones

  • Las estadísticas de resumen solo se calculan si se especifica la operación de Unión de uno a uno.
  • El nombre de campo COUNT se utilizará para representar el número de entidades unidas para una unión de uno a uno. Si el nombre de campo COUNT ya existe en el esquema de destino, el campo se denomina join_COUNT. Si está realizando varias uniones consecutivas, los nombres de campo serán COUNT, join_COUNT, join_COUNT1, join_COUNT2, etc., para evitar conflictos con los nombres de campo.