Reconstruir recorridos

Icono de la herramienta Disponible en análisis de big data.

La herramienta Reconstruir recorridos Herramienta Reconstruir recorridos conecta puntos secuenciales de tiempo a recorridos y resume las entidades dentro del recorrido. Los recorridos se identifican mediante uno o más campos de recorridos. La capa resultante muestra el recorrido como una línea o un área, el recuento de las entidades dentro de un recorrido que se han resumido y cualquier otra estadística adicional que se haya especificado.

Diagrama de flujo de trabajo

Diagrama de flujo de trabajo de Reconstruir recorridos

Ejemplo

Los huracanes son de los tipos de tormentas más violentas que se producen en Estados Unidos. Para evaluar las tarifas de los seguros, desea saber el recorrido que han hecho los huracanes para determinar las ubicaciones que, históricamente, han tenido mayores pérdidas materiales y financieras. Tiene acceso a los datos de ubicación de los huracanes en Estados Unidos en un único dataset, con una marca de tiempo en cada ubicación. Desea resumir toda la información para ver un resumen de los valores para todos los huracanes. Puede resumir los datos utilizando el identificador de los recorridos de los huracanes a fin de determinar las estadísticas para cada huracán.

Notas de uso

  • La herramienta Reconstruir recorridos se ejecuta en entidades de puntos o áreas. La capa de entrada debe tener el tiempo habilitado con entidades que representen un instante en el tiempo.
  • Para los resultados lineales, solo se devolverán los recorridos que contengan más de un punto. Si aplica una zona de influencia, se devolverán todas las entidades.
  • Las entidades de entrada deben estar formadas por entidades con el tiempo habilitado que representen un instante en el tiempo. Los resultados son entidades de líneas o áreas que representan un intervalo en el tiempo. El inicio y final del intervalo vienen determinados por la hora en la primera y última entidad de un recorrido.

    Se muestran las entidades de entrada con dos recorridos distintos (verde y magenta) que tienen el instante de tipo tiempo (izquierda) y los recorridos resultantes (derecha) o el intervalo de tipo tiempo.

  • El cálculo más básico en un recorrido será el recuento del número de entidades que se han resumido. Las estadísticas (recuento, suma, suma de cuadrados, mínimo, máximo, rango, valor medio, desviación estándar y varianza) también se pueden calcular en campos numéricos y las estadísticas (recuento, recuento de valores diferenciados y cualquiera) se pueden calcular en campos de cadena de caracteres. La estadística de cadena de caracteres "cualquiera" devuelve una cadena de caracteres de muestra de cada recorrido. Las estadísticas se calcularán por separado para cada recorrido.
  • Los campos utilizados para identificar los recorridos se devolverán en los resultados.
  • Puede especificar uno o más campos para identificar los recorridos. Los recorridos se representan mediante la combinación única de uno o más campos de recorridos. Por ejemplo, si se utilizan los campos flightID y Destination como identificadores de recorrido, las entidades ID007, Solden e ID007, Tokoyo estarían en dos recorridos separados, dado que tienen valores de campoDestination diferentes.
  • Si lo desea, puede aplicar una zona de influencia a las entidades de entrada. Cuando aplica una zona de influencia, los recorridos resultantes serán entidades de área.

    Los puntos de entrada con una zona de influencia se reconstruyen en forma de recorridos.

  • Las zonas de influencia se crean utilizando un valor de campo o una expresión de zona de influencia, y ambos se pueden configurar utilizando una expresión de Arcade. Para obtener más información sobre las expresiones de zona de influencia y su formato, consulte Utilizar expresiones de zona de influencia con GeoAnalytics Tools. Puede aplicar una expresión que realice seguimiento. Por ejemplo, podría crear una zona de influencia de la entidad actual por el valor medio del campo wind_speed para las tres entidades anteriores de un recorrido con la ecuación mean($track.field["wind_speed].history(-4, -1)). Al crear zonas de influencia para entidades de entrada, se crea una zona de influencia para cada entrada. A continuación, se genera una envoltura convexa para crear un recorrido de área.
  • Al crear zonas de influencia para entidades de entrada, se crea una zona de influencia para cada entrada. A continuación, se genera una envoltura convexa para crear un recorrido de área.

    Se muestra un ejemplo de puntos de entrada (verde), zona de influencia intermedia para visualización (trama azul) y el recorrido poligonal resultante (azul).

  • De forma predeterminada, los recorridos se crean utilizando un método geodésico. El método se aplica a los dos componentes siguientes del análisis:
    • Recorridos que cruzan la línea de fecha internacional: cuando se utiliza el método geodésico, las capas de entrada que cruzan la línea de fecha internacional tendrán recorridos que cruzarán correctamente la línea de fecha internacional. Esta es la opción predeterminada. La capa de entrada debe estar definida con una referencia espacial que admita el ajuste alrededor de la línea internacional de cambio de fecha, por ejemplo, una proyección global como proyección cilíndrica equivalente del mundo.
    • Zonas de influencia: se puede crear una zona de influencia de las entidades de entrada. Para obtener más información sobre cuándo aplicar una zona de influencia geodésica o planar, consulte la herramienta Crear zonas de influencia.
  • Existen dos formas de división de recorridos:
    • Aplicar una división de tiempo: al aplicar una división de tiempo, se disuelve cualquier recorrido cuando los datos de entrada están mucho más separados que el tiempo especificado. Por ejemplo, si tenía cinco entidades con el mismo identificador de recorrido y las horas [01:00, 02:00, 03:30, 06:00, 06:30] y define una división de tiempo de dos horas, se dividirán todas las entidades medidas con más de dos horas de separación. En este ejemplo, el resultado sería un recorrido con [01:00, 02:00, 03:30] y [06:00, 06:30], porque la diferencia entre 03:30 y 6:00 es superior a dos horas.
    • Aplicar una división de distancia: al aplicar una división de distancia, se disuelve cualquier recorrido cuando los datos de entrada están mucho más separados que la distancia especificada. Por ejemplo, si fija una división de distancia de 5 kilómetros y las entidades secuenciales que estén separadas por más de 5 kilómetros formaran parte de un recorrido diferente, las opciones de división serían las siguientes:

      Se muestran cinco ejemplos de puntos de entrada (verde) con divisiones de tiempo y distancia distintas.

      Opción de divisiónDescripción
      Opción 1

      Puntos de entrada con el mismo Id. con un tiempo (instante) y una ubicación.

      Opción 2

      Ejemplo sin división de tiempo ni división de distancia.

      Opción 3

      Ejemplo con una división de tiempo de dos horas. Las entidades separadas más de dos horas (1:30 y 4:00) se dividen en recorridos separados.

      Opción 4

      Ejemplo con una división de distancia de dos kilómetros. Las entidades separadas más de dos kilómetros (las entidades a las 11:30 y a las 12:00) se dividen en recorridos separados.

      Opción 5

      Ejemplo con una división de distancia de dos kilómetros y una división de tiempo de dos horas. Las entidades separadas más de dos kilómetros (las entidades a las 11:30 y a las 12:00) o más de dos horas (1:30 y 4:00) se dividen en recorridos separados.

  • Los recorridos de salida devolverán los campos utilizados como identificadores de recorrido (TRACK_ID), el recuento de las entidades dentro de un recorrido (COUNT), la hora de inicio y finalización de cada recorrido (StartTime y EndTime), la duración del recorrido en milisegundos (TRACK_DURATION) y cualquier otra estadística opcional.
  • Se pueden calcular otras estadísticas con el parámetro Campos de resumen. Las estadísticas de los campos de resumen disponibles dependen del tipo de campo que esté resumiendo. Un campo de atributo de cadena de caracteres puede utilizar las estadísticas cualquiera, recuento y recuento de valores diferenciados. Un campo de atributo numérico puede utilizar las estadísticas cualquiera, recuento, recuento de valores diferenciados, suma, suma de cuadrados, mín., máx., rango, varianza y desviación estándar. Un campo de atributo de fecha puede utilizar las estadísticas cualquiera, recuento, mín., máx. y rango.

Parámetros

ParámetroDescripciónTipo de datos

Capa de entrada

Las entidades de punto para las que se calcularán los viajes o las ubicaciones de permanencia.

Entidades

Distancia de división

Distancia utilizada para dividir recorridos. Las entidades del dataset de entrada que se encuentran en el mismo recorrido y son mayores que esta distancia de separación se dividen en un recorrido nuevo. Para evitar dividir los recorridos, deje este parámetro vacío.

Cadena de caracteres

Duración de división

Duración de tiempo utilizada para dividir recorridos. Las entidades del dataset de entrada que se encuentran en el mismo recorrido y son mayores que este tiempo de separación se dividen en un recorrido nuevo. Para evitar dividir los recorridos según el tiempo, deje vacío este parámetro.

Cadena de caracteres

Campos TRACK_ID

Debe seleccionar el campo o campos para identificar de forma única las entidades que se van a procesar. Este parámetro se rellenará automáticamente si se ha establecido unTRACK_ID campo clave en la capa de entrada.

Cadena de caracteres

Campos de resumen

Las estadísticas que se calcularán para campos concretos. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.

  • Cualquiera: esta es una cadena de caracteres de muestra de un campo de tipo cadena de caracteres.
  • Recuento: calcula el número de valores no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El recuento de [nulo, 0, 2] es 2.
  • Recuento de valores diferenciados: calcula el número de valores distintos y no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El resultado de Count distinct de [nulo, 4, 3, 4] es 2.
  • Suma: la suma de valores numéricos en un campo. La suma de [nulo, 1, 3] es 4.
  • Suma de cuadrados: la suma, sobre todas las observaciones, de las diferencias cuadradas de cada observación respecto del valor medio general. La suma de cuadrados de [nulo, 2,2, 3,1, 4,7] es 3,206.
  • Mín: el valor mínimo de un campo numérico. El mínimo de [0, 2, nulo] es 0.
  • Máx: el valor máximo de un campo numérico. El máximo de [0, 2, nulo] es 2.
  • Valor medio: el valor medio de los valores numéricos. El valor medio de [0,2, nulo] es 1.
  • Rango: el rango de un campo numérico. Se calcula como el valor mínimo restado del valor máximo. El rango de [0, nulo, 1] es 1. El rango de [nulo, 4] es 0.
  • Varianza: la varianza de un campo numérico en un recorrido. La varianza de [1] es nulo. La varianza de [nulo, 1,1,1] es 1.
  • Desviación estándar: la desviación estándar de un campo numérico. La desviación estándar de [1] es nulo. La desviación estándar de [nulo, 1,1,1] es 1.

Cadena de caracteres

Expresión de zona de influencia

Campo opcional utilizado para crear zonas de influencia en las entidades de entrada. Los valores de campo se aplican en las unidades de la referencia espacial de la entrada a menos que la entrada use un sistema de coordenadas geográficas, en cuyo caso estarán en metros.

Crear una zona de influencia de las entidades de entrada por un valor de campo resulta útil para producir recorridos poligonales de salida donde el ancho del recorrido indica una medida del evento en esa ubicación, por ejemplo, recorridos de huracanes poligonales que indican la velocidad relativa del viento en distintas áreas.

Cadena de caracteres

Método

Si se utilizará un enfoque Planar o un enfoque Geodésico al dividir líneas de rastreo por un valor de distancia.

Si se selecciona Planar, se deben proyectar los puntos de entrada. La herramienta Proyectar se puede utilizar para proyectar los puntos de entrada antes de ejecutar Reconstruir recorridos.

Cadena de caracteres

Capa de salida

La capa de salida contendrá el campo TRACK_ID de las observaciones de entrada, así como los atributos especificados en la tabla siguiente.

Nombre de campoDescripciónTipo de campo

TRACK_ID

El campo clave TRACK_ID utilizado para el procesamiento

any

COUNT

El número de observaciones utilizadas para construir el recorrido

Float64

TRACK_DURATION

La duración del recorrido en milisegundos (EndTime - StartTime)

Float64

StartTime

El StartTime del recorrido

Fecha

EndTime

El EndTime del recorrido

Fecha

Consideraciones y limitaciones

Las entradas deben ser capas de puntos o áreas con entidades que tengan la función de tiempo habilitada de tipo instante. Las entidades sin tiempo no se incluirán en los recorridos de salida.