Análisis en tiempo casi real

Una de las razones más habituales para utilizar un análisis de big data recurrente es la realización de procesamiento en tiempo casi real. Por ejemplo, puede configurar un análisis de big data para ejecutarse cada varios minutos u horas que procesa solamente las entidades más recientes escritas y almacenadas en una capa de entidades.

Como otro ejemplo, considere un análisis en tiempo real configurado para recibir datos de un feed que recopila actualizaciones de ubicación de vehículos cada 10 segundos. Este análisis en tiempo real escribe datos de eventos en una salida Capa de entidades (nueva) y calcula un campo de fecha (denominado algo similar a process_timestamp) con la herramienta Calcular campo con la hora en la que un evento se procesó con la función de Arcade Date().

Nota:

Una práctica recomendada es utilizar la herramienta Calcular campo en un análisis en tiempo real para escribir la fecha y hora del procesamiento en la capa de entidades que utilizará el análisis de big data para realizar análisis en tiempo casi real. Algunas fuentes de datos consumidas por feeds tienen un retraso inherente a la hora de proporcionar datos o sondeos que podrían hacer que las consultas de campo de marca de tiempo pasen por alto las entidades.

Para completar este análisis en tiempo real, se puede configurar un análisis de big data recurrente programado que utilice la salida del análisis en tiempo real como su fuente de datos. En este análisis de big data recurrente, se configuraría una fuente de Capa de entidades para recopilar la salida de la capa de entidades creada por el análisis en tiempo real. Al configurar una fuente de capa de entidades, en el paso Campo de marca de tiempo, se puede seleccionar un campo de fecha en el parámetro Campo de fecha para las entidades más recientes. Seleccione el campo de fecha y hora creado por la herramienta Calcular campo en el análisis en tiempo real. En este ejemplo, el nombre de campo es process_timestamp.

La fuente de Capa de entidades utiliza el valor de marca de tiempo para recuperar solo las entidades más recientes de la capa de entidades en cada ejecución. Si se especifica un campo para el parámetro Campo de fecha para las entidades más recientes, la primera vez que ArcGIS Velocity sondea la capa de entidades cargará todas las entidades con una fecha y hora de marca de tiempo que sea menor que el primer tiempo de ejecución programado que también cumpla los criterios de la cláusula WHERE. En cada ejecución posterior, se cargan las entidades con un valor de marca de tiempo entre el último tiempo de ejecución programado y el tiempo de ejecución programado actual que también cumplan los criterios de la cláusula WHERE.

Configuración del campo de marca de tiempo para especificar el campo

El análisis de big data se configura para ejecutarse en el intervalo de repetición deseado, por ejemplo, cada 5 minutos. Al utilizar un campo de marca de tiempo como se describe arriba, solamente se analizan en el análisis de big data las entidades más recientes que aún no se hayan procesado durante ejecuciones subsiguientes.