Un análisis en tiempo real procesa datos que se incorporan por medio de un tipo de feed y analiza cada mensaje conforme se recibe. Los análisis en tiempo real se utilizan para transformar datos, gestionar barreras geográficas y detectar incidentes. Los análisis terminan con uno o más tipos de salida, como almacenar datos en una capa de entidades o enviar una alerta por correo electrónico.
Ejemplos de análisis en tiempo real
A continuación se muestran algunos ejemplos de uso del análisis en tiempo real:
- Como administrador de operaciones de emergencia, puede rastrear y archivar las ubicaciones actuales de los equipos de campo en tiempo real, enviar alertas si el equipo está dentro de una zona restringida y calcular la distancia de los equipos de campo desde la base de operaciones asignada.
- Como analista de la cadena de suministro de una empresa de petróleo y gas, se puede conectar a una transmisión de datos del Sistema de Identificación Automática (AIS) para supervisar sus buques, calcula la información de llegada esperada y comprende cuándo los buques entran o salen de áreas de interés.
- Como analista logístico en una empresa de transporte, puede supervisar los movimientos de los vehículos en tiempo real para visualizar y archivar estadísticas de movimiento, como la velocidad, la distancia y el tiempo de inactividad. Puede almacenar todas estas ubicaciones y atribuir observaciones a una capa de entidades.
- Como científico medioambiental que administra una gran cantidad de sensores, puede archivar observaciones para su posterior procesamiento.
Componentes de un análisis en tiempo real
Un análisis en tiempo real consta de cuatro componentes: feeds, fuentes, herramientas y resultados. Estos componentes se describen a continuación:
- Feeds:
- Un feed es una transmisión de datos en tiempo real que llega a ArcGIS Velocity. Los feeds suelen conectarse a fuentes externas de datos observacionales como, por ejemplo, plataformas de internet de las cosas (IdC), agentes de mensajería o API de terceros. Los feeds analizan datos tabulares, de punto, de polilínea o de polígono entrantes y los exponen para su análisis y visualización.
- Fuentes:
- Una fuente de datos se utiliza para cargar datos estáticos o casi en tiempo real en un análisis de big data.
- Las fuentes de datos de un análisis en tiempo real solo se utilizan como un dataset secundario en las herramientas aplicables, como Unir entidades, Filtrar por geometría, Calcular distancia y más.
- Herramientas:
- Las herramientas procesan o analizan eventos procedentes de feeds. No incluya ninguna o incluya varias herramientas en un análisis en tiempo real, dependiendo del caso de uso.
- Las herramientas se pueden conectar entre sí, donde la salida de una herramienta representa la entrada de otra herramienta.
- No todas las herramientas disponibles en análisis de big data están disponibles en análisis en tiempo real. Se debe a que algunas herramientas, por ejemplo, Buscar puntos calientes, analizan a la vez todo un conjunto de datos. En cambio, los análisis en tiempo real operan en cada evento entrante en cuanto que se recibe.
- Salidas:
- Un tipo de salida define qué se debería hacer con cada evento a medida que lo procesa un análisis en tiempo real.
- Las opciones de salida incluyen almacenar entidades en una capa de entidades nueva o existente, enviar un correo electrónico, enviar mensajes a Kafka o RabbitMQ, y mucho más. Para obtener más información, consulte los principios básicos de las salidas analíticas.
- Los eventos recibidos de una herramienta o feed se pueden enviar a varias salidas.
Procesamiento sin estado frente a procesamiento con estado
La mayoría de las herramientas de análisis en tiempo real funcionan sin estado, lo que significa que operan en cada observación recibida y no mantienen registros en memoria de ninguna observación anterior. Sin embargo, varias de las herramientas disponibles funcionan de una manera con estado, con rastreos en lugar de con observaciones individuales.
Las herramientas con estado recopilan varias observaciones consecutivas por rastreo para comparar condiciones espaciales y de atributos en cada rastreo y detectar cambios. Cuando se recibe una observación para cada rastreo, se agrega a una pequeña caché de observaciones para ese rastreo. Se utiliza, por ejemplo, para detectar si el recorrido ha entrado o salido de una barrera geográfica comparando la observación más reciente con la anterior.
Entre las herramientas con estados disponibles están las siguientes:
- Calcular estadísticas de movimiento
- Detectar huecos
- Detectar incidentes
- Filtrar por geometría
- Unir entidades
Las herramientas con estado no pueden mantener un número indefinido de observaciones en la memoria, por lo que, para evitar el consumo excesivo de recursos de memoria, la caché de cada rastreo se purga periódicamente de las observaciones anteriores a una antigüedad especificada.
Algunas de las herramientas con estado permiten especificar una duración de purga mediante el parámetro Ventana de tiempo de destino. Al realizar la purga, las observaciones más antiguas que el valor especificado en el parámetro Ventana de tiempo de destino se purgan de la memoria. La purga solo afecta a las observaciones almacenadas en memoria con fines de procesamiento con estado. La purga no afecta a ninguna observación enviada a las salidas y no elimina los datos.
El parámetro Ventana de tiempo de destino debe configurarse con un valor igual o mayor que el periodo de tiempo previsto más largo entre las observaciones de un solo recorrido. Por ejemplo, si los vehículos informan de sus ubicaciones cada 5 minutos y está utilizando la herramienta Filtrar por geometría para detectar en qué momento cada vehículo entra en un área determinada, debería definir el valor de Ventana de tiempo de destino en el filtro para que sea ligeramente superior a cinco minutos y garantizar que se reciban varias observaciones antes de la purga. Utilizar un valor inferior a cinco minutos da como resultado una caché que contiene solo una observación por rastreo, lo que elimina la capacidad de determinar que la relación espacial de un vehículo con la barrera geográfica ha cambiado de fuera adentro. Las herramientas Calcular estadísticas de movimiento, Detectar incidentes, Filtrar por geometría y Unir entidades presentan todas ellas el parámetro Ventana de tiempo de destino.
Barreras geográficas
El uso de barreras geográficas es la forma más característica de análisis espacial en tiempo real y supone que las entidades (con frecuencia, puntos de rastreo) se evalúan respecto de áreas de interés (con frecuencia, áreas de polígono). Lo más habitual es analizar observaciones basadas en puntos para determinar si han entrado o salido de un perímetro virtual.
Varias herramientas de análisis de datos en tiempo real y big data permiten utilizar barreras geográficas para identificar ciertas relaciones espaciales que pueden ocurrir entre entidades de un feed o fuente de datos de destino y un conjunto de entidades de unión espacial, o barreras geográficas.Las entidades utilizadas como barreras geográficas deben estar conectadas al puerto de unión de la herramienta de barreras geográficas. Las barreras geográficas pueden ser puntos, líneas o polígonos. Las relaciones espaciales dependen del tipo de geometría de los datos de unión y de destino de entrada.
Las herramientas de datos en tiempo real y big data que admiten las barreras geográficas son:
Para obtener más detalles y casos de uso de ejemplo, consulte Análisis de barreras geográficas.
Barreras geográficas dinámicas
En varias herramientas de análisis en tiempo real, es posible utilizar barreras geográficas dinámicas para identificar relaciones espaciales entre las entidades de un feed de destino y un conjunto de entidades de otro feed, el de unión (las barreras geográficas), actualizándose ambas en tiempo real o en tiempo casi real. La herramienta que trabaja con las barreras geográficas emplea la observación más reciente de cualquier Id. de rastreo concreto como barreras geográficas.
- Si hay un feed conectado al puerto de unión, las entidades de unión (las barreras geográficas) se refrescan continuamente en función de las entidades entrantes del feed de unión. En este caso, el procesamiento de las barreras geográficas se realiza dinámicamente en función de las entidades cambiantes de los feeds de unión y destino.
- Con las barreras geográficas dinámicas, se requiere el parámetro Ventana de tiempo de unión.
- Si el feed de unión no tiene un campo etiquetado como END_TIME y la última observación conocida de una entidad de unión es más antigua que la ventana de tiempo de unión especificada, la herramienta purga las observaciones de esta memoria y no las incluye en el análisis.
- Si el feed de unión tiene un campo etiquetado como END_TIME, la entidad se descarta por antigüedad del almacén de barreras geográficas de acuerdo con el valor del campo etiquetado como END_TIME o al cerrar la ventana de tiempo de unión, lo que ocurra primero.
Las siguientes herramientas de análisis en tiempo real admiten barreras geográficas dinámicas:
Nota:
El tamaño máximo de las barreras geográficas admitido en análisis en tiempo real no puede superar los 768 MB.
Para obtener más detalles y casos de uso de ejemplo, consulte Análisis de barreras geográficas.