Los análisis de big data se utilizan para procesar diversas fuentes de datos con el fin de realizar determinados procedimientos o análisis. Este procesamiento genera datasets de salida y productos informativos que pueden precisar mantenerse actualizados para garantizar la precisión de aquellos que dependen de los resultados.
A medida que los datos de las fuentes de datos de entrada cambian con el tiempo y a medida que se realizan nuevas observaciones y se almacenan nuevas entidades o valores, se debe repetir el procesamiento analítico de big data para generar resultados para el último conjunto de datos. Estos resultados pueden reemplazar las salidas anteriores o incorporarse a las salidas existentes para establecer una representación de este análisis realizado a lo largo del tiempo.
Mediante la programación de un análisis de big data para que se ejecute periódicamente o en un momento recurrente, puede asegurarse de que el análisis se ejecute con la frecuencia o intervalo adecuados para generar salidas y productos informativos actualizados para su uso en su organización.
Considere los siguientes ejemplos:
- Una organización de transporte desea generar un informe diario o semanal por correo electrónico que indique el kilometraje total recorrido por cada uno de sus vehículos o empleados durante ese periodo de tiempo.
- Un grupo medioambiental desea calcular estadísticas sobre uno o varios atributos a partir de lecturas de sensores a lo largo de una región una vez a la semana para comprender cómo cambian los patrones medioambientales a lo largo del tiempo o cómo cambian en función de las condiciones.