近乎实时的分析

使用循环大数据分析的最常见原因之一是近乎实时地执行处理。 例如,可以将大数据分析配置为每隔几分钟或几小时运行一次,该分析仅处理写入并存储到要素图层中的最新要素。

还有另一个示例,考虑一下实时分析,该分析被配置为从每 10 秒采集一次车辆位置更新信息的源中接收数据。 该实时分析可将事件数据写入要素图层(新)输出,并通过使用 Arcade Date() 函数处理事件的时间使用计算字段工具计算日期字段(例如 process_timestamp)。

注:

最佳做法是在实时分析中使用计算字段工具,以将处理的日期和时间写入要素图层,大数据分析将使用该要素图层进行近实时分析。 源使用的某些数据源在提供数据或轮询方面存在固有延迟,这可能会导致时间戳字段查询遗漏要素。

要对此实时分析进行补充,可以将计划循环大数据分析配置为将实时分析的输出用作其数据源。 在此循环大数据分析中,要素图层源将被配置为采集由实时分析创建的要素图层输出。 配置要素图层源时,在时间戳字段步骤中,可以在最新要素的日期字段参数中选择日期字段。 选择实时分析中由“计算字段”工具创建的日期和时间字段。 在本示例中,该字段名为 process_timestamp

在每次运行时,要素图层源将使用时间戳值仅从要素图层中检索最新要素。 如果为最新要素的日期字段参数选择了一个字段,则 ArcGIS Velocity 首次轮询要素图层时,它将加载时间戳日期和时间少于第一次计划运行时间,同时符合 WHERE 子句条件的所有要素。 每次后续运行时,将加载时间戳值在最后一次计划运行时间和当前计划运行时间之间,同时符合 WHERE 子句条件的要素。

配置时间戳字段以指定

大数据分析将被配置为以所需的重复间隔(例如每 5 分钟)运行。 借助上述时间戳字段,大数据分析将在后续运行期间仅分析尚未处理的最新要素。