ビッグ データ解析は、さまざまなデータ ソースを処理し、特定の手順または解析を実行するために使用されます。 この処理は、結果に依存しているユーザーのために、最新に保って正確さを保証する必要があることがある出力データセットおよび情報製品を生成します。
入力データ ソースからのデータが時間と共に変化し、新しい観測データが作成され、新しいフィーチャまたは値が格納されるときに、最新のデータセットに対してビッグ データ解析の処理を繰り返し、結果を生成する必要があります。 時間と共に実行されるこの解析の表現を確立するために、それらの結果で以前の出力を置き換えるか、それらの結果を既存の出力に追加することができます。
定期的に実行するか、繰返し実行するようにビッグ データ解析をスケジュールすることによって、解析を適切な頻度または間隔で確実に実行し、組織で使用するための最新の出力および情報製品を生成することができます。
次の例について考えてみましょう。
- ある輸送組織は、電子メール レポートを毎日または毎週生成し、その期間の間の輸送組織の車両または従業員の各々による全走行距離を示そうとしています。
- ある環境グループは、時間と共に環境パターンがどのように変化しているか、または条件に応じてどのように変化しているかを理解するために、週に 1 回、ある地域全体のセンサー データの 1 つ以上の属性に対して、統計情報を計算しようとしています。