Introduction à la conservation des données—ArcGIS Velocity

Lorsque vous stockez des entités en sortie dans une couche d’entités, ArcGIS Velocity gère les données selon un ensemble de politiques de conservation des données. La conservation des données fait généralement référence à la durée pendant laquelle les données sont activement conservées dans la couche d’entités.

Pour plus d’informations sur l’écriture des données dans une nouvelle couche d’entités dans Velocity, reportez-vous à la rubrique Couche d’entités (nouvelle). Pour écrire dans une couche d’entités existante, reportez-vous à la rubrique Couche d’entités (existante).

Objectif de la conservation des données

En appliquant des stratégies de conservation des données, vous pouvez conserver les couches d’entités à une taille donnée, même lorsque les flux de données temps réel ajoutent continuellement de nouvelles entités. Cela permet de s’assurer que le jeu de données sous-jacent ne grossit pas indéfiniment, notamment lorsque les données plus anciennes sont moins pertinentes pour comprendre les tendances et consulter les dernières activités.

La conservation des données n’est pas faite pour limiter les entités disponibles à des périodes spécifiques. La conservation des données permet de s’assurer que les données sont conservées dans la couche d’entités pendant au moins la période spécifiée. À tout moment, des données peuvent être plus anciennes que la période spécifiée, dans la mesure où le processus de suppression des données s’exécute de manière périodique. Pour vous assurer qu’une carte affiche les données de la période spécifiée, nous vous recommandons d’interroger les données en conséquence dans les applications client.

Processus de conservation des données

L’analyse temps réel ou Big Data peut écrire des données dans une sortie de couche d’entités, qui peut être configurée avec la conservation des données. Pour créer une sortie de couche d’entités, créez ou ouvrez une analyse temps réel ou Big Data. Cliquez sur Outputs (Sorties) et sélectionnez Feature Layer (new) (Couche d’entités [nouvelle]). Dans la fenêtre de configuration de la couche d’entités, le paramètre Data retention (time period for retaining data) (Conservation des données [période de conservation des données]) permet de définir les options de conservation des données lorsque vous ajoutez la sortie de couche d’entités.

La conservation des données est uniquement requise lorsque vous stockez des données dont le volume augmente au fil du temps. Cette évaluation est réalisée sur la base des paramètres Data Storage Method (Méthode de stockage de données) et sur la manière dont vous conserver les données entre les exécutions d’analyses.

Options de stockage des données pour les couches d’entités en sortie

Par exemple, si vous choisissez l’option Add New Features (Ajouter de nouvelles entités) (plutôt que de conserver uniquement la dernière entité) et l’option Keep existing features and schema (Conserver les entités et la structure existantes) lorsque l’analyse redémarre, le volume de données entrantes augmente au fil du temps. Par conséquent, vous devez attribuer une valeur pour le paramètre Data retention (time period for retaining data) (Conservation des données [temps de conservation des données]).

À l’inverse, si vous choisissez l’option Keep Latest Feature (Conserver la dernière entité), vous stockez uniquement la dernière observation de chaque trace. Le volume de ces données peut augmenter lorsque de nouveaux capteurs sont déployés dans votre organisation, mais il se stabilise généralement à une taille maximum. Si vous choisissez l’option Keep existing features and schema (Conserver les entités et la structure existantes), vous devez attribuer une valeur au paramètre Data retention (time period for retaining data) (Conservation des données [temps de conservation des données]). Si vous choisissez l’option Replace existing features and schema (Remplacer les entités et la structure existantes), le paramètre Data retention (time period for retaining data) (Conservation des données [temps de conservation des données]) ne s’applique pas.

Options de conservation et de stockage des données pour la conservation de la dernière entité

Lorsque vous définissez une couche d’entités en sortie dans une analyse temps réel ou Big Data, vous pouvez spécifier la période de conservation des données à appliquer à cette couche d’entités. Par exemple, il se peut que vous vouliez conserver les données météorologiques du jour précédent, et conserver un historique des positions de vos véhicules ou de votre flotte pendant 6 mois. Vous pouvez également exporter les données plus anciennes vers une archive de couche d’entités, à laquelle vous pouvez accéder pour exécuter une analyse sur les données historiques.

Options de conservation des données pour les couches d’entités en sortie

Lorsque vous définissez une période de conservation des données pour une couche d’entités, les entités plus anciennes que cette période spécifiée sont régulièrement supprimées du jeu de données sous-jacent. Lorsque vous exportez les données, ces entités sont exportées vers l’archive de couche d’entités avant d’être supprimées. Pour la conservation des données, l’âge des entités se base sur l’horodatage indiquant l’heure de création des données dans le jeu de données sous-jacent, qui peut ou non être la même que l’heure de début de l’entité. La conservation des données s’effectue en fonction de l’heure de création, afin d’adopter une approche cohérente sur tous les jeux de données, y compris ceux qui peuvent représenter les données d’intervalle ou pour lesquels l’enregistrement d’entité n’a pas de date ou d’heure.

Remarque :

Si vous sélectionnez l’option Do not export data (Ne pas exporter les données) pour le paramètre Data export (feature layer archive) (Exportation de données [archive de couche d’entités]), les données supprimées ne peuvent pas être récupérées.

Archivage des données (conservation de l’archive de couche d’entités)

Lorsqu’une période de conservation des données est requise pour une couche d’entités, vous pouvez exporter les données plus anciennes vers une archive de couche d’entités. Lorsque cette option est activée, les données plus anciennes que la période de conservation sont exportées au format de données Parquet vers une archive gérée par Velocity. Les données figurant dans l’archive sont conservées pour une durée maximale d’un an après la date de leur exportation.

Par exemple, si vous sélectionnez une période de conservation des données de 1 Year (1 an) et choisissez d’exporter les données plus anciennes vers l’archive, Velocity conservera dans les faits vos données pendant deux ans. Si vous sélectionnez comme période de conservation des données 1 Month (1 mois) et choisissez d’exporter les données plus anciennes vers l’archive, Velocity conservera dans les faits vos données pendant un mois et un an.

Options d’exportation et de conservation des données pour les couches d’entités en sortie

Les données exportées dans l’archive ne s’affichent pas sur la couche d’entités. Pour utiliser des entités exportées dans l’archive, importez-les à l’aide du type de source Feature Layer (archive) (Couche d’entités [archive]) dans une analyse de Big Data ou une analyse en temps réel. Dans une analyse de Big Data, l’outil Merge Layers (Combiner les couches) vous permet alors de combiner les données de la couche d’entités et l’archive de couche d’entités dans un même pipeline en vue d’une analyse supplémentaire. Dans une analyse en temps réel, la source Feature Layer (archive) (Couche d’entités [archive]) peut être utilisée pour importer les entités exportées vers l’archive en tant que source de l’analyse en temps réel.

De plus, vous pouvez exporter des données plus anciennes vers vos propres répertoires cloud (par exemple Amazon S3 ou le stockage d’objets Blob Azure) si vous voulez conserver vos données indéfiniment.

Vous avez un commentaire à formuler concernant cette rubrique ?