Reconstruire les traces

Icône d’outil Disponible dans les analyses de Big Data.

L’outil Reconstruct Tracks (Reconstruire les traces) Reconstruire les traces connecte des points séquentiels dans le temps à des traces et synthétise les entités de la trace. Les traces sont identifiées par un ou plusieurs champs de trace. La couche résultante affiche la trace sous la forme d’une ligne ou d’une surface, le nombre d’entités d’une trace ayant été récapitulées et toute statistique supplémentaire spécifiée.

Diagramme de workflow

Diagramme de workflow de Reconstruire les traces

Exemple

Les ouragans sont l'un des types de tempêtes les plus violents qui se produisent aux Etats-Unis. Pour évaluer les primes d’assurance, vous souhaitez par exemple connaître la trajectoire des ouragans afin d’identifier les zones qui sont habituellement les plus touchées par des dommages matériels et des pertes financières. Vous avez accès aux données identifiant les zones touchées par les ouragans aux États-Unis, lesquelles sont disponibles dans un jeu de données unique, avec un horodatage pour chaque zone. Vous voulez synthétiser toutes les informations pour afficher un résumé des valeurs sur tous les ouragans. Vous pouvez synthétiser vos données à l’aide d’un identificateur de traces d’ouragans pour obtenir les statistiques correspondant à chaque ouragan.

Remarques sur l’utilisation

Gardez les points suivants à l’esprit lorsque vous utilisez l’outil Reconstruct Tracks (Reconstruire les traces) :

  • Vous devez spécifier des couches ponctuelles ou surfaciques en entrée avec des entités temporelles de type instant. Les entités non ponctuelles ne sont pas incluses dans les traces en sortie.
  • L’outil Reconstruct Tracks (Reconstruire les traces) s’exécute sur des entités ponctuelles ou surfaciques. La couche en entrée doit être temporelle et comporter des entités représentant un instant donné dans le temps.
  • Pour obtenir des résultats linéaires, seules les traces contenant plusieurs points sont renvoyées. Si vous appliquez une zone tampon, toutes les entités sont renvoyées.
  • Les entités en entrée sont constituées d’entités temporelles qui représentent un instant donné dans le temps. Les résultats sont des entités linéaires ou surfaciques représentant un intervalle dans le temps. Le début et la fin de l’intervalle sont déterminés par l’heure de la première entité et l’heure de la dernière entité dans une trace.

    Les entités en entrée comportant deux traces distinctes (verte et magenta) qui présentent un temps de type instant (gauche) et les traces résultantes (droite) qui présentent un temps de type intervalle sont affichées.

  • Le calcul le plus élémentaire effectué sur une trace permet d’obtenir le nombre total d’entités synthétisées. Les statistiques (Count [Total], Sum [Somme], Sum of squares [Somme des carrés], Minimum, Maximum, Range [Plage], Mean [Moyenne], Standard deviation [Écart type] et Variance) peuvent également être calculées sur des champs numériques et les statistiques (Count [Total], Count Distinct [Total distinct] et Any [Tout]) peuvent être calculées sur des champs de type chaîne. La statistique de chaîne « tout » renvoie un exemple de chaîne de chaque trace. Les statistiques sont calculées séparément sur chaque trace.
  • Le ou les champs utilisés pour identifier les traces sont renvoyés dans les résultats.
  • Vous pouvez spécifier un ou plusieurs champs pour identifier des traces. Les pistes sont représentées par un ou plusieurs champs de piste. Par exemple, si les champs flightID et Destination sont utilisés comme identifiants de trace, les entités ID007, Solden et ID007, Tokoyo figureraient dans deux traces distinctes, car les valeurs de leur champ Destination sont différentes.
  • Vous pouvez également appliquer une zone tampon à vos entités en entrée. Lorsque vous appliquez une zone tampon, les traces résultantes sont des entités surfaciques.

    Les points en entrée avec application d’une zone tampon sont reconstruits en pistes.

  • Les zones tampons sont créées à l’aide d’une valeur de champ ou d’une expression de zone tampon. Ces deux méthodes peuvent être configurées à l’aide d’une expression Arcade. Vous pouvez appliquer une expression permettant de gérer les traces. Par exemple, vous pouvez buffériser l’entité actuelle au moyen du champ wind_speed pour les trois entités précédentes d’une trace avec l’équation mean($track.field["wind_speed].history(-4, -1)). Lors de la bufférisation des entités en entrée, chaque entité en entrée est bufférisée. Une enveloppe convexe est ensuite générée pour créer une trace de zone.
  • Lors de la bufférisation des entités en entrée, chaque entité en entrée est bufférisée. Une enveloppe convexe est ensuite générée pour créer une trace de zone.

    Un exemple de points en entrée (vert), de zone tampon intermédiaire pour la visualisation (hachure bleue) et de la piste polygonale résultante (bleu) est présenté.

  • Par défaut, les pistes sont créées à l’aide de la méthode géodésique. Elle est appliquée aux deux composants suivants de l’analyse :
    • Les traces croisent la liste de changement de date : lorsque vous utilisez la méthode géodésique, les couches en entrée qui croisent la ligne de changement de date comportent des traces qui croisent correctement la ligne de changement de date. Il s’agit de l’option par défaut. Votre couche en entrée doit être définie sur une référence spatiale qui prend en charge le retour à la ligne de la ligne internationale de changement de date, comme une projection de type World Cylindrical Equal Area.
    • Zones tampon : les entités en entrée peuvent éventuellement être bufférisées. Pour savoir quand appliquer une zone tampon géodésique ou planaire, reportez-vous à l’outil Create Buffers (Créer des zones tampon).
  • Deux méthodes permettent de fractionner les pistes :
    • Apply a time split (Appliquer une fraction temporelle) : l’application d’une fraction temporelle permet de fractionner une trace lorsque les données en entrée sont plus éloignées que la durée spécifiée. Par exemple, si vous disposez de cinq entités associées au même identifiant de suivi et aux heures [01:00, 02:00, 03:30, 06:00, 06:30] et que vous paramétrez une fraction temporelle de deux heures, les entités mesurées à plus de deux heures d’intervalle sont fractionnées. Dans cet exemple, le résultat produira une piste comportant [01:00, 02:00, 03:30] et [06:00, 06:30], car la différence entre 03:30 et 6:00 est supérieure à deux heures.
    • Apply a distance split (Appliquer une fraction de distance) : l’application d’une fraction de distance permet de fractionner une trace lorsque les données en entrée sont plus éloignées que la distance spécifiée. Par exemple, si vous définissez une fraction de distance de cinq kilomètres et que les entités séquentielles situées au-delà de ces cinq kilomètres font partie d’une trace différente, les options de fractionnement sont les suivantes :

      Cinq exemples de points en entrée (verts) avec fractions temporelles et de distance variables sont illustrés.

      Option de fractionnementDescription
      Option 1

      Points en entrée ayant le même ID avec temps (instant) et emplacement

      Option 2

      Exemple sans fraction temporelle ni de distance.

      Option 3

      Exemple avec fraction temporelle de deux heures. Les entités éloignées de plus de deux heures (1:30 et 4:00) sont fractionnées en pistes distinctes.

      Option 4

      Exemple avec fraction de distance de deux kilomètres. Les entités éloignées de plus de deux kilomètres (situées à 11:30 et 12:00) sont fractionnées en pistes distinctes.

      Option 5

      Exemple avec fraction de distance de deux kilomètres et fraction temporelle de deux heures. Les entités éloignées de plus de deux kilomètres (situées à 11:30 et 12:00) ou deux heures (1:30 et 4:00) sont fractionnées en pistes distinctes.

  • Les traces en sortie renvoient les champs utilisés comme identifiants de suivi (TRACK_ID), le nombre d’entités dans une trace (COUNT), l’heure de début et de fin de chaque trace (StartTime et EndTime), la durée de la trace en millisecondes (TRACK_DURATION) et d’autres statistiques facultatives.
  • Vous pouvez calculer des statistiques supplémentaires à l’aide du paramètre Summary Fields (Champs de récapitulation). Les statistiques des champs de récapitulation disponibles dépendent du type de champ que vous récapitulez. Un champ attributaire de type chaîne peut utiliser les statistiques Any (Tout), Count (Total) et Count distinct (Total distinct). Un champ attributaire numérique peut utiliser les statistiques Any (Tout), Count (Total), Count distinct (Total distinct), Sum (Somme), Sum of squares (Somme des carrés), Min, Max, Range (Plage), Variance et Standard deviation (Écart type). Un champ attributaire de type date peut utiliser les statistiques Any (Tout), Count (Total), Min, Max et Range (Plage).

Paramètres

Les paramètres de l’outil Reconstruct Tracks (Reconstruire les traces) sont les suivants :

ParamètreDescriptionType de données

Couche en entrée

Entités ponctuelles pour lesquelles les trajets ou les localisations d’arrêt sont calculés.

Entités

Fractionner la distance

Distance utilisée pour fractionner les traces. Les entités du jeu de données en entrée qui se trouvent sur la même trace et dont l’éloignement est supérieur à cette distance sont fractionnées en une nouvelle trace. Pour éviter le fractionnement des traces, laissez ce paramètre vide.

Chaîne

Fractionner la durée

Durée utilisée pour fractionner les traces. Les entités du jeu de données en entrée qui se trouvent sur la même trace et dont l’éloignement est supérieur à cette durée sont fractionnées en une nouvelle trace. Pour éviter le fractionnement des traces en fonction de la durée, laissez ce paramètre vide.

Chaîne

Champ d’ID de suivi

Vous devez sélectionner le ou les champs pour identifier de manière unique les entités à traiter. Si le champ TRACK_ID a été défini dans la couche en entrée, ce paramètre est automatiquement renseigné.

Chaîne

Champs de récapitulation

Statistiques qui sont calculées pour les champs spécifiés. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date.

  • Any (N’importe lequel) : ceci est un exemple de chaîne provenant d’un champ de type chaîne.
  • Count (Total) : calcule le nombre de valeurs non nulles. Peut être utilisé sur des champs numériques ou des chaînes. Le total de [Null, 0, 2] est égal à 2.
  • Count Distinct (Total distinct) : calcule le nombre de valeurs non nulles distinctes. Peut être utilisé sur des champs numériques ou des chaînes. Le résultat du total distinct de [null, 4, 3, 4] est 2.
  • Sum (Somme) : somme des valeurs numériques dans un champ. La somme de [null, 1, 3] est égale à 4.
  • SUM OF SQUARES (SOMME DES CARRÉS) : somme, sur toutes les observations, des différences au carré de chaque observation à partir de la moyenne globale. La somme des carrés de [null, 2,2, 3,1, 4,7] est égale à 3,206.
  • Min : valeur minimale d’un champ numérique. La valeur minimale de [0, 2, Null] est égale à 0.
  • Max : valeur maximale d’un champ numérique. La valeur maximale de [0, 2, Null] est égale à 2.
  • Mean (Moyenne) : moyenne des valeurs numériques. La moyenne de [0,2, Null] est égale à 1.
  • Range (Plage) : plage d’un champ numérique. Elle est calculée comme la valeur minimale soustraite de la valeur maximale. La plage de [0, Null, 1] est égale à 1. La plage de [Null, 4] est égale à 0.
  • Variance : variance d’un champ numérique dans une trace. La variance de [1] est la valeur nulle. La variance de [Null, 1,1,1] est égale à 1.
  • Standard Deviation (Écart type) : écart type d’un champ numérique. L'écart type de [1] est la valeur Null. L'écart type de [Null, 1,1,1] est égale à 1.

Chaîne

Expression de bufférisation

Champ facultatif utilisé pour buffériser les entités en entrée. Les valeurs de champ sont appliquées dans les unités de la référence spatiale de l’entrée, à moins que l’entrée utilise un système de coordonnées géographiques, auquel cas elles sont exprimées en mètres.

Buffériser les entités en entrée par une valeur de champ est utile pour produire des traces polygonales en sortie où la largeur de la trace indique une mesure de l’événement à cet emplacement. Par exemple, les traces polygonales représentant les ouragans et indiquant la vitesse relative du vent dans différentes zones.

Chaîne

Méthode

Indique si l’approche utilisée lors du fractionnement des lignes de suivi par une valeur de distance est une approche planaire ou une approche géodésique.

Si l’option Planar (Planaire) est sélectionnée, les points en entrée doivent être projetés. L’outil Project (Projeter) permet de projeter les points en entrée avant l’exécution de l’outil Reconstruct Tracks (Reconstruire les traces).

Chaîne

Couche en sortie

La couche en sortie inclut le champ TRACK_ID des observations en entrée ainsi que les attributs spécifiés dans la table ci-dessous.

Nom du champDescriptionType de champ

TRACK_ID

Champ de clé TRACK_ID utilisé pour le traitement

Tout

COUNT

Nombre d’observations utilisées pour reconstruire la trace.

Flottant 64 bits

TRACK_DURATION

Durée de la trace en millisecondes (EndTime – StartTime)

Flottant 64 bits

StartTime

Le paramètre StartTime de la trace.

Date

EndTime

Le paramètre EndTime de la trace.

Date