Skip To Content

Joindre

L’outil Joindre relie des jeux de données en fonction des relations spécifiées. Les jeux de données peuvent être joints à l’aide d’attributs correspondants, de relations spatiales ou temporelles, voire d’une combinaison des trois.

Exemples

Il est possible d’utiliser cet outil dans les scénarios suivants :

  • Joindre les polygones des comtés aux données de recensement des comtés en fonction des valeurs de champ countyID appariées.
  • Joindre des enregistrements qui se produisent à un moment et un endroit relatifs en s’appuyant sur une relation temporelle et une relation spatiale.

Paramètres

Le tableau suivant décrit les paramètres utilisés dans l’outil Joindre :

ParamètreDescription

Jeu de données cible

Jeu de données auquel les enregistrements sont joints.

Jeu de données de jointure

Jeu de données qui sera joint au jeu de données cible.

Join operation (Opération de jointure)

Indique si tous les enregistrements appariés sont joints (un vers plusieurs) ou si tous les enregistrements appariés sont synthétisés ensemble (un vers un).

Type de jointure

Indique si des enregistrements cibles qui ne sont associés à aucun enregistrement de jointure correspondant sont renvoyés dans la sortie.

Champs de récapitulation

Indique les champs de jeu de données de jointure dont les statistiques seront calculées.

Utiliser des champs d’appariement

Spécifie si une relation attributaire est utilisée.

Champ cible

Champ du jeu de données cible qui sera utilisé pour apparier les enregistrements dans le jeu de données de jointure.

Champ de jointure

Champ du jeu de données de jointure qui sera utilisé pour apparier les enregistrements dans le jeu de données cible.

Utiliser une relation spatiale

Spécifie si une relation spatiale est utilisée.

Relation spatiale

Spécifie le type de relation spatiale à utiliser pour définir la condition de jointure liant les jeux de données cible et de jointure.

Distance proche

Seuil de distance linéaire qui permet de déterminer les localisations proches les unes des autres. Ce paramètre est seulement disponible pour la relation spatiale de type Near planar (Planaire proche) ou Near geodesic (Géodésique proche).

Unité de distance proche

Unité du seuil de distance linéaire. Ce paramètre est seulement disponible pour la relation spatiale de type Near planar (Planaire proche) ou Near geodesic (Géodésique proche).

Géométrie cible

Champ de géométrie issu du jeu de données cible qui sera utilisé pour identifier les relations spatiales avec le jeu de données de jointure.

Géométrie de jointure

Champ de géométrie issu du jeu de données jointure qui sera utilisé pour identifier les relations spatiales avec le jeu de données cible.

Utiliser une relation temporelle

Spécifie si une relation temporelle est utilisée.

Temporal Relation (Relation temporelle)

Spécifie le type de relation temporelle à utiliser pour définir la condition de jointure liant les jeux de données cible et de jointure.

Distance proche

Seuil de distance temporelle qui permet de déterminer les enregistrements proches les uns des autres dans le temps. Ce paramètre est seulement disponible pour la relation spatiale de type Near (Proche), Near Before (Proche avant) et Near After (Proche après).

Unité de distance proche

Unité du seuil de distance temporelle. Ce paramètre est seulement disponible pour la relation spatiale de type Near (Proche), Near Before (Proche avant) et Near After (Proche après).

Date/heure de début cible

Champ de date/heure issu du jeu de données cible qui sera utilisé pour spécifier la date/heure de début d’un enregistrement.

Date/heure de fin cible

Champ de date/heure issu du jeu de données cible qui sera utilisé pour spécifier la date/heure de fin d’un enregistrement. Ce paramètre est obligatoire si vous voulez effectuer une jointure en utilisant des intervalles comme type de date/heure. Pour plus de détails, reportez-vous à la rubrique Relations temporelles dans Data Pipelines.

Date/heure de début de jointure

Champ de date/heure issu du jeu de données de jointure qui sera utilisé pour spécifier la date/heure de début d’un enregistrement.

Date/heure de fin de jointure

Champ de date/heure issu du jeu de données de jointure qui sera utilisé pour spécifier la date/heure de fin d’un enregistrement. Ce paramètre est obligatoire si vous voulez effectuer une jointure en utilisant des intervalles comme type de date/heure. Pour plus de détails, reportez-vous à la rubrique Relations temporelles dans Data Pipelines.

Remarques sur l’utilisation

Utilisez le paramètre Target dataset (Jeu de données cible) pour identifier le jeu de données auquel les enregistrements sont joints. Utilisez le paramètre Join dataset (Jeu de données de jointure) pour identifier le jeu de données contenant les enregistrements qui seront joints aux enregistrements cible.

Si plusieurs enregistrements correspondent au même enregistrement cible, vous pouvez indiquer si tous les enregistrements appariés sont joints (optionJoin one to many (Joindre un vers plusieurs)) ou synthétisés ensemble (option Join one to on (Joindre un vers un)) comme suit :

  • Join one to many (Joindre un vers plusieurs) : tous les enregistrements correspondants du jeu de données de jointure seront joints au jeu de données cible. Le jeu de données en sortie contiendra plusieurs enregistrements de l’enregistrement cible.
  • Join one to one (Joindre un vers un) : tous les enregistrements de jointure correspondants seront synthétisés avec chaque enregistrement dans le jeu de données cible. Seuls les enregistrements avec une correspondance seront inclus dans la synthèse et la sortie. Le nombre d’enregistrements joints est ajouté. Par défaut, seuls les enregistrements cibles dont la relation est spécifiée sont conservés dans la classe d’enregistrements en sortie (Inner join (Jointure interne)). Si l’option Left join (Jointure gauche) est spécifiée, tous les enregistrements cibles en entrée sont écrits dans la classe d’enregistrements en sortie (cette jointure est appelée jointure externe gauche).
Exemples de jointure un vers plusieurs et un vers un
Dans cet exemple, la jointure un vers un comprend le total.

Le paramètre Summary fields (Champs de récapitulation) indique les champs numériques ou de date/heure du jeu de données de jointure qui sont récapitulés. Pour les champs numériques, les résumés statistiques incluent la somme, le minimum, le maximum, la moyenne et l’écart type. Pour les champs de date/heure, les résumés statistiques pris en charge incluent le minimum et le maximum. Le paramètre Summary fields (Champs de récapitulation) est disponible si l’opération de jointure est Join one to many (Joindre un vers plusieurs).

Vous pouvez joindre des enregistrements selon une relation spatiale, temporelle ou attributaire, voire une combinaison des trois relations. Une jointure spatiale apparie les enregistrements (lignes) à partir des enregistrements en entrée (les valeurs des paramètres Target dataset (Jeu de données cible) et Join dataset (Jeu de données de jointure)) en fonction de leurs localisations spatiales. Une jointure temporelle implique l’appariement d’enregistrements provenant des enregistrements en entrée en fonction de leurs relations temporelles. Une jointure attributaire apparie des enregistrements en fonction des valeurs des champs. Le tableau suivant décrit chaque type de relation de jointure :

RelationDescription

Attribut

Relation attributaire qui va déterminer si les enregistrements sont joints les uns aux autres. Les enregistrements sont appariés lorsque les valeurs de champ du jeu de jointure sont identiques à celles du jeu de données cible. Il est recommandé d’utiliser des champs du même type.

Spatial

Relation spatiale qui va déterminer si les enregistrements sont joints les uns aux autres. Les relations disponibles dépendent du type de géométrie (point, ligne ou surface) des jeux de données qui sont sur le point d’être joints. Les relations spatiales disponibles sont les suivantes :

  • Intersecte
  • Est égal à
  • Near planar (Planaire proche) : utilise des distances planaires.
  • Near geodesic (Géodésique proche) : utilise des distances géodésiques.
  • Contient
  • Dans
  • Touche
  • Croise
  • Superpose

Temporel

Relation temporelle qui va déterminer si les enregistrements sont joints les uns aux autres. Les relations disponibles dépendent du type de date/heure (instant ou intervalle) des jeux de données qui sont sur le point d’être joints. Les relations temporelles disponibles sont les suivantes :

  • Rejoint
  • Rejoint par
  • Superpose
  • Superposé par
  • Pendant
  • Contient
  • Est égal à
  • Termine
  • Terminé par
  • Démarre
  • Démarré par
  • Intersecte
  • Proche
  • Near before (À proximité avant)
  • Near after (À proximité après)

Si les géometries cible et de jointure sont dans des systèmes de coordonnées différents, le système de coordonnées du jeu de données cible est utilisé dans le cadre de l’analyse des relations spatiales.

Lorsque la valeur du paramètre Spatial relationship (Relation spatiale) est définie sur Near planar (Planaire proche), la valeur du paramètre Target geometry (Géometrie cible) doit être définie sur un système de coordonnées projetées.

Sorties

Tous les champs du jeu de données cible et du jeu de données joint seront inclus dans les enregistrements en sortie lors de l’exécution d’une jointure un vers plusieurs. Si un champ porte le même nom dans les deux jeux de données, le terme join (jointure) est ajouté au début du champ joint (par exemple, join_fieldname).

Outre l’ensemble des champs (géométrie comprise) du jeu de données cible, les champs suivants seront inclus dans les enregistrements en sortie lors de l’exécution d’une jointure un vers un.

Nom du champDescription

count

Le total d’enregistrements qui ont été joints. Ce nombre est toujours inclus dans la sortie.

statistic_fieldname

Les statistiques spécifiées créent chacune un champ attributaire, dont le nom se présente au format suivant : statistic_fieldname. Par exemple, le maximum du champ id est MAX_id.

start_datetime

Ce champ représente la date/heure de début et n’est inclus que dans le cas de jointures temporelles.

end_datetime

Ce champ représente la date/heure de fin et n’est inclus que dans le cas de jointures temporelles avec des valeurs de type intervalle.

Licences requises

Les licences et configurations suivantes sont requises :

  • Type d’utilisateur Creator ou Professional
  • Rôle d’éditeur, de facilitateur ou d’administrateur, ou rôle personnalisé équivalent

Afin d’en savoir plus sur la configuration requise pour Data Pipelines, reportez-vous à la rubrique Conditions requises.

Rubriques connexes

Pour obtenir des informations supplémentaires, consultez les rubriques suivantes :