L’outil Joindre relie des jeux de données en fonction des relations spécifiées. Les jeux de données peuvent être joints à l’aide d’attributs correspondants, de relations spatiales ou temporelles, voire d’une combinaison des trois.
Exemples
Il est possible d’utiliser cet outil dans les scénarios suivants :
- Joindre les polygones des comtés aux données de recensement des comtés en fonction des valeurs de champ countyID appariées.
- Joindre des enregistrements qui se produisent à un moment et un endroit relatifs en s’appuyant sur une relation temporelle et une relation spatiale.
Paramètres
Le tableau suivant décrit les paramètres utilisés dans l’outil Joindre :
Paramètre | Description |
---|---|
Jeu de données cible | Jeu de données auquel les enregistrements sont joints. |
Jeu de données de jointure | Jeu de données qui sera joint au jeu de données cible. |
Join operation (Opération de jointure) | Indique si tous les enregistrements appariés sont joints (un vers plusieurs) ou si tous les enregistrements appariés sont synthétisés ensemble (un vers un). |
Type de jointure | Indique si des enregistrements cibles qui ne sont associés à aucun enregistrement de jointure correspondant sont renvoyés dans la sortie. |
Champs de récapitulation | Indique les champs de jeu de données de jointure dont les statistiques seront calculées. |
Utiliser des champs d’appariement | Spécifie si une relation attributaire est utilisée. |
Champ cible | Champ du jeu de données cible qui sera utilisé pour apparier les enregistrements dans le jeu de données de jointure. |
Champ de jointure | Champ du jeu de données de jointure qui sera utilisé pour apparier les enregistrements dans le jeu de données cible. |
Utiliser une relation spatiale | Spécifie si une relation spatiale est utilisée. |
Relation spatiale | Spécifie le type de relation spatiale à utiliser pour définir la condition de jointure liant les jeux de données cible et de jointure. |
Distance proche | Seuil de distance linéaire qui permet de déterminer les localisations proches les unes des autres. Ce paramètre est seulement disponible pour la relation spatiale de type Near planar (Planaire proche) ou Near geodesic (Géodésique proche). |
Unité de distance proche | Unité du seuil de distance linéaire. Ce paramètre est seulement disponible pour la relation spatiale de type Near planar (Planaire proche) ou Near geodesic (Géodésique proche). |
Géométrie cible | Champ de géométrie issu du jeu de données cible qui sera utilisé pour identifier les relations spatiales avec le jeu de données de jointure. |
Géométrie de jointure | Champ de géométrie issu du jeu de données jointure qui sera utilisé pour identifier les relations spatiales avec le jeu de données cible. |
Utiliser une relation temporelle | Spécifie si une relation temporelle est utilisée. |
Temporal Relation (Relation temporelle) | Spécifie le type de relation temporelle à utiliser pour définir la condition de jointure liant les jeux de données cible et de jointure. |
Distance proche | Seuil de distance temporelle qui permet de déterminer les enregistrements proches les uns des autres dans le temps. Ce paramètre est seulement disponible pour la relation spatiale de type Near (Proche), Near Before (Proche avant) et Near After (Proche après). |
Unité de distance proche | Unité du seuil de distance temporelle. Ce paramètre est seulement disponible pour la relation spatiale de type Near (Proche), Near Before (Proche avant) et Near After (Proche après). |
Date/heure de début cible | Champ de date/heure issu du jeu de données cible qui sera utilisé pour spécifier la date/heure de début d’un enregistrement. |
Date/heure de fin cible | Champ de date/heure issu du jeu de données cible qui sera utilisé pour spécifier la date/heure de fin d’un enregistrement. Ce paramètre est obligatoire si vous voulez effectuer une jointure en utilisant des intervalles comme type de date/heure. Pour plus de détails, reportez-vous à la rubrique Relations temporelles dans Data Pipelines. |
Date/heure de début de jointure | Champ de date/heure issu du jeu de données de jointure qui sera utilisé pour spécifier la date/heure de début d’un enregistrement. |
Date/heure de fin de jointure | Champ de date/heure issu du jeu de données de jointure qui sera utilisé pour spécifier la date/heure de fin d’un enregistrement. Ce paramètre est obligatoire si vous voulez effectuer une jointure en utilisant des intervalles comme type de date/heure. Pour plus de détails, reportez-vous à la rubrique Relations temporelles dans Data Pipelines. |
Remarques sur l’utilisation
Utilisez le paramètre Target dataset (Jeu de données cible) pour identifier le jeu de données auquel les enregistrements sont joints. Utilisez le paramètre Join dataset (Jeu de données de jointure) pour identifier le jeu de données contenant les enregistrements qui seront joints aux enregistrements cible.
Si plusieurs enregistrements correspondent au même enregistrement cible, vous pouvez indiquer si tous les enregistrements appariés sont joints (optionJoin one to many (Joindre un vers plusieurs)) ou synthétisés ensemble (option Join one to on (Joindre un vers un)) comme suit :
- Join one to many (Joindre un vers plusieurs) : tous les enregistrements correspondants du jeu de données de jointure seront joints au jeu de données cible. Le jeu de données en sortie contiendra plusieurs enregistrements de l’enregistrement cible.
- Join one to one (Joindre un vers un) : tous les enregistrements de jointure correspondants seront synthétisés avec chaque enregistrement dans le jeu de données cible. Seuls les enregistrements avec une correspondance seront inclus dans la synthèse et la sortie. Le nombre d’enregistrements joints est ajouté. Par défaut, seuls les enregistrements cibles dont la relation est spécifiée sont conservés dans la classe d’enregistrements en sortie (Inner join (Jointure interne)). Si l’option Left join (Jointure gauche) est spécifiée, tous les enregistrements cibles en entrée sont écrits dans la classe d’enregistrements en sortie (cette jointure est appelée jointure externe gauche).
Le paramètre Summary fields (Champs de récapitulation) détermine quels champs provenant du jeu de données de jointure seront récapitulés. Le paramètre Summary fields (Champs de récapitulation) est disponible si l’opération de jointure est Join one to many (Joindre un vers plusieurs). Les résumés statistiques suivants sont disponibles :
- Sum (Somme) : somme des valeurs numériques dans un champ. La somme des [null, 1, 3] est 4.
- Min : valeur minimale d’un champ numérique ou de date. Le minimum de [0, 2, null] est 0.
- Max : valeur maximale d’un champ numérique ou de date. Le maximum de [0, 2, null] est 2.
- Mean (Moyenne) : moyenne des valeurs numériques. La moyenne des [0, 2, null] est 1.
- Standard deviation (Écart type) : écart type d’un champ numérique. L’écart type de [null, 1, 1, 1] est 0.
- Count (Nombre) : le nombre de valeurs différentes de Null. Ce paramètre peut être utilisé sur les champs de tout type. Le nombre de [null, "hello", "world"] est 2.
- Any (Quelconque) : exemple de valeur provenant d’un champ de n’importe quel type.
Vous pouvez joindre des enregistrements selon une relation spatiale, temporelle ou attributaire, voire une combinaison des trois relations. Une jointure spatiale apparie les enregistrements (lignes) à partir des enregistrements en entrée (les valeurs des paramètres Target dataset (Jeu de données cible) et Join dataset (Jeu de données de jointure)) en fonction de leurs localisations spatiales. Une jointure temporelle implique l’appariement d’enregistrements provenant des enregistrements en entrée en fonction de leurs relations temporelles. Une jointure attributaire apparie des enregistrements en fonction des valeurs des champs. Le tableau suivant décrit chaque type de relation de jointure :
Relation | Description |
---|---|
Attribut | Relation attributaire qui va déterminer si les enregistrements sont joints les uns aux autres. Les enregistrements sont appariés lorsque les valeurs de champ du jeu de jointure sont identiques à celles du jeu de données cible. Il est recommandé d’utiliser des champs du même type. |
Spatial | Relation spatiale qui va déterminer si les enregistrements sont joints les uns aux autres. Les relations disponibles dépendent du type de géométrie (point, ligne ou surface) des jeux de données qui sont sur le point d’être joints. Les relations spatiales disponibles sont les suivantes :
|
Temporel | Relation temporelle qui va déterminer si les enregistrements sont joints les uns aux autres. Les relations disponibles dépendent du type de date/heure (instant ou intervalle) des jeux de données qui sont sur le point d’être joints. Les relations temporelles disponibles sont les suivantes :
|
Si les géometries cible et de jointure sont dans des systèmes de coordonnées différents, le système de coordonnées du jeu de données cible est utilisé dans le cadre de l’analyse des relations spatiales.
Lorsque la valeur du paramètre Spatial relationship (Relation spatiale) est définie sur Near planar (Planaire proche), la valeur du paramètre Target geometry (Géometrie cible) doit être définie sur un système de coordonnées projetées.
Sorties
Lors de l’exécution d’une jointure un vers plusieurs, tous les champs du jeu de données cible et du jeu de données joint sont inclus dans la sortie. Si un champ porte le même nom dans les deux jeux de données, le terme join (jointure) est ajouté au début du champ joint (par exemple, join_fieldname).
Lors de l’exécution d’une jointure un vers un, en plus de tous les champs (notamment la géométrie) du jeu de données cible, les champs suivants sont inclus dans la sortie :
Nom du champ | Description |
---|---|
COUNT | Le total d’enregistrements qui ont été joints. Ce nombre est toujours inclus dans la sortie. |
STATISTIC_fieldname | Les statistiques spécifiées créent chacune un champ attributaire, dont le nom est au format suivant : STATISTIC_nomchamp. Par exemple, le maximum du champ id est MAX_id. |
START_DATETIME | Ce champ représente la date/heure de début et n’est inclus que dans le cas de jointures temporelles. |
END_DATETIME | Ce champ représente la date/heure de fin et n’est inclus que dans le cas de jointures temporelles avec des valeurs de type intervalle. |
Licences requises
Les licences et configurations suivantes sont requises :
- Type d’utilisateur Creator ou Professional
- Rôle d’éditeur, de facilitateur ou d’administrateur, ou rôle personnalisé équivalent
Afin d’en savoir plus sur la configuration requise pour Data Pipelines, reportez-vous à la rubrique Conditions requises.
Rubriques connexes
Pour obtenir des informations supplémentaires, consultez les rubriques suivantes :
Vous avez un commentaire à formuler concernant cette rubrique ?