Skip To Content

Transposer

L’outil Pivot (Transposer) convertit un jeu de données long en jeu de données large en utilisant les différentes valeurs d’un champ existant pour créer de nouveaux champs.

Exemples

Vous pouvez utiliser l’outil Pivot (Transposer) dans les scénarios suivants :

  • Vous disposez d’un jeu de données long contenant de nombreux enregistrements et quelques champs et voulez le mettre en forme pour qu’il ne contienne que quelques enregistrements et quelques champs.
  • Vous disposez d’un jeu de données contenant des enregistrements qui proviennent d’observations sur le terrain sur plusieurs années et voulez synthétiser les valeurs par année.

Paramètres

Le tableau suivant décrit les paramètres disponibles dans l’outil Pivot (Transposer) :

ParamètreDescription

Jeu de données en entrée

Le jeu de données à transposer.

Champs en entrée

Un ou plusieurs champs utilisés pour définir les enregistrements uniques dans le jeu de données en sortie. Les enregistrements avec des valeurs correspondantes seront agrégés à l’aide des fonctions d’agrégation.

Champ de transposition

Champ contenant les valeurs à transformer en nouveaux champs dans le jeu de données en sortie.

Champ de valeurs

Champ utilisé pour déterminer les valeurs des nouveaux enregistrements.

Fonctions d’agrégation

Fonction(s) utilisée(s) pour calculer les nouvelles valeurs.

Remarques sur l’utilisation

Utilisez le paramètre Input dataset (Jeu de données en entrée) pour identifier le jeu de données à transposer.

Utilisez le paramètre Input fields (Champs en entrée) pour identifier un ou plusieurs champs contenant les valeurs de regroupement. Les valeurs uniques du ou des champs spécifiés deviendront les enregistrements dans le jeu de données en sortie. Le même champ ne peut pas être spécifié pour Input fields (Champs en entrée) et Pivot field (Champs de transposition) ou Value field (Champ de valeurs).

Utilisez le paramètre Pivot field (Champ de transposition) pour identifier le champ contenant les valeurs qui seront utilisées pour créer les nouveaux noms de champ dans le jeu de données en sortie.

Le paramètre Aggregate functions (Fonctions d’agrégation) est utilisé pour déterminer le mode de calcul des valeurs des enregistrements groupés. Les fonctions d’agrégation suivantes sont disponibles :

  • Sum (Somme) : somme des valeurs numériques dans un champ. La somme des [null, 1, 3] est 4.
  • Min : valeur minimale d’un champ numérique ou de date. Le minimum de [0, 2, null] est 0.
  • Max : valeur maximale d’un champ numérique ou de date. Le maximum de [0, 2, null] est 2.
  • Mean (Moyenne) : moyenne des valeurs numériques. La moyenne des [0, 2, null] est 1.
  • Standard deviation (Écart type) : écart type d’un champ numérique. L’écart type de [null, 1, 1, 1] est 0.
  • Count (Nombre) : le nombre de valeurs différentes de Null. Ce paramètre peut être utilisé sur les champs de tout type. Le nombre de [null, "hello", "world"] est 2.
  • Any (Quelconque) : exemple de valeur provenant d’un champ de n’importe quel type.

Sorties

La sortie de l’outil est un jeu de données contenant les champs et valeurs suivants :

  • Tous les champs spécifiés avec le paramètre Input fields (Champs en entrée). La sortie contiendra un enregistrement par valeur unique trouvée dans le champ ou une combinaison de champs.
  • Les nouveaux champs pour chaque valeur unique du champ spécifié avec le paramètre Pivot field (Champ de transposition). Ces champs contiendront les valeurs agrégées du champ spécifié avec le paramètre Value field (Champ de valeurs). Par exemple, si le champ de transposition contient deux valeurs uniques, California et Washington, et que vous calculez les fonctions d’agrégation Mean (Moyenne) et Any (Tout), le résultat contiendra quatre nouveaux champs : MEAN_California, ANY_California, MEAN_Washington et ANY_Washington.

Si Pivot field (Champ de transposition) contient des valeurs nulles, un champ appelé null est ajouté. Si Pivot field (Champ de transposition) contient des chaînes vides, un champ appelé _ est ajouté.

Exemple d’utilisation de l’outil Pivot (Transposer)

Limitations

Les limitations connues suivantes s’appliquent à l’outil Pivot (Transposer) :

  • Les noms de champ ne sont pas sensibles à la casse.Si le paramètre Pivot field (Champ de transposition) contient des valeurs de texte correspondantes dont la casse est différente, les champs en sortie sont renommés pour éviter les doublons.
  • Les noms de champ qui contiennent des caractères non valides ou qui commencent par un chiffre sont renommés. Si le paramètre Pivot field (Champ de transposition) contient plusieurs valeurs pouvant générer des conflits lorsqu’elles sont renommées, celles-ci sont renommées pour éviter les doublons.
  • Le paramètre Pivot field (Champ de transposition) prend en charge jusqu’à 1 000 valeurs différentes. Si plus de 1 000 valeurs différentes sont trouvées, une erreur est émise.
  • L’outil Pivot (Transposer) requiert l’analyse de l’intégralité du jeu de données pour déterminer les nouvelles valeurs de champ. Si les performances des outils en aval posent problème, envisagez de limiter la taille du jeu de données en entrée.

Licences requises

Les licences et configurations suivantes sont requises :

  • Type d’utilisateur Creator ou Professional
  • Rôle d’éditeur, de facilitateur ou d’administrateur, ou rôle personnalisé équivalent

Afin d’en savoir plus sur la configuration requise pour Data Pipelines, reportez-vous à la rubrique Conditions requises.