L’outil Summarize attributes (Synthétiser les attributs) agrège les enregistrements et calcule des statistiques. Vous pouvez agréger tous les enregistrements, ou agréger en fonction de valeurs correspondantes dans un ou plusieurs champs.
Exemples
L’outil Summarize attributes (Synthétiser les attributs) peut être utilisé dans des scénarios, tels que les suivants :
- Agréger tous les enregistrements de vente et calculer le profit total.
- Agréger les enregistrements de vente en fonction du type d’article pour calculer le profit par article.
Paramètres
Le tableau suivant décrit les paramètres utilisés dans l’outil Summarize attributes (Synthétiser les attributs) :
Paramètre | Description |
---|---|
Jeu de données en entrée | Jeu de données contenant les enregistrements à synthétiser. |
Champs à apparier | Un ou plusieurs champs à utiliser pour agréger les enregistrements en fonction de valeurs correspondantes. Ce paramètre est facultatif. Par défaut, tous les enregistrements sont synthétisés. |
Champs de récapitulation | Champs du jeu de données en entrée à synthétiser et statistiques à calculer pour chaque champ. Ce paramètre est facultatif. Par défaut, la statistique COUNT est renvoyée. |
Remarques sur l’utilisation
Utilisez le paramètre Input dataset (Jeu de données en entrée) pour identifier le jeu de données contenant les enregistrements à synthétiser.
Utilisez le paramètre Fields to match (Champs à apparier) pour spécifier un ou plusieurs champs contenant les valeurs selon lesquelles les enregistrements en entrée doivent être regroupés. Dans le premier cas de figure, les statistiques sont calculées pour chaque combinaison unique de valeurs attributaires. Si aucun champ n’est spécifié, les statistiques sont calculées à l’aide de tous les enregistrements.
Utilisez le paramètre Summary fields (Champs de récapitulation) pour indiquer les champs du jeu de données en entrée à synthétiser. Les résumés statistiques suivants sont disponibles :
- Sum (Somme) : somme des valeurs numériques dans un champ. La somme des [null, 1, 3] est 4.
- Min : valeur minimale d’un champ numérique ou de date. Le minimum de [0, 2, null] est 0.
- Max : valeur maximale d’un champ numérique ou de date. Le maximum de [0, 2, null] est 2.
- Mean (Moyenne) : moyenne des valeurs numériques. La moyenne des [0, 2, null] est 1.
- Standard deviation (Écart type) : écart type d’un champ numérique. L’écart type de [null, 1, 1, 1] est 0.
- Count (Nombre) : le nombre de valeurs différentes de Null. Ce paramètre peut être utilisé sur les champs de tout type. Le nombre de [null, "hello", "world"] est 2.
- Any (Quelconque) : exemple de valeur provenant d’un champ de n’importe quel type.
Sorties
La sortie de l’outil correspond à une table avec des statistiques calculées. En plus des champs spécifiés à l’aide du paramètre Fields to match (Champs à apparier), les champs suivants sont disponibles dans le résultat en sortie :
Nom du champ | Description |
---|---|
COUNT | Nombre d’enregistrements synthétisés dans le nouvel enregistrement. Ce nombre est toujours inclus dans la sortie. |
STATISTIC_fieldname | Les statistiques spécifiées créent chacune un champ attributaire, dont le nom est au format suivant : STATISTIC_nomchamp. Par exemple, la moyenne du champ measurement est MEAN_measurement. |
Limitations
Les limitations connues suivantes s’appliquent à l’outil Summary fields (Champs de récapitulation) :
- Les enregistrements avec des géométries vides, nulles ou non valides sont exclus du traitement et leurs valeurs ne sont pas utilisées dans les calculs des résumés statistiques.
- L’outil Summarize attributes (Synthétiser les attributs) n’effectue pas la synthèse en fonction des relations spatiales. Pour calculer les statistiques des polygones ou polylignes qui intersectent ou partagent des attributs communs, utilisez l’outil Dissolve (Fusionner). Pour calculer les statistiques des tables ou géometries en fonction des relations attributaires, spatiales ou temporelles, utilisez l’outil Join (Joindre).
Licences requises
Les licences et configurations suivantes sont requises :
- Type d’utilisateur Creator ou Professional
- Rôle d’éditeur, de facilitateur ou d’administrateur, ou rôle personnalisé équivalent
Afin d’en savoir plus sur la configuration requise pour Data Pipelines, reportez-vous à la rubrique Conditions requises.
Vous avez un commentaire à formuler concernant cette rubrique ?