Synthétiser les attributs

Icône d’outil Disponible dans les analyses de Big Data.

L'outil Summarize Attributes (Synthétiser les attributs) Icône de l'outil Synthétiser les attributs permet de synthétiser des valeurs de champs identiques pour générer une table de synthèse. La couche résultante affiche le nombre d’entités synthétisées, ainsi que les statistiques supplémentaires spécifiées.

Diagramme de workflow

Diagramme du processus Summarize Attributes (Synthétiser les attributs)

Exemple

Les ouragans et les tornades sont les types de tempêtes les plus destructeurs aux États-Unis. Vous souhaitez analyser les dommages matériels et les pertes financières provoqués par les tornades et les ouragans pour comparer leur impact. Vous pouvez utiliser des données sur les tornades et les ouragans aux États-Unis disponibles dans un jeu de données unique pour afficher une synthèse des valeurs pour tous les ouragans et une autre synthèse pour toutes les tornades. Vous pouvez synthétiser vos données à l’aide du type de tempête pour obtenir les statistiques correspondant à chaque type.

Remarques sur l’utilisation

Gardez les points suivants à l’esprit lorsque vous utilisez l’outil Synthétiser les attributs :

  • En entrée, vous pouvez utiliser une couche tabulaire ou une couche comportant une géométrie (points, lignes ou surfaces).
  • Vous pouvez utiliser cet outil avec des données spatiales. Néanmoins, le résultat est tabulaire. Vous pouvez ensuite joindre vos résultats à des données spatiales à l’aide de l’outil Join Features (Entités jointes).
  • Cet outil est un outil d’analyse tabulaire, et non un outil d’analyse spatiale. La Table en sortie est constituée de champs contenant le résultat de l'opération statistique.
  • Le paramètre Fields (Champs) vous permet éventuellement de spécifier un ou plusieurs champs pour effectuer la synthèse ou synthétiser toutes les entités. Lorsque vous effectuez la synthèse avec un seul champ, les statistiques sont calculées pour chaque valeur attributaire unique. Lorsque vous effectuez la synthèse avec plusieurs champs, les statistiques sont calculées pour chaque combinaison unique de valeurs attributaires.
  • La sortie de cet outil inclut toujours le nombre total d’entités synthétisées.
  • Vous pouvez calculer des statistiques supplémentaires à l’aide du paramètre Summary Fields (Champs de récapitulation). Les statistiques des champs de récapitulation disponibles dépendent du type de champ que vous récapitulez. Un champ attributaire de type chaîne peut utiliser les statistiques any (tout), count (total) et count distinct (total distinct). Un champ attributaire numérique peut utiliser les statistiques any (tout), count (total), count distinct (total distinct), sum (somme), sum of squares (somme des carrés), min, max, range (plage), variation et standard deviation (écart type). Un champ attributaire de type date peut utiliser les statistiques any (tout), count (total), min, max et range (plage).

Fonctionnement de l’outil Synthétiser les attributs

La section suivante décrit le fonctionnement de l’outil Summarize Attributes (Synthétiser les attributs).

Equations

La variance est calculée à l’aide de l’équation suivante :

Équation de variance
Variables de variance

L'écart type se calcule en tant que racine carrée de la variance.

Calculs

Les couches en entrée sont synthétisées en groupes avec des valeurs de champs appariées. Puisque les résultats sont tabulaires, vous ne pouvez pas les afficher sur votre carte.

Les tableaux ci-dessous présentent les calculs statistiques d’une couche synthétisée à l’aide de valeurs de champ identiques. Le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche.

Couche en entrée à synthétiser

Le tableau ci-dessus a été synthétisé en fonction du champ Designation et le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche. Il en résulte un tableau comportant deux entités représentant les valeurs distinctes de Designation.

La couche en entrée synthétisée à l’aide du champ Designation (Désignation)
La couche en entrée synthétisée à l’aide du champ Designation (Désignation) est affichée.

Le tableau suivant représente les premiers champs lorsque la couche est synthétisée à l’aide des champs Designation et Age Group. Les statistiques sont calculées à l’aide des mêmes méthodes que celles utilisées dans l’exemple précédent.

La couche en entrée synthétisée à l’aide des champs Designation (Désignation) et Age Group (Tranche d’âge)
La couche en entrée est synthétisée à l’aide des champs Designation et Age Group.

La statistique de total (pour les chaînes et les champs numériques) comptabilise le nombre de valeurs non nulles. Le total des valeurs suivantes est égal à 5 : [0, 1, 10, 5, null, 6] = 5. Le total de ce jeu de valeurs est égal à 3 : [Primary, Primary, Secondary, null] = 3.

Paramètres

Les paramètres de l’outil Synthétiser les attributs sont les suivants :

ParamètreExplicationType de données

Couche en entrée

Entités ponctuelles pour lesquelles la densité sera calculée.

Entités

Fields (Champs) (facultatif)

Un ou plusieurs champs utilisés pour synthétiser des entités similaires. Par exemple, si vous avez choisi un champ nommé PropertyType avec les valeurs commerciales et résidentielles, tous les champs résidentiels sont synthétisés ensemble (les statistiques sont calculées) et tous les champs commerciaux sont synthétisés ensemble.

Si vous choisissez plusieurs champs, chaque combinaison distincte de valeurs est synthétisée avec le résumé statistique calculé. Par exemple, imaginez un premier champ PropertyType avec les valeurs commerciales et résidentielles, et un second champ Occupied avec les valeurs Yes (Oui) ou No (Non). Quatre combinaisons possibles peuvent être synthétisées avec le résumé statistique calculé.

Chaîne

Summary Fields (Champs de récapitulation) (facultatif)

Statistiques qui seront calculées sur les champs spécifiés. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date.

Les types de statistiques disponibles sont les suivants :

  • Any (N’importe lequel) : ceci est un exemple de chaîne provenant d’un champ de type chaîne.
  • Count (Total) : calcule le nombre de valeurs non nulles. Peut être utilisé sur des champs numériques ou des chaînes. Le total de [Null, 0, 2] est égal à 2.
  • Count (distinct) [Total (distinct)] : calcule le nombre de valeurs non nulles distinctes. Peut être utilisé sur des champs numériques ou des chaînes. Le résultat du total distinct de [null, 4, 3, 4] est 2.
  • Sum (Somme) : somme des valeurs numériques dans un champ. La somme de [null, 1, 3] est égale à 4.
  • SUM OF SQUARES (SOMME DES CARRÉS) : somme, sur toutes les observations, des différences au carré de chaque observation par rapport à la moyenne globale. La somme des carrés de [null, 2,2, 3,1, 4,7] est égale à 3,206.
  • Min : valeur minimale d’un champ numérique. La valeur minimale de [0, 2, Null] est égale à 0.
  • Max : valeur maximale d’un champ numérique. La valeur maximale de [0, 2, Null] est égale à 2.
  • Mean (Moyenne) : moyenne des valeurs numériques. La moyenne de [0,2, Null] est égale à 1.
  • Range (Plage) : plage d’un champ numérique. Elle est calculée comme la valeur minimale soustraite de la valeur maximale. La plage de [0, Null, 1] est égale à 1. La plage de [Null, 4] est égale à 0.
  • Variance : variance d’un champ numérique dans une trace. La variance de [1] est la valeur nulle. La variance de [Null, 1,1,1] est égale à 1.
  • Standard Deviation (Écart type) : écart type d’un champ numérique. L'écart type de [1] est la valeur Null. L'écart type de [Null, 1,1,1] est égale à 1.

Chaîne

Couche en sortie

La couche en sortie est une table contenant les champs fournis dans le paramètre Fields (Champs), un attribut COUNT (TOTAL) correspondant au nombre d’entités synthétisées par cet enregistrement, et tout attribut synthétisé comme spécifié dans le paramètre Summary Fields (Champs de récapitulation).