Disponible dans les analyses de Big Data.
L'outil Summarize Attributes (Synthétiser les attributs) permet de synthétiser des valeurs de champs identiques pour générer une table de synthèse. La couche résultante affiche le nombre d’entités synthétisées, ainsi que les statistiques supplémentaires spécifiées.
Diagramme de workflow
Exemple
Les ouragans et les tornades sont les types de tempêtes les plus destructeurs aux États-Unis. Vous souhaitez analyser les dommages matériels et les pertes financières provoqués par les tornades et les ouragans pour comparer leur impact. Vous pouvez utiliser des données sur les tornades et les ouragans aux États-Unis disponibles dans un jeu de données unique pour afficher une synthèse des valeurs pour tous les ouragans et une autre synthèse pour toutes les tornades. Vous pouvez synthétiser vos données à l’aide du type de tempête pour obtenir les statistiques correspondant à chaque type.
Remarques sur l’utilisation
Gardez les points suivants à l’esprit lorsque vous utilisez l’outil Synthétiser les attributs :
- En entrée, vous pouvez utiliser une couche tabulaire ou une couche comportant une géométrie (points, lignes ou surfaces).
- Vous pouvez utiliser cet outil avec des données spatiales. Néanmoins, le résultat est tabulaire. Vous pouvez ensuite joindre vos résultats à des données spatiales à l’aide de l’outil Join Features (Entités jointes).
- Cet outil est un outil d’analyse tabulaire, et non un outil d’analyse spatiale. La Table en sortie est constituée de champs contenant le résultat de l'opération statistique.
- Le paramètre Fields (Champs) vous permet éventuellement de spécifier un ou plusieurs champs pour effectuer la synthèse ou synthétiser toutes les entités. Lorsque vous effectuez la synthèse avec un seul champ, les statistiques sont calculées pour chaque valeur attributaire unique. Lorsque vous effectuez la synthèse avec plusieurs champs, les statistiques sont calculées pour chaque combinaison unique de valeurs attributaires.
- La sortie de cet outil inclut toujours le nombre total d’entités synthétisées.
- Vous pouvez calculer des statistiques supplémentaires à l’aide du paramètre Summary Fields (Champs de récapitulation). Les statistiques des champs de récapitulation disponibles dépendent du type de champ que vous récapitulez. Un champ attributaire de type chaîne peut utiliser les statistiques any (tout), count (total) et count distinct (total distinct). Un champ attributaire numérique peut utiliser les statistiques any (tout), count (total), count distinct (total distinct), sum (somme), sum of squares (somme des carrés), min, max, range (plage), variation et standard deviation (écart type). Un champ attributaire de type date peut utiliser les statistiques any (tout), count (total), min, max et range (plage).
Fonctionnement de l’outil Synthétiser les attributs
La section suivante décrit le fonctionnement de l’outil Summarize Attributes (Synthétiser les attributs).
Equations
La variance est calculée à l’aide de l’équation suivante :
L'écart type se calcule en tant que racine carrée de la variance.
Calculs
Les couches en entrée sont synthétisées en groupes avec des valeurs de champs appariées. Puisque les résultats sont tabulaires, vous ne pouvez pas les afficher sur votre carte.
Les tableaux ci-dessous présentent les calculs statistiques d’une couche synthétisée à l’aide de valeurs de champ identiques. Le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche.
Le tableau ci-dessus a été synthétisé en fonction du champ Designation et le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche. Il en résulte un tableau comportant deux entités représentant les valeurs distinctes de Designation.
Le tableau suivant représente les premiers champs lorsque la couche est synthétisée à l’aide des champs Designation et Age Group. Les statistiques sont calculées à l’aide des mêmes méthodes que celles utilisées dans l’exemple précédent.
La statistique de total (pour les chaînes et les champs numériques) comptabilise le nombre de valeurs non nulles. Le total des valeurs suivantes est égal à 5 : [0, 1, 10, 5, null, 6] = 5. Le total de ce jeu de valeurs est égal à 3 : [Primary, Primary, Secondary, null] = 3.
Paramètres
Les paramètres de l’outil Synthétiser les attributs sont les suivants :
Paramètre | Explication | Type de données |
---|---|---|
Couche en entrée | Entités ponctuelles pour lesquelles la densité sera calculée. | Entités |
Fields (Champs) (facultatif) | Un ou plusieurs champs utilisés pour synthétiser des entités similaires. Par exemple, si vous avez choisi un champ nommé PropertyType avec les valeurs commerciales et résidentielles, tous les champs résidentiels sont synthétisés ensemble (les statistiques sont calculées) et tous les champs commerciaux sont synthétisés ensemble. Si vous choisissez plusieurs champs, chaque combinaison distincte de valeurs est synthétisée avec le résumé statistique calculé. Par exemple, imaginez un premier champ PropertyType avec les valeurs commerciales et résidentielles, et un second champ Occupied avec les valeurs Yes (Oui) ou No (Non). Quatre combinaisons possibles peuvent être synthétisées avec le résumé statistique calculé. | Chaîne |
Summary Fields (Champs de récapitulation) (facultatif) | Statistiques qui seront calculées sur les champs spécifiés. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date. Les types de statistiques disponibles sont les suivants :
| Chaîne |
Couche en sortie
La couche en sortie est une table contenant les champs fournis dans le paramètre Fields (Champs), un attribut COUNT (TOTAL) correspondant au nombre d’entités synthétisées par cet enregistrement, et tout attribut synthétisé comme spécifié dans le paramètre Summary Fields (Champs de récapitulation).
Vous avez un commentaire à formuler concernant cette rubrique ?