Synthétiser les attributs

Icône d’outil Disponible dans les analyses de Big Data.

L’outil Summarize Attributes (Synthétiser les attributs) permet de synthétiser des valeurs de champs identiques pour générer une table de synthèse. La table en sortie résultante affiche le nombre d’entités synthétisées, ainsi que les statistiques supplémentaires spécifiées.

Diagramme de workflow

Diagramme du processus Summarize Attributes (Synthétiser les attributs)

Exemple

L’exemple suivant illustre un cas d’utilisation de l’outil Summarize Attributes (Synthétiser les attributs).

Les ouragans et les tornades sont les types de tempêtes les plus destructeurs aux États-Unis. Pour comparer leur impact, vous souhaitez analyser les dommages matériels et les pertes financières provoqués par les tornades et les ouragans. Vous pouvez utiliser des données sur les tornades et les ouragans aux États-Unis disponibles dans un jeu de données unique pour afficher une synthèse des valeurs pour tous les ouragans et une autre synthèse pour toutes les tornades. Vous pouvez synthétiser vos données à l’aide du type de tempête pour obtenir les statistiques correspondant à chaque type.

Remarques sur l’utilisation

Gardez les points suivants à l’esprit lorsque vous utilisez l’outil Summarize Attributes (Synthétiser les attributs) :

  • En entrée, vous pouvez utiliser une couche tabulaire ou une couche comportant une géométrie (points, lignes ou surfaces).
  • Vous pouvez utiliser cet outil avec des données spatiales. Néanmoins, le résultat est tabulaire. Vous pouvez ensuite joindre vos résultats à des données spatiales à l’aide de l’outil Join Features (Entités jointes).
  • Cet outil est un outil d’analyse tabulaire, et non un outil d’analyse spatiale. La table en sortie est constituée de champs contenant le résultat de l’opération statistique.
  • Le paramètre Fields (Champs) vous permet de spécifier un ou plusieurs champs pour effectuer la synthèse ou synthétiser toutes les entités. Lorsque vous effectuez la synthèse avec un seul champ, les statistiques sont calculées pour chaque valeur attributaire unique. Lorsque vous effectuez la synthèse avec plusieurs champs, les statistiques sont calculées pour chaque combinaison unique de valeurs attributaires.
  • La table en sortie de cet outil inclut toujours le nombre total d’entités synthétisées.
  • Vous pouvez calculer des statistiques supplémentaires à l’aide du paramètre Summary Fields (Champs de récapitulation). Les statistiques des champs de récapitulation disponibles dépendent du type de champ que vous récapitulez.
    • Un champ attributaire de type chaîne peut utiliser les statistiques Any (Tout), Count (Total) et Count distinct (Total distinct).
    • Un champ attributaire numérique peut utiliser les statistiques Any (Tout), Count (Total), Count distinct (Total distinct), Sum (Somme), Sum of squares (Somme des carrés), Min, Max, Range (Plage), Variance et Standard deviation (Écart type).
    • Un champ attributaire de type date peut utiliser les statistiques Any (Tout), Count (Total), Min, Max et Range (Plage).

Fonctionnement de l’outil Synthétiser les attributs

L’outil Summarize Attributes (Synthétiser les attributs) calcule la variance et synthétise les couches en entrée en groupes avec des valeurs de champ correspondantes. Les équations, les calculs, les paramètres et la table en sortie sont décrits dans les sections ci-dessous.

Equations

La variance est calculée à l’aide de l’équation suivante :

Équation de variance
Variables de variance

L'écart type se calcule en tant que racine carrée de la variance.

Calculs

Les couches en entrée sont synthétisées en groupes avec des valeurs de champs appariées. Puisque les résultats sont tabulaires, vous ne pouvez pas les afficher sur votre carte. Vous pouvez utiliser un type de sortie qui inclut une couche d’entités. Pour plus d’informations sur la table en sortie générée par la couche d’entités, reportez-vous à la section Table en sortie figurant sur cette page.

Les tableaux ci-dessous présentent les calculs statistiques d’une couche synthétisée à l’aide de valeurs de champ similaires. Le champ VO2 a permis de calculer les statistiques numériques (Count [Total], Sum [Somme], Minimum, Maximum, Range [Plage], Mean [Moyenne], Standard Deviation [Écart type] et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count [Total] et Any [Tout]) pour la couche.

Champs de métadonnées de la couche en entrée à synthétiser

Le tableau ci-dessus a été synthétisé en fonction du champ Designation et le champ VO2 a permis de calculer les statistiques numériques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Le champ Rating a permis de calculer les statistiques de chaîne (Count (Total) et Any (Tout)) pour la couche. Il en résulte un tableau comportant deux entités représentant les valeurs distinctes de Designation.

Agrégez les données pour la couche de synthèse à l’aide du champ Designation (Désignation)
Lorsque la couche en entrée est synthétisée à l’aide du champ Designation (Désignation), la somme, les valeurs minimale et maximale sont indiquées.

Le tableau suivant représente les premiers champs lorsque la couche est synthétisée à l’aide des champs Designation et Age Group. Les statistiques sont calculées à l’aide des mêmes méthodes que celles utilisées dans l’exemple précédent.

Synthèse tabulaire des champs Designation (Désignation) et AgeGroup (Tranche d’âge)
La couche en entrée est synthétisée à l’aide des champs Designation et Age Group.

La statistique de total pour les chaînes et les champs numériques comptabilise le nombre de valeurs non nulles. Le total des valeurs suivantes est égal à 5 : [0, 1, 10, 5, Null, 6] = 5. Le total de ce jeu de valeurs est égal à 3 : [Primary, Primary, Secondary, Null] = 3.

Paramètres

Les paramètres de l’outil Synthétiser les attributs sont décrits ci-dessous :

ParamètreExplicationType de données

Couche en entrée

Entités ponctuelles pour lesquelles la densité est calculée.

Entités

Fields (Champs) (facultatif)

Champs utilisés pour synthétiser des entités similaires. Vous pouvez utiliser un seul champ ou plusieurs champs. Par exemple, si vous choisissez un champ nommé PropertyType qui inclut les valeurs Commercial et Residential, tous les champs résidentiels sont synthétisés ensemble, les champs commerciaux sont synthétisés séparément et les résumés statistiques sont calculés pour chaque groupe.

Si vous choisissez plusieurs champs, chaque combinaison distincte de valeurs est synthétisée et les résumés statistiques sont calculés pour ces combinaisons. Par exemple, imaginez un premier champ appelé PropertyType avec les valeurs Commercial et Residential, et un second champ appelé Occupied qui inclut les valeurs Yes et No. Il existe quatre combinaisons pouvant être synthétisées. Les résumés statistiques sont calculés séparément pour chacun de ces quatre groupes.

Chaîne

Summary fields (Champs de récapitulation) (facultatif)

Statistiques calculées pour les champs spécifiés. Les statistiques disponibles varient selon que le type de champ est une chaîne, une valeur numérique ou une date.

Les types de statistiques disponibles sont les suivants :

  • Any (Tout) : exemple de chaîne extraite d’un champ contenant des valeurs de chaîne.
  • Count (Total) : calcule le nombre de valeurs non nulles. Ce type peut être utilisé pour les champs contenant des valeurs numériques ou de type chaîne. Le total de [Null, 0, 2] est égal à 2.
  • Count Distinct (Total distinct) : calcule le nombre de valeurs non nulles distinctes. Ce type peut être utilisé pour les champs contenant des valeurs numériques ou de type chaîne. Le résultat du total distinct de [Null, 4, 3, 4] est 2.
  • Sum (Somme) : somme des valeurs numériques dans un champ. La somme de [Null, 1, 3] est égale à 4.
  • Sum of squares (Somme des carrés) : calcule la somme des différences au carré de chaque observation par rapport à la moyenne globale. La somme des carrés de [Null, 2,2, 3,1, 4,7] est égale à 3,206.
  • Min : valeur minimale d’un champ numérique. La valeur minimale de [0, 2, Null] est égale à 0.
  • Max : valeur maximale d’un champ numérique. La valeur maximale de [0, 2, Null] est égale à 2.
  • Mean (Moyenne) : moyenne des valeurs numériques. La moyenne de [0, 2, Null] est égale à 1.
  • Range (Plage) : plage d’un champ numérique. Elle est calculée comme la valeur minimale soustraite de la valeur maximale. La plage de [0, Null, 1] est égale à 1 tandis que la plage de [Null, 4] est égale à 0.
  • Variance : variance d’un champ numérique dans une trace. La variance de [1] est la valeur Null. La variance de [Null, 1,1,1] est égale à 1.
  • Standard deviation (Écart type) : écart type d’un champ numérique. L’écart type de [1] est la valeur Null. L’écart type de [Null, 1,1,1] est égale à 1.

Chaîne

Table en sortie

La sortie de cet outil est une table contenant les champs fournis dans le paramètre Fields (Champs), un attribut du total correspondant au nombre d’entités synthétisées par cet enregistrement, et tout attribut synthétisé comme spécifié dans le paramètre Summary fields (Champs de récapitulation).

Si une couche d’entités spatio-temporelle est utilisée comme type de sortie, une couche d’entités spatio-temporelle ainsi qu’une couche d’images de carte sont créées. Si une couche d’entités hébergée ArcGIS Online est utilisée comme type de sortie, la table en sortie est une table (hébergée).