Agréger les points

Icône d’outil Disponible dans les analyses de Big Data.

L’outil Aggregate Points (Agréger les points) collecte et synthétise des entités ponctuelles dans des entités surfaciques. Les limites des entités surfaciques permettent de collecter les points dans chaque surface et de les utiliser pour calculer des statistiques. La couche résultante contient le nombre de points dans chaque surface, ainsi que des calculs synthétiques.

Diagramme de workflow

Points agrégés en groupes dans les entités surfaciques

Exemple

L’exemple suivant illustre un cas d’utilisation de l’outil :

Les tornades sont un type de tempêtes violentes qui se produisent aux Etats-Unis. Vous voulez connaître les effets des tornades, notamment la perte de vies humaines, les blessures, les dommages matériels et les pertes financières, dans chaque état et chaque comté. Vous pouvez accéder aux lieux où se produisent les tornades, mais vous souhaitez mieux visualiser les données comprises dans certaines surfaces. Vous pouvez agréger les données sur les tornades dans les limites des États et des comtés, puis normaliser les données en fonction de la population pour identifier les zones les plus affectées par les tornades.

Remarques sur l’utilisation

Gardez les points suivants à l’esprit lorsque vous utilisez l’outil :

  • La couche en sortie est toujours une couche surfacique. Seuls les entités ou les groupes de polygones contenant des points sont renvoyés.
  • Vous pouvez fournir la couche surfacique pour l’analyse ou générer des groupes d’une taille et d’une forme (hexagonale ou carrée) spécifiques, dans lesquels réaliser l’agrégation. La taille des groupes détermine leur ampleur. Si vous optez pour l’agrégation dans des hexagones, la taille correspond à la hauteur de chaque hexagone et la largeur de l’hexagone obtenu est de deux fois la hauteur divisée par la racine carrée de 3. Si vous optez pour l'agrégation dans des carrés, la taille des groupes correspond à la hauteur du carré, qui est égale à la largeur.

    Calcul de hauteur de groupe hexagonal Agréger les points pour les groupes hexagonaux et carrés

  • Si la dimension temporelle est activée sur les données cibles, vous pouvez appliquer des intervalles temporels à l’analyse.
  • Les agrégations les plus élémentaires calculent le nombre de points dans chaque surface. Les statistiques dont Count (Total), Sum (Somme), Min, Max, Range (Plage), Mean (Moyenne), Standard deviation (Écart type) et Variance peuvent être calculées dans des champs numériques et les statistiques telles que Count (Total), Any (Tout) peuvent être calculées dans des champs de type chaîne. Les statistiques sont calculées séparément dans chaque surface.

    Voici des valeurs de renvoi d’exemple :

    • Lorsque Count (Total) est appliqué à un champ, il renvoie le total des valeurs non nulles présentes dans le champ.
    • Lorsque Any (Tout) est appliqué à un champ de type chaîne, il renvoie une seule chaîne présente dans le champ.
  • L’outil Aggregate Points (Agréger les points) vous permet d’effectuer des analyses à l’aide d’intervalles temporels. Chaque intervalle temporel est analysé indépendamment des entités en dehors de l’intervalle temporel. Pour utiliser des intervalles temporels, les données cibles doivent être temporelles et représenter un instant dans le temps. Lorsque des intervalles temporels sont utilisés, les entités en sortie sont des intervalles temporels représentés par les champs StartTime et EndTime.
  • Si vous spécifiez l’option d’intervalle temporel Interval (Intervalle), Repeat (Répétition) ou Alignment (Alignement) et que le temps n’est pas activé sur les données, une erreur se produit à l’exécution de l’outil.
  • Les options d’intervalle temporel peuvent être une valeur de date et d’heure ou une valeur de date uniquement, mais pas une valeur d’heure uniquement.
  • L’outil Aggregate Points (Agréger les points) exige que les données cibles soient projetées ou que les données cibles soient définies sur un système de coordonnées projetées. Si les données cibles ne sont pas dans un système de coordonnées projetées et que vous n’en définissez pas un, l’outil applique automatiquement le système de coordonnées projetées World Cylindrical Equal Area aux données que vous analysez.

Paramètres

Les paramètres de l’outil sont les suivants :

ParamètreDescriptionType de données

Données cibles

Les entités ponctuelles qui sont agrégées dans des groupes ou des polygones.

Entités

Joindre des données

(facultatif)

Entités surfaciques avec lesquelles les données cibles sont agrégées. Une source de données de jointure est nécessaire pour agréger les données dans des polygones.

Entités

Agréger les points dans

Indique comment les données cibles seront agrégées. Les options sont les suivantes

  • Bins (Groupes) : les données cibles seront agrégées dans des groupes carrés ou hexagonaux. Le paramètre Target data (Données cibles) est nécessaire pour cette option.
  • Polygons (Polygones) : les données cibles seront agrégées dans des polygones à partir des données de jointure. Le paramètre Join data (Données de jointure) est nécessaire pour cette option.

Chaîne

Type de groupe

(facultatif)

Forme de groupe utilisée pour créer les groupes. Les options sont Square (Carré) (par défaut) et Hexagon (Hexagone).

Si une source est connectée au port de jointure, ce paramètre n’est pas disponible.

Remarque :

Ce paramètre est seulement disponible si le paramètre Aggregate points into (Polygon or Bin) (Agréger des points dans [Polygone ou Groupe]) est défini sur Bins (Groupes).

Chaîne

Taille du groupe

(facultatif)

Intervalle de distance qui représente la taille du groupe dans lequel les données cibles seront agrégées. Pour les groupes carrés, la taille du groupe représente la hauteur du carré. Pour les groupes hexagonaux, la taille du groupe représente la hauteur entre deux côtés parallèles.

Si une source est connectée au port de jointure, ce paramètre n’est pas disponible.

Remarque :

Ce paramètre est seulement disponible si le paramètre Aggregate points into (Polygon or Bin) (Agréger des points dans [Polygone ou Groupe]) est défini sur Bins (Groupes).

Chaîne

Interval (Intervalle) (facultatif)

Durée de l’intervalle temporel.

Utilisez cette option seulement si les données cibles sont des données temporelles représentant des instants.

Découvrir le fonctionnement des intervalles temporels

Chaîne

Repeat (Fréquence de répétition) (facultatif)

Spécifie la fréquence de l'intervalle de temps.

Utilisez cette option seulement si les données cibles sont des données temporelles représentant des instants.

Chaîne

Alignement

(facultatif)

Heure de référence sur laquelle aligner les intervalles temporels. La valeur par défaut est le 1er janvier 1970 à 12 h 00. Cochez la case de ce paramètre pour sélectionner une plage de date et d’heure.

Utilisez cette option seulement si les données cibles sont des données temporelles représentant des instants.

Entier 64 bits

Summary fields (Champs de récapitulation) (facultatif)

Statistiques qui seront calculées sur les champs spécifiés. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date.

  • Any (Tout) : calcule une chaîne d’exemple provenant d’un champ de type chaîne.
  • Count (Total) : calcule le nombre de valeurs non nulles. Peut être utilisé sur des champs numériques ou des chaînes. Le total de [Null, 0, 2] est égal à 2.
  • Count (distinct) (Total [distinct]) : calcule le nombre de valeurs non nulles distinctes. Peut être utilisé sur des champs numériques ou des chaînes. Le résultat du total distinct de [null, 4, 3, 4] est 2.
  • Sum (Somme) : calcule la somme des valeurs numériques dans un champ. La somme de [null, 1, 3] est égale à 4.
  • Square Sum (Somme carrée) : calcule la somme des différences au carré entre chaque observation et la moyenne globale. La somme des carrés de [null, 2,2, 3,1, 4,7] est égale à 3,206.
  • Min : calcule la valeur minimale d’un champ numérique. La valeur minimale de [0, 2, Null] est égale à 0.
  • Max : calcule la valeur maximale d’un champ numérique. La valeur maximale de [0, 2, Null] est égale à 2.
  • Mean (Moyenne) : calcule la moyenne des valeurs numériques. La moyenne de [0,2, Null] est égale à 1.
  • Range (Plage) : calcule la plage d’un champ numérique en soustrayant la valeur minimale de la valeur maximale. La plage de [0, Null, 1] est égale à 1. La plage de [Null, 4] est égale à 0.
  • Variance : calcule la variance d’un champ numérique dans une trace. La variance de [1] est la valeur nulle. La variance de [Null, 1,1,1] est égale à 1.
  • Standard deviation (Écart type) : calcule l’écart type d’un champ numérique. L'écart type de [1] est la valeur Null. L'écart type de [Null, 1,1,1] est égale à 1.

Chaîne

Couche en sortie

La couche en sortie contient tous les champs d’origine des entités surfaciques et le champ COUNT. Le champ COUNT représente le nombre d’entités ponctuelles issues des données cibles agrégées dans cette entité surfacique. Le type de données du champ COUNT est Flottant 64 bits. Si vous configurez des champs de récapitulation, ceux-ci sont également calculés pour la couche en sortie.

Considérations et limitations

L’outil Aggregate Points (Agréger les points) ne permet pas d’agréger des lignes et des polygones dans les limites.