L’agrégation spatiale permet de calculer des statistiques là où se superposent une couche en entrée et une couche de limite.
Exemple
L’analyste d’un consortium d’établissements d’enseignement supérieur effectue des recherches dans le cadre d’une campagne marketing dans des États accueillant des universités réputées. Il souhaite savoir quels États comptent le plus d’universités avec un retour sur investissement (ROI) élevé. Dans ce cas de figure, l’agrégation spatiale permet d’agréger les universités dans des États afin de rechercher le nombre d’universités dont le ROI est supérieur à la moyenne.
Utilisation de l’outil Spatial Aggregation (Agrégation spatiale)
L’agrégation spatiale peut être utilisée sur les cartes comportant deux couches : une couche de zone avec les limites qui seront utilisées pour l’agrégation (par exemple, les comtés, les secteurs de recensement ou les districts de police) et une couche à agréger.
Procédez comme suit pour exécuter l’outil Spatial Aggregation (Agrégation spatiale) :
- Le cas échéant, cliquez sur la fiche de carte pour l’activer. Une fiche est active lorsque la barre d'outils et le bouton Action apparaissent.
- Cliquez sur le bouton Action, puis sélectionnez Spatial Aggregation (Agrégation spatiale).
- Pour Choose area layer (Choisir une couche surfacique), sélectionnez la couche de limite. Pour Choose layer to summarize (Choisir la couche à synthétiser), sélectionnez la couche à agréger.
- Pour Style by (Styliser par), sélectionnez le champ ou la statistique que vous souhaitez calculer et afficher. Utiliser Additional options (Options supplémentaires) pour sélectionner d’autres champs et statistiques, si nécessaire.
- Cliquez sur Run (Exécuter).
Conseil :
L’agrégation spatiale peut aussi être exécutée en faisant glisser un jeu de données dans la zone de déplacement Spatial aggregation (Agrégation spatiale) sur une carte existante.
Remarques sur l’utilisation
Les paramètres Choose area layer (Choisir une couche surfacique) et Choose layer to summarize (Choisir la couche à synthétiser) permettent de sélectionner la couche de limites et la couche à synthétiser. Pour le paramètre Choisir une couche surfacique, seules les couches dotées d’entités surfaciques sont disponibles.
Le paramètre Style by (Styliser par) permet de modifier la statistique en cours de calcul. Les statistiques par défaut dépendent du type de couche synthétisée. Le menu déroulant peut être utilisé pour sélectionner une autre option de style. La table suivante synthétise les options Style By (Styliser par) pour chaque type de couche :
Récapitulatif des types de couche | Options de style par défaut | Autres options de style |
---|---|---|
Point | Effectif | Champ numérique ou taux/ratio (somme, minimum, maximum, moyenne ou mode) Champs de type chaîne (mode) |
Ligne | Champ numérique (somme) ou taux/ratio (moyenne) | Champ numérique ou taux/ratio (somme, minimum, maximum, moyenne ou mode) Champs de type chaîne (mode) Somme de la longueur (mètres, kilomètres, pieds, ou miles) |
Surface | Champ numérique (somme) ou taux/ratio (moyenne) | Champ numérique ou taux/ratio (somme, minimum, maximum, moyenne ou mode) Champs de type chaîne (mode) Somme de la surface (mètres carrés, kilomètres carrés, pieds carrés, ou miles carrés) |
Remarque :
Il est recommandé d’utiliser un champ numérique plutôt que taux/ratios pour calculer les statistiques des lignes et surfaces afin que les calculs proportionnels aient une signification logique. Pour en savoir plus, reportez-vous à la rubrique Fonctionnement de l'agrégation spatiale.
Le paramètre Additional options (Options supplémentaires) peut être développé et d’autres statistiques attribuées. Chaque fois qu'un champ est ajouté à la liste des statistiques de synthèse, un nouveau champ apparaît dessous.
Limitations
Lorsque vous effectuez une agrégation spatiale ou un filtrage spatial sur des données issues de la même connexion de base de données, vous devez vous assurer que toutes les données sont stockées dans le même système de référence spatiale. Pour les jeux de données provenant de SQL Server, les données doivent en outre être de même type (géographie ou géométrie).
Les limitations suivantes s’appliquent pour Google BigQuery, Snowflake et les plateformes de base de données non prises en charge de façon immédiate :
- L’agrégation spatiale qui utilise des entités linéaires et surfaciques comme paramètre Choose a layer to summarize (Choisir une couche à synthétiser) n’est pas prise en charge pour les connexions en lecture seule.
- Les deux couches en entrée doivent provenir de la même connexion à la base de données.
Google BigQuery ne prend pas en charge les calculs de mode.
Fonctionnement de l'agrégation spatiale
Les statistiques de moyenne sont calculées à l’aide de la moyenne pondérée pour les entités linéaires et surfaciques. L’équation suivante est utilisée pour calculer la moyenne pondérée :
où : N = nombre d’observations xi = observations Wi = pondérations
Points
Les couches de points sont synthétisées uniquement à l'aide d'entités ponctuelles de la limite en entrée. Par conséquent, aucun des calculs n’est pondéré.
La figure et la table ci-dessous expliquent les calculs statistiques d'une couche de points dans une limite hypothétique. Le champ Population a permis de calculer les statistiques numériques (total, somme, minimum, maximum et moyenne) et le champ Type a permis de calculer le mode.
Terrain | Statistique | Résultat pour le secteur A | Résultat pour le secteur B |
---|---|---|---|
Population | Effectif | 6 | 6 |
Somme |
|
| |
Minimum | Minimum de :
| Minimum de :
| |
Maximum | Maximum de :
| Maximum de :
| |
Moyenne |
|
| |
Type | Mode | École primaire | École primaire |
Cette analyse peut être utilisée concrètement pour déterminer le nombre total d'étudiants dans chaque secteur scolaire. Chaque point représente une école. Le champ Type indique le type d'école (élémentaire, primaire ou secondaire) et le champ indiquant la population étudiante correspond au nombre d'étudiants inscrits dans chaque école. Les calculs et les résultats sont indiqués dans la table ci-dessus. Les résultats indiquent que le secteur A compte 2 568 étudiants et le secteur B 3 400 étudiants.
Lignes
Les couches linéaires sont synthétisées numériquement uniquement à l’aide des proportions des entités linéaires qui se trouvent dans la limite en entrée. Lors de la synthétisation des lignes, utilisez des champs avec des totaux et des montants (et non des taux ou des ratios) afin que les calculs proportionnels aient une signification logique dans votre analyse. Les résultats s’affichent à l’aide de symboles gradués.
Le mode des couches linéaires repose sur le nombre total d’entités qui intersectent la limite. Il n’est pas nécessaire que les lignes soient entièrement contenues dans une limite pour qu’elles soient comptabilisées dans le mode. Chaque ligne est considérée comme une valeur unique, quelle que soit la proportion contenue dans la limite. Les résultats s’affichent à l’aide de symboles uniques.
La figure et la table ci-dessous expliquent les calculs statistiques d'une couche de lignes dans une limite hypothétique. Le volume a permis de calculer les statistiques (somme, minimum, maximum et moyenne) pour la couche. Les statistiques sont calculées à l'aide de la proportion des lignes comprises dans la limite. Le mode est calculé pour le type d’entité hydrographique.
Statistique | Terrain | Résultat |
---|---|---|
Somme de la longueur | Longueur |
Remarque :La longueur peut également être calculée en pieds, mètres et kilomètres. |
Somme | Volume |
|
Minimum | Minimum de :
| |
Maximum | Maximum de :
| |
Moyenne |
| |
Mode | Type | Rivière |
Cette analyse peut être utilisée concrètement pour déterminer le volume total d'eau des rivières comprises dans les limites d'un parc national. Chaque ligne représente une rivière qui coule partiellement dans le parc. Les résultats montrent que les rivières coulent sur huit kilomètres (6,5 miles) dans le parc et que le volume total est de 1 200 unités.
Zones
Les couches de surfaces sont synthétisées uniquement à l’aide des proportions des entités surfaciques comprises dans la limite en entrée. Lors de la synthétisation des surfaces, utilisez des champs avec des totaux et des montants (et non des taux ou des ratios) afin que les calculs proportionnels aient une signification logique dans votre analyse. Les résultats s’affichent à l’aide de couleurs graduées.
Le mode des couches surfaciques repose sur le nombre total d’entités qui intersectent la limite. Il n’est pas nécessaire que les surfaces soient entièrement contenues dans une limite pour qu’elles soient comptabilisées dans le mode. Chaque surface est considérée comme une valeur unique, quelle que soit la proportion contenue dans la limite. Les résultats s’affichent à l’aide de symboles uniques.
La figure et la table ci-dessous expliquent les calculs statistiques d'une couche de surfaces dans une limite hypothétique. Les populations ont permis de calculer les statistiques (somme, minimum, maximum et moyenne) pour la couche. Les statistiques sont calculées à l'aide de la proportion de la surface comprise dans la limite. Le mode est calculé à l’aide de la désignation des segments Tapestry pour chaque surface.
Statistique | Terrain | Résultat |
---|---|---|
Somme de la surface | Surface |
Remarque :La surface peut également être calculée en pieds carrés, mètres carrés et kilomètres carrés. |
Somme | Population |
|
Minimum | Minimum de :
| |
Maximum | Maximum de :
| |
Moyenne |
| |
Mode | Segment | Segment 2 |
Cette analyse peut être utilisée concrètement pour déterminer la population d'un voisinage urbain. Le contour bleu représente la limite du voisinage et les zones plus petites représentent des îlots de recensement. Les résultats montrent que le voisinage regroupe 10 841 personnes et que chaque îlot de recensement compte environ 2 666 personnes en moyenne.
Vous avez un commentaire à formuler concernant cette rubrique ?