L’agrégation spatiale permet de calculer des statistiques là où se superposent une couche en entrée et une couche de limite.
Exemple
L’analyste d’un consortium d’établissements d’enseignement supérieur effectue des recherches dans le cadre d’une campagne marketing dans des États accueillant des universités réputées. Il souhaite savoir quels États comptent le plus d’universités avec un retour sur investissement (ROI) élevé. Dans ce cas de figure, l’agrégation spatiale permet d’agréger les universités dans des États afin de rechercher le nombre d’universités dont le ROI est supérieur à la moyenne.
Exécuter l’agrégation spatiale
L’agrégation spatiale peut être utilisée sur les cartes comportant deux couches : une couche de zone avec les limites qui seront utilisées pour l’agrégation (par exemple, les comtés, les secteurs de recensement ou les districts de police) et une couche à agréger.
Procédez comme suit pour calculer les statistiques spatiales :
- Le cas échéant, cliquez sur la fiche de carte pour l’activer.
Une fiche est active lorsque la barre d'outils et le bouton Action apparaissent.
- Cliquez sur le bouton Action et sélectionnez Spatial Aggregation (Agrégation spatiale).
- Pour Choose area layer (Choisir une couche surfacique), sélectionnez la couche de limites et pour Choose layer to summarize (Choisir la couche à synthétiser), sélectionnez la couche à agréger.
- Pour Style by (Styliser par), sélectionnez le champ ou la statistique à calculer et afficher.
- Vous pouvez également utiliser Additional options (Options supplémentaires) pour sélectionner d’autres champs et statistiques.
- Cliquez sur Run (Exécuter).
Conseil :
Il est également possible d’exécuter l’agrégation spatiale en faisant glisser un jeu de données dans la zone de déplacement Spatial aggregation (Agrégation spatiale) sur une carte existante.
Remarques sur l’utilisation
Utilisez les paramètres Choose area layer (Choisir une couche surfacique) et Choose layer to summarize (Choisir la couche à synthétiser) pour sélectionner la couche de limites et la couche à synthétiser. Pour le paramètre Choose area layer (Choisir une couche surfacique), seules les couches dotées d’entités surfaciques sont disponibles.
Utilisez le paramètre Style by (Styliser par) pour modifier la statistique en cours de calcul. Les statistiques par défaut dépendent du type de couche synthétisée. Utilisez le menu déroulant pour sélectionner une autre option de style. La table suivante synthétise les options Style By (Styliser par) pour chaque type de couche :
Récapitulatif des types de couche | Options de style par défaut | Autres options de style |
---|---|---|
Point | Effectif | Champ numérique ou taux/ratio (somme, minimum, maximum, moyenne ou mode) Champs de type chaîne (mode) |
Ligne | Champ numérique (somme) ou taux/ratio (moyenne) | Champ numérique ou taux/ratio (somme, minimum, maximum, moyenne ou mode) Champs de type chaîne (mode) Somme de la longueur (mètres, kilomètres, pieds, ou miles) |
Surface | Champ numérique (somme) ou taux/ratio (moyenne) | Champ numérique ou taux/ratio (somme, minimum, maximum, moyenne ou mode) Champs de type chaîne (mode) Somme de la surface (mètres carrés, kilomètres carrés, pieds carrés, ou miles carrés) |
Remarque :
Il est recommandé d’utiliser des nombres plutôt que des taux ou ratios pour calculer les statistiques des lignes et surfaces afin que les calculs proportionnels aient une signification logique. Pour en savoir plus, reportez-vous à la section Fonctionnement de l’agrégation spatiale ci-dessous.
Vous pouvez développer le paramètre Additional options (Autres options) et attribuer des statistiques supplémentaires. Chaque fois qu’un champ est ajouté à la liste des résumés statistiques, un nouveau champ apparaît dessous.
Limitations
Lorsque vous effectuez une agrégation spatiale ou un filtrage spatial sur des données issues de la même connexion de base de données, vous devez vous assurer que toutes les données sont stockées dans le même système de référence spatiale. Pour les jeux de données provenant de SQL Server, les données doivent en outre être de même type (géographie ou géométrie).
Les limitations suivantes s’appliquent pour Google BigQuery, Snowflake et les plateformes de base de données non prises en charge de façon immédiate :
- L’agrégation spatiale qui utilise des entités linéaires et surfaciques comme paramètre Choose a layer to summarize (Choisir une couche à synthétiser) n’est pas prise en charge pour les connexions en lecture seule.
- Les deux couches en entrée doivent provenir de la même connexion à la base de données.
Google BigQuery ne prend pas en charge les calculs de mode.
Fonctionnement de l'agrégation spatiale
Les statistiques de moyenne sont calculées à l’aide de la moyenne pondérée pour les entités linéaires et surfaciques. L’équation suivante est utilisée pour calculer la moyenne pondérée :
où : N = nombre d’observations xi = observations Wi = pondérations
Points
Les couches de points sont synthétisées uniquement à l'aide d'entités ponctuelles de la limite en entrée. Aucun des calculs n’est pondéré.
La figure et la table ci-dessous expliquent les calculs statistiques d’une couche de points dans une limite hypothétique. Le champ Population a permis de calculer les statistiques numériques (total, somme, minimum, maximum et moyenne) et le champ Type a permis de calculer le mode.
Terrain | Statistique | Résultat pour le secteur A | Résultat pour le secteur B |
---|---|---|---|
Population | Effectif | 6 | 6 |
Somme |
|
| |
Minimum | Minimum de :
| Minimum de :
| |
Maximum | Maximum de :
| Maximum de :
| |
Moyenne |
|
| |
Type | Mode | École primaire | École primaire |
Cette analyse peut être utilisée concrètement pour déterminer le nombre total d’élèves dans chaque circonscription scolaire. Chaque point représente une école. Le champ Type indique le type d’école (élémentaire, primaire ou secondaire) et le champ Population indique le nombre d’élèves inscrits dans chaque école. Les calculs et les résultats sont indiqués dans la table ci-dessus. Les résultats indiquent que la circonscription A compte 2 568 élèves et la circonscription B 3 400 élèves.
Lignes
Les couches linéaires sont synthétisées numériquement uniquement à l’aide des proportions des entités linéaires qui se trouvent dans la limite en entrée. Lors de la synthétisation des lignes, utilisez des champs avec des totaux et des montants (et non des taux ou des ratios) afin que les calculs proportionnels aient une signification logique dans l’analyse. Les résultats s’affichent à l’aide de symboles gradués.
Le mode des couches linéaires repose sur le nombre total d’entités qui intersectent la limite. Il n’est pas nécessaire que les lignes soient entièrement contenues dans une limite pour qu’elles soient comptabilisées dans le mode. Chaque ligne est considérée comme une valeur unique, quelle que soit la proportion contenue dans la limite. Les résultats s’affichent à l’aide de symboles uniques.
La figure et la table ci-dessous illustrent les calculs statistiques d’une couche de lignes dans une limite hypothétique. Le volume a permis de calculer les statistiques (somme, minimum, maximum et moyenne) pour la couche. Les statistiques sont calculées à l'aide de la proportion des lignes comprises dans la limite. Le mode est calculé pour le type d’entité hydrographique.
Statistique | Terrain | Résultat |
---|---|---|
Somme de la longueur | Longueur |
Remarque :La longueur peut également être calculée en pieds, mètres et kilomètres. |
Somme | Volume |
|
Minimum | Minimum de :
| |
Maximum | Maximum de :
| |
Moyenne |
| |
Mode | Type | Rivière |
Cette analyse peut être utilisée concrètement pour déterminer le volume total d’eau des rivières comprises dans les limites d’un parc national. Chaque ligne représente une rivière qui coule partiellement dans le parc. Les résultats montrent que les rivières coulent sur huit kilomètres (6,5 miles) dans le parc et que le volume total est de 1 200 unités.
Zones
Les couches de surfaces sont synthétisées uniquement à l’aide des proportions des entités surfaciques comprises dans la limite en entrée. Lors de la synthétisation des surfaces, utilisez des champs avec des totaux et des montants (et non des taux ou des ratios) afin que les calculs proportionnels aient une signification logique dans l’analyse. Les résultats s’affichent à l’aide de couleurs graduées.
Le mode des couches surfaciques repose sur le nombre total d’entités qui intersectent la limite. Il n’est pas nécessaire que les surfaces soient entièrement contenues dans une limite pour qu’elles soient comptabilisées dans le mode. Chaque surface est considérée comme une valeur unique, quelle que soit la proportion contenue dans la limite. Les résultats s’affichent à l’aide de symboles uniques.
La figure et la table ci-dessous illustrent les calculs statistiques d’une couche de surfaces dans une limite hypothétique. Les populations ont permis de calculer les statistiques (somme, minimum, maximum et moyenne) pour la couche. Les statistiques sont calculées à l'aide de la proportion de la surface comprise dans la limite. Le mode est calculé à l’aide de la désignation des segments Tapestry pour chaque surface.
Statistique | Terrain | Résultat |
---|---|---|
Somme de la surface | Surface |
Remarque :La surface peut également être calculée en pieds carrés, mètres carrés et kilomètres carrés. |
Somme | Population |
|
Minimum | Minimum de :
| |
Maximum | Maximum de :
| |
Moyenne |
| |
Mode | Segment | Segment 2 |
Cette analyse peut être utilisée concrètement pour déterminer la population d’un voisinage urbain. Le contour bleu représente la limite du voisinage et les zones plus petites représentent des îlots de recensement. Les résultats montrent que le voisinage regroupe 10 841 personnes et que chaque îlot de recensement compte environ 2 666 personnes en moyenne.
Vous avez un commentaire à formuler concernant cette rubrique ?