Disponible dans les analyses de Big Data.
L’outil Summarize Within (Synthétiser - A l’intérieur) permet de calculer des statistiques là où une couche en entrée se trouve à l’intérieur d’une couche de contours ou se superpose à celle-ci. La zone qui est synthétisée peut être une couche surfacique ou un groupe hexagonal ou carré.
Diagramme de workflow
Exemples
Vous trouverez ci-dessous des exemples d’utilisation de l’outil Synthétiser - À l’intérieur :
- Un câblo-opérateur lance un programme pilote permettant à des étudiants à faibles revenus de bénéficier d’un accès à Internet à faible coût. L’outil Summarize Within by bins (Synthétiser - À l’intérieur par groupes) peut servir à déterminer le nombre d’étudiants à faibles revenus dans des groupes carrés d’une taille définie afin que le câblo-opérateur puisse identifier une région pertinente pour son programme pilote.
- Afin de mener à bien et de manière efficace les projets de maintenance de routine, la ville utilise l’outil Synthétiser - À l’intérieur pour comptabiliser les réverbères et pour additionner les miles de pistes cyclables au sein de chaque district d’évaluation de maintenance. Elle peut ensuite estimer le matériel et l’équipe nécessaires pour effectuer le travail dans chaque district.
Remarques sur l’utilisation
Gardez les points suivants à l’esprit lorsque vous utilisez l’outil Synthétiser - À l’intérieur :
- La couche en entrée à synthétiser peut être une couche ponctuelle, linéaire ou surfacique.
- La couche en sortie est toujours une zone surfacique ou une couche de groupe et seules les entités surfaciques ou de groupe où se trouvent les entités synthétisées sont renvoyées.
- Pour comprendre la fonction de l’outil Synthétiser - À l’intérieur, imaginez que vous prenez deux couches, les entités surfaciques et les entités de synthèse en entrée, et que vous les empilez l’une sur l’autre. Après avoir empilé ces couches, examinez-les à travers la pile et comptabilisez le nombre d’entités de synthèse en entrée comprises dans les zones. Outre le nombre d’entités, vous pouvez également calculer des statistiques simples concernant les attributs des entités de synthèse en entrée, tels que la somme, la moyenne, le minimum, le maximum, etc.
- L’outil Synthétiser - À l’intérieur permet de calculer des statistiques standards et des statistiques géographiquement pondérées. Les statistiques standard font la synthèse des valeurs statistiques sans aucune pondération. Les statistiques pondérées calculent les valeurs à l’aide des valeurs pondérées géographiquement de la proportion des lignes comprises dans un polygone ou de la proportion des polygones au sein d’un polygone. Les statistiques pondérées ne s’appliquent pas aux points compris dans des polygones.
Fonctionnement de l’outil Synthétiser - À l’intérieur
La section suivante décrit le fonctionnement de l’outil Synthétiser - À l’intérieur.
Equations
Pour les entités linéaires et surfaciques synthétisées, les statistiques pondérées incorporent les pondérations de la zone de synthèse. Les statistiques des entités ponctuelles ne sont pas pondérées. Le tableau suivant affiche les équations utilisées pour calculer la variance, la moyenne pondérée et l’écart type pondéré.
Statistique | Equation | Variables | Caractéristiques |
---|---|---|---|
Variance | Points | ||
Moyenne pondérée | Les pondérations se calculent sous forme de pourcentage de l’entité au sein de la zone de synthèse. | Lignes et surfaces | |
Ecart type pondéré | Les pondérations se calculent sous forme de pourcentage de l’entité au sein de la zone de synthèse. | Lignes et surfaces |
Points
Les couches de points sont synthétisées uniquement à l'aide d'entités ponctuelles qui se trouvent dans la zone de synthèse. Les statistiques pondérées ne peuvent pas s'appliquer lors de la synthétisation des points.
La figure et la table ci-dessous expliquent les calculs statistiques d'une couche synthétisée de points dans des zones hypothétiques. Le champ Population a permis de calculer les statistiques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche.
Statistique numérique | Résultats pour le secteur A |
---|---|
Effectif | Total de :
|
Somme |
|
Minimal | Minimum de :
|
Maximum | Maximum de :
|
Plage |
|
Moyenne |
|
Variance |
|
Écart type |
|
Statistique de chaîne | Résultats pour le secteur A |
---|---|
Effectif |
|
Tout | = Ecole secondaire |
Remarque :
La statistique de total (pour les chaînes et les champs numériques) comptabilise le nombre de valeurs non nulles. Par exemple, le total de [0, 1, 10, 5, null, 6] est 5. Le total de [Primary, Primary, Secondary, null] est 3.
Cette analyse peut être utilisée concrètement pour déterminer le nombre total d'étudiants dans chaque secteur scolaire. Chaque point représente une école. Le champ Type indique le type d'école (élémentaire, primaire ou secondaire) et le champ indiquant la population étudiante correspond au nombre d'étudiants inscrits dans chaque école. Les calculs et les résultats sont indiqués pour le secteur A dans la table ci-dessus. Les résultats indiquent que le secteur A compte 2 568 étudiants. Lorsque vous exécutez l'outil Synthétiser - A l'intérieur, les résultats concernant le secteur B sont également indiqués.
Lignes
Pour les statistiques pondérées, les couches linéaires sont synthétisées uniquement à l’aide des proportions des entités linéaires comprises dans la zone de synthèse. Les statistiques standard (non pondérées) synthétisent toutes les lignes intersectant la zone de synthèse. Lors de la synthétisation des lignes avec des statistiques pondérées, utilisez des totaux et des montants (et non des taux ou des indices) afin que les calculs proportionnels aient une signification logique dans votre analyse.
La figure et le tableau ci-dessous décrivent les calculs statistiques d’une couche synthétisée linéaire dans une zone de synthèse hypothétique. Le champ Volume a permis de calculer les statistiques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Les statistiques standard sont calculées à l’aide des lignes qui se situent à l’intersection de la limite et les statistiques pondérées sont calculées à l’aide de la proportion des lignes comprises dans le champ Summary Area (Zone de synthèse).
Statistiques numériques | Statistiques standard | Statistiques pondérées |
---|---|---|
Calcul des pondérations | Sans objet | Pondération de la ligne marron (valeur = 600) :
Pondération de la ligne bleue (valeur = 1000) :
|
Effectif | Total de :
| Total de :
|
Somme |
|
|
Minimal | Minimum de :
| Minimum de :
|
Maximum | Maximum de :
| Maximum de :
|
Plage |
|
|
Moyenne |
|
|
Variance |
|
|
Écart type |
|
|
Cette analyse peut être utilisée concrètement pour déterminer le volume total d'eau des rivières comprises dans les limites d'un parc national. Chaque ligne représente une rivière qui coule partiellement dans le parc. Les résultats montrent que les rivières coulent sur huit kilomètres (5 miles) dans le parc et que le volume total est de 900 unités.
Zones
Les couches de surfaces sont synthétisées uniquement à l’aide des proportions des entités surfaciques comprises dans la limite en entrée. Lorsque vous synthétisez des surfaces, utilisez des champs contenant des nombres absolus pour que les calculs proportionnels soient logiques dans l'analyse.
Les statistiques pondérées pour les couches surfaciques synthétisées reposent sur les proportions des entités de la zone de synthèse qui se trouvent dans la couche synthétisée. Lors de la synthétisation des zones, utilisez des totaux et des montants (et non des taux ou des indices) afin que les calculs proportionnels aient une signification logique dans votre analyse.
La figure et le tableau ci-dessous expliquent les calculs statistiques d’une couche surfacique dans une zone de synthèse hypothétique. Le champ de population a permis de calculer les statistiques (Total,Somme, Minimum, Maximum, Plage, Moyenne, Ecart type et Variance) de la couche. Les statistiques standard sont calculées à l’aide de zones qui se situent à l’intersection du champ Summary Area (Zone de synthèse) et les statistiques pondérées sont calculées à l’aide d’une pondération proportionnelle en fonction de la portion des zones de synthèse contenues dans chaque champ Summarized Layer (Couche synthétisée).
Statistiques numériques | Statistiques standard : résultats Voisinage 1 | Statistiques pondérées : résultats Voisinage 1 |
---|---|---|
Calcul des pondérations | Pondération de la zone jaune (valeur = 3200) :
Pondération de la zone verte (valeur = 4700) :
Pondération de la zone rose (valeur = 1000) :
Pondération de la zone bleue (valeur = 4500) :
Pondération de la zone orange (valeur = 3600) :
| |
Effectif | Total de :
| Total de :
|
Somme |
|
|
Minimal | Minimum de :
| Minimum de :
|
Maximum | Maximum de :
| Maximum de :
|
Plage |
|
|
Moyenne |
|
|
Variance |
|
|
Écart type |
|
|
Paramètres
Les paramètres de l’outil Synthétiser - À l’intérieur sont les suivants :
Paramètre | Description | Type de données |
---|---|---|
Couche en entrée | Entités ponctuelles, linéaires ou surfaciques qui seront synthétisées dans les entités surfaciques. | Entités |
Type de groupe | La forme de groupe qui sera utilisée pour créer les groupes réguliers. Les options sont Square (Carré) ou Hexagon (Hexagone). Si la source d’un polygone est connectée au port de jointure de cet outil, ce paramètre n’apparaîtra plus et ne sera plus requis. | Chaîne |
Taille du groupe | Intervalle de distance qui représente la taille du groupe dans lequel les points en entrée seront agrégés. Pour les groupes carrés, la taille du groupe représente la hauteur du carré. Il s’agit de l’option par défaut. Pour les groupes hexagonaux, la taille du groupe représente la hauteur entre deux côtés parallèles. Si la source d’un polygone est connectée au port de jointure de cet outil, ce paramètre n’apparaîtra plus et ne sera plus requis. | Chaîne |
Summarize Shapes (Synthétiser les formes) | Indique si les informations sur les formes seront synthétisées dans le cadre de l’analyse (longueur des lignes ou surface des polygones). Si les entités de synthèse en entrée sont des points, il n’y a aucune information sur les formes à synthétiser. Seul le nombre de points dans chaque entité surfacique est ajouté. | Booléen |
Unités de forme | Unité dans laquelle les attributs de récapitulation de forme sont calculés. Si les entités de synthèse en entrée sont des lignes, spécifiez une unité linéaire. Si les entités de synthèse en entrée sont des polygones, spécifiez une unité surfacique. | Chaîne |
Champs de récapitulation | Statistiques qui seront calculées sur les champs spécifiés. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date.
| Chaîne |
Statistiques pondérées | Statistiques pondérées géographiquement qui seront calculées sur les champs spécifiés. Les statistiques pondérées calculent les valeurs à l’aide des valeurs pondérées géographiquement de la proportion des lignes comprises dans un polygone ou de la proportion des polygones au sein d’un polygone. Les statistiques pondérées ne s’appliquent pas aux points compris dans des polygones. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date.
| Chaîne |
Couche en sortie
Couche en sortie qui contiendra les champs suivants à la place des champs d’origine. Si vous avez configuré des champs de synthèse, ceux-ci sont également calculés pour la couche en sortie.
Nom du champ | Description | Type de champ |
---|---|---|
TOTAL | Nombre d’entités issues de la couche en entrée qui ont été synthétisées dans ce groupe surfacique. | Flottant 64 bits |
sum_length_<units> | Si la couche en entrée est une entité polyligne et que le paramètre Summarize Shapes (Synthétiser les formes) est défini sur Yes (Oui), la sortie génère ce champ, qui indique la longueur totale des entités polylignes dans chaque groupe, dans les unités spécifiées par le paramètre Shape Units (Unités de forme). | Flottant 64 bits |
sum_area_<units> | Si la couche en entrée est une entité surfacique et que le paramètre Summarize Shapes (Synthétiser les formes) est défini sur Yes (Oui), la sortie génère ce champ, qui indique la surface totale des entités surfaciques dans chaque groupe, dans les unités spécifiées par le paramètre Shape Units (Unités de forme). | Flottant 64 bits |
Considérations et limitations
Les lignes et les surfaces sont synthétisées à l’aide de proportions. Par conséquent, il est préférable de synthétiser des données absolues (comme la population) plutôt que des données relatives (comme le revenu moyen).
Vous avez un commentaire à formuler concernant cette rubrique ?