Synthétiser - A l'intérieur

Icône d’outil Disponible dans les analyses de Big Data.

L’outil Summarize Within (Synthétiser - A l’intérieur) Outil Synthétiser - A l’intérieur permet de calculer des statistiques là où une couche en entrée se trouve à l’intérieur d’une couche de contours ou se superpose à celle-ci. La zone qui est synthétisée peut être une couche surfacique ou un groupe hexagonal ou carré.

Diagramme de workflow

Diagramme de workflow de Synthétiser - À l’intérieur

Exemples

  • Un câblo-opérateur lance un programme pilote permettant à des étudiants à faibles revenus de bénéficier d’un accès à Internet à faible coût. L’outil Summarize Within by bins (Synthétiser - À l’intérieur par groupes) peut servir à déterminer le nombre d’étudiants à faibles revenus dans des groupes carrés d’une taille définie afin que le câblo-opérateur puisse identifier une région pertinente pour son programme pilote.
  • Afin de mener à bien et de manière efficace les projets de maintenance de routine, la ville utilise l’outil Summarize Within (Synthétiser - À l’intérieur) pour comptabiliser les réverbères et pour totaliser les miles de pistes cyclables au sein de chaque district d’évaluation de maintenance. Elle peut ensuite estimer le matériel et l’équipe nécessaires pour effectuer le travail dans chaque district.

Remarques sur l'utilisation

  • La couche en entrée à synthétiser peut être une couche ponctuelle, linéaire ou surfacique.
  • La couche en sortie est toujours une zone surfacique ou une couche de groupe et seules les entités surfaciques ou de groupe où se trouvent les entités synthétisées sont renvoyées.
  • Pour comprendre la fonction de l’outil Summarize Within (Synthétiser - À l’intérieur), imaginez que vous prenez deux couches, les entités surfaciques et les entités de synthèse en entrée, et que vous les empilez l’une sur l’autre. Après avoir empilé ces couches, examinez-les à travers la pile et comptabilisez le nombre d’entités de synthèse en entrée comprises dans les zones. Outre le nombre d’entités, vous pouvez également calculer des statistiques simples concernant les attributs des entités de synthèse en entrée, tels que la somme, la moyenne, le minimum, le maximum, etc.
  • Vous pouvez utiliser l’outil Synthétiser - A l’intérieur pour calculer des statistiques standard et des statistiques pondérées géographiquement. Les statistiques standard font la synthèse des valeurs statistiques sans aucune pondération. Les statistiques pondérées calculent les valeurs à l’aide des valeurs pondérées géographiquement de la proportion des lignes comprises dans un polygone ou de la proportion des polygones au sein d’un polygone. Les statistiques pondérées ne s’appliquent pas aux points compris dans des polygones.

Fonctionnement de l’outil Synthétiser - A l’intérieur

Equations

Pour les entités linéaires et surfaciques synthétisées, les statistiques pondérées incorporent les pondérations de la zone de synthèse. Les statistiques des entités ponctuelles ne sont pas pondérées. Le tableau suivant affiche les équations utilisées pour calculer la variance, la moyenne pondérée et l’écart type pondéré.

StatistiqueEquationVariablesCaractéristiques

Variance

Equation de varianceVariables de variance

Points

Moyenne pondérée

Equation de la moyenne pondérée

Variables des moyennes pondérées

Les pondérations se calculent sous forme de pourcentage de l’entité au sein de la zone de synthèse.

Lignes et surfaces

Ecart type pondéré

Equation de l'écart type pondéré

Variables des écarts types pondérés

Les pondérations se calculent sous forme de pourcentage de l’entité au sein de la zone de synthèse.

Lignes et surfaces

Points

Les couches de points sont synthétisées uniquement à l'aide d'entités ponctuelles qui se trouvent dans la zone de synthèse. Les statistiques pondérées ne peuvent pas s'appliquer lors de la synthétisation des points.

La figure et la table ci-dessous expliquent les calculs statistiques d'une couche synthétisée de points dans des zones hypothétiques. Le champ Population a permis de calculer les statistiques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche.

Synthétisation d’une couche de points
Les couches de points sont synthétisées uniquement à l’aide de points figurant dans la couche surfacique. Un exemple de table attributaire montre les valeurs à utiliser dans les calculs de tests statistiques.

Statistique numériqueRésultats pour le secteur A

Effectif

Total de :

[280, 408, 356, 361, 450, 713] = 6

Somme

280 + 408 + 356 + 361 + 450 + 713 = 2 568

Minimal

Minimum de :

[280, 408, 356, 361, 450, 713] = 280

Maximum

Maximum de :

[280, 408, 356, 361, 450, 713] = 713

Plage

713 - 280 = 433

Moyenne

2 568/6 = 428

Variance

Variance de points
= 22 737,2

Écart type

Ecart type de points
= 150,7886

Statistique de chaîneRésultats pour le secteur A

Effectif

= 6

Tout

= Ecole secondaire

Remarque :

La statistique de total (pour les chaînes et les champs numériques) comptabilise le nombre de valeurs non nulles. Par exemple, le total de [0, 1, 10, 5, null, 6] est 5. Le total de [Primary, Primary, Secondary, null] est 3.

Cette analyse peut être utilisée concrètement pour déterminer le nombre total d'étudiants dans chaque secteur scolaire. Chaque point représente une école. Le champ Type indique le type d'école (élémentaire, primaire ou secondaire) et le champ indiquant la population étudiante correspond au nombre d'étudiants inscrits dans chaque école. Les calculs et les résultats sont indiqués pour le secteur A dans la table ci-dessus. Les résultats indiquent que le secteur A compte 2 568 étudiants. Lorsque vous exécutez l'outil Synthétiser - A l'intérieur, les résultats concernant le secteur B sont également indiqués.

Lignes

Pour les statistiques pondérées, les couches linéaires sont synthétisées uniquement à l’aide des proportions des entités linéaires comprises dans la zone de synthèse. Les statistiques standard (non pondérées) synthétisent toutes les lignes intersectant la zone de synthèse. Lors de la synthétisation des lignes avec des statistiques pondérées, utilisez des totaux et des montants (et non des taux ou des indices) afin que les calculs proportionnels aient une signification logique dans votre analyse.

La figure et le tableau ci-dessous décrivent les calculs statistiques d’une couche synthétisée linéaire dans une zone de synthèse hypothétique. Le champ Volume a permis de calculer les statistiques (Count (Total), Sum (Somme), Minimum, Maximum, Range (Plage), Mean (Moyenne), Standard Deviation (Écart type) et Variance) pour la couche. Les statistiques standard sont calculées à l’aide des lignes qui se situent à l’intersection de la limite et les statistiques pondérées sont calculées à l’aide de la proportion des lignes comprises dans le champ Summary Area (Zone de synthèse).

Synthèse d’une couche linéaire
Les couches linéaires sont synthétisées à l’aide de statistiques standard et de statistiques pondérées.

Statistiques numériquesStatistiques standardStatistiques pondérées

Calcul des pondérations

Sans objet

Pondération de la ligne marron (valeur = 600) :

2/3 = 0,6667

Pondération de la ligne bleue (valeur = 1000) :

3/6 = ,5

Effectif

Total de :

[1 000, 600] = 2

Total de :

1 x (3/6) + 1 x (2/3) = 1,1667

Somme

1 000 + 600 = 1600
1 000 x (3/6) + 600 x (2/3) = 900

Minimal

Minimum de :

[1 000, 600] = 600

Minimum de :

[1 000 x (3/6), 600 x (2/3)]
[500, 400] = 400

Maximum

Maximum de :

[1 000, 600] = 1 000

Maximum de :

[1 000 x (3/6), 600 x (2/3)]
[500, 400] = 500

Plage

1 000 - 600 = 600
500 - 400 = 100

Moyenne

(1 000 + 600)/2 = 800
(1 000 x (3/6) + 600 x (2/3))/(3/6 + 2/3)
(500 + 400)/(7/6) = 771,4286

Variance

Variance des lignes
= 80 000
Variance pondérée des lignes
= 1 268 571,4286

Écart type

Ecart type des lignes
= 282,8427
Ecart type pondéré des lignes
= 1 126,3088

Cette analyse peut être utilisée concrètement pour déterminer le volume total d'eau des rivières comprises dans les limites d'un parc national. Chaque ligne représente une rivière qui coule partiellement dans le parc. Les résultats montrent que les rivières coulent sur huit kilomètres (5 miles) dans le parc et que le volume total est de 900 unités.

Zones

Les couches de surfaces sont synthétisées uniquement à l’aide des proportions des entités surfaciques comprises dans la limite en entrée. Lorsque vous synthétisez des surfaces, utilisez des champs contenant des nombres absolus pour que les calculs proportionnels soient logiques dans l'analyse.

Les statistiques pondérées pour les couches surfaciques synthétisées reposent sur les proportions des entités de la zone de synthèse qui se trouvent dans la couche synthétisée. Lors de la synthétisation des zones, utilisez des totaux et des montants (et non des taux ou des indices) afin que les calculs proportionnels aient une signification logique dans votre analyse.

La figure et le tableau ci-dessous expliquent les calculs statistiques d’une couche surfacique dans une zone de synthèse hypothétique. Le champ de population a permis de calculer les statistiques (Total,Somme, Minimum, Maximum, Plage, Moyenne, Ecart type et Variance) de la couche. Les statistiques standard sont calculées à l’aide de zones qui se situent à l’intersection du champ Summary Area (Zone de synthèse) et les statistiques pondérées sont calculées à l’aide d’une pondération proportionnelle en fonction de la portion des zones de synthèse contenues dans chaque champ Summarized Layer (Couche synthétisée).

Synthèse d’une couche surfacique
Les statistiques de synthèse sont calculées pour les zones de la couche synthétisée qui se trouvent à l’intersection des zones de synthèse. Les pondérations reposent sur la proportion de zones de synthèse qui chevauchent les entités de la couche synthétisée.

Statistiques numériquesStatistiques standard : résultats Voisinage 1Statistiques pondérées : résultats Voisinage 1

Calcul des pondérations

Pondération de la zone jaune (valeur = 3200) :

4/(2+4) = 4/6

Pondération de la zone verte (valeur = 4700) :

4/(2+4) = 2/3

Pondération de la zone rose (valeur = 1000) :

1/(1+1,5) = 2/5

Pondération de la zone bleue (valeur = 4500) :

6/(2+6) = 3/4

Pondération de la zone orange (valeur = 3600) :

2/(2+2) = 1/2

Effectif

Total de :

[3 200, 4 700, 1 000, 4 500, 3 600] = 5

Total de :

(2/3)+(2/3)+ (2/5)+(3/4)+ (1/2) = 2,98

Somme

3 200 + 4 700 + 1 000 + 4 500 + 3 600 = 17 000
(3/4) x 3 200 +(2/3) x 4 700 + (2/5) x 1 000 +(3/4) x 4 500 + (1/2) x 3 600 = 10 841,67

Minimal

Minimum de :

[3 200, 4 700, 1 000, 4 500, 3 600] = 1 000

Minimum de :

[(2/3) x 3 200, (2/3) x 4 700, (2/5) x 1 000, (3/4) x 4 500, (1/2) x 3 600]
[2 133,33, 3133,33, 400, 3 375, 1 800] = 400

Maximum

Maximum de :

3 200, 4 700, 1 000, 4 500, 3 600] = 4 700

Maximum de :

[2 133,33, 3 133,33, 400, 3 375, 1 800] = 3 375

Plage

4 700 - 1 000 = 3 700
3 375 - 400 = 2 975

Moyenne

(17 000)/5 = 3 400
(10 841,67)/[2,9833] = 3 634,12

Variance

Variance des zones
= 2 185 000
Variance pondérée des zones
= 1 727 137,5112

Écart type

Écart type des zones
= 1 478,175
Ecart type pondéré des surfaces
= 1 314,2060

Paramètres

ParamètreDescriptionType de données

Couche en entrée

Entités ponctuelles, linéaires ou surfaciques qui seront synthétisées dans les entités surfaciques.

Entités

Type de groupe

La forme de groupe qui sera utilisée pour créer les groupes réguliers. Les options sont Square (Carré) ou Hexagon (Hexagone).

Si la source d’un polygone est connectée au port de jointure de cet outil, ce paramètre n’apparaîtra plus et ne sera plus requis.

Chaîne

Taille du groupe

Intervalle de distance qui représente la taille du groupe dans lequel les points en entrée seront agrégés. Pour les groupes carrés, la taille du groupe représente la hauteur du carré. Il s’agit de l’option par défaut. Pour les groupes hexagonaux, la taille du groupe représente la hauteur entre deux côtés parallèles.

Si la source d’un polygone est connectée au port de jointure de cet outil, ce paramètre n’apparaîtra plus et ne sera plus requis.

Chaîne

Summarize Shapes (Synthétiser les formes)

Indique si les informations sur les formes seront synthétisées dans le cadre de l’analyse (longueur des lignes ou surface des polygones). Si les entités de synthèse en entrée sont des points, il n’y a aucune information sur les formes à synthétiser. Seul le nombre de points dans chaque entité surfacique est ajouté.

Booléen

Unités de forme

Unité dans laquelle les attributs de récapitulation de forme sont calculés. Si les entités de synthèse en entrée sont des lignes, spécifiez une unité linéaire. Si les entités de récapitulation en entrée sont des polygones, spécifiez une unité surfacique.

Chaîne

Champs de récapitulation

Statistiques qui seront calculées sur les champs spécifiés. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date.

  • Any (Quelconque) : exemple de chaîne provenant d’un champ de type chaîne.
  • Count (Total) : calcule le nombre de valeurs non nulles. Peut être utilisé sur des champs numériques ou des chaînes. Le total de [Null, 0, 2] est égal à 2.
  • Count (distinct) [Total (distinct)] : calcule le nombre de valeurs non nulles distinctes. Peut être utilisé sur des champs numériques ou des chaînes. Le résultat du total distinct de [null, 4, 3, 4] est 2.
  • Sum (Somme) : somme des valeurs numériques dans un champ. La somme de [null, 1, 3] est égale à 4.
  • Sum of Squares (Somme des carrés) : somme, sur toutes les observations, des différences au carré de chaque observation par rapport à la moyenne globale. La somme des carrés de [null, 2,2, 3,1, 4,7] est égale à 3,206.
  • Min : valeur minimale d’un champ numérique. La valeur minimale de [0, 2, Null] est égale à 0.
  • Max : valeur maximale d’un champ numérique. La valeur maximale de [0, 2, Null] est égale à 2.
  • Mean (Moyenne) : moyenne des valeurs numériques. La moyenne de [0, 2, Null] est égale à 1.
  • Range (Plage) : plage d’un champ numérique. Elle est calculée comme la valeur minimale soustraite de la valeur maximale. La plage de [0, Null, 1] est égale à 1. La plage de [Null, 4] est égale à 0.
  • Variance : variance d’un champ numérique dans une trace. La variance de [1] est la valeur nulle. La variance de [Null, 1, 1, 1] est égale à 1.
  • Standard Deviation (Écart type) : écart type d’un champ numérique. L'écart type de [1] est la valeur Null. L’écart type de [null, 1, 1, 1] est égal à 1.

Chaîne

Statistiques pondérées

Statistiques pondérées géographiquement qui seront calculées sur les champs spécifiés. Les statistiques pondérées calculent les valeurs à l’aide des valeurs pondérées géographiquement de la proportion des lignes comprises dans un polygone ou de la proportion des polygones au sein d’un polygone. Les statistiques pondérées ne s’appliquent pas aux points compris dans des polygones. Différentes statistiques sont disponibles en fonction du type du champ spécifié : chaîne, valeur numérique ou date.

  • Count (Total) : calcule le nombre de valeurs non nulles. Peut être utilisé sur des champs numériques ou des chaînes. Le total de [Null, 0, 2] est égal à 2.
  • Sum (Somme) : somme des valeurs numériques dans un champ. La somme de [null, 1, 3] est égale à 4.
  • Min : valeur minimale d’un champ numérique. La valeur minimale de [0, 2, Null] est égale à 0.
  • Max : valeur maximale d’un champ numérique. La valeur maximale de [0, 2, Null] est égale à 2.
  • Mean (Moyenne) : moyenne des valeurs numériques. La moyenne de [0, 2, Null] est égale à 1.
  • Range (Plage) : plage d’un champ numérique. Elle est calculée comme la valeur minimale soustraite de la valeur maximale. La plage de [0, Null, 1] est égale à 1. La plage de [Null, 4] est égale à 0.

Chaîne

Couche en sortie

Couche en sortie qui contiendra les champs suivants à la place des champs d’origine. Si vous avez configuré des champs de synthèse, ceux-ci sont également calculés pour la couche en sortie.

Nom du champDescriptionType de champ

TOTAL

Nombre d’entités issues de la couche en entrée qui ont été synthétisées dans ce groupe surfacique.

Flottant 64 bits

sum_length_<units>

Si la couche en entrée est une entité polyligne et que le paramètre Summarize Shapes (Synthétiser les formes) est défini sur Yes (Oui), la sortie génère ce champ, qui indique la longueur totale des entités polylignes dans chaque groupe, dans les unités spécifiées par le paramètre Shape Units (Unités de forme).

Flottant 64 bits

sum_area_<units>

Si la couche en entrée est une entité surfacique et que le paramètre Summarize Shapes (Synthétiser les formes) est défini sur Yes (Oui), la sortie génère ce champ, qui indique la surface totale des entités surfaciques dans chaque groupe, dans les unités spécifiées par le paramètre Shape Units (Unités de forme).

Flottant 64 bits

Considérations et limitations

Les lignes et les surfaces sont synthétisées à l’aide de proportions. Par conséquent, il est préférable de synthétiser des données absolues (comme la population) plutôt que des données relatives (comme le revenu moyen).