Référence pour la répartition des données

La répartition des données dans Business Analyst Web App est la synthétisation (ou l’agrégation) des données dans des anneaux et des polygones. La répartition des données vous permet d’utiliser les attributs disponibles dans les géographies du recensement (par exemple, la population totale) afin de calculer des informations pour les zones personnalisées que vous avez définies (par exemple, des anneaux ou des zones de desserte isochrones).

Répartition des données dans Business Analyst Web App

Les logiciels ArcGIS utilisent un traitement appelé GeoEnrichment pour fournir des données démographiques sur les zones de la carte. Pour les géographies standard, telles que les secteurs de recensement et les groupes d’îlots, l’extraction des données est simplifiée car les informations sont déjà communiquées dans ces unités par l’agence qui fournit les données (par exemple, le Bureau du recensement des États-Unis). Les zones que vous créez sur la carte, en dessinant un polygone, important un shapefile ou ajoutant des zones tampon autour d'un site, sont considérées comme des géographies non standard et l'extraction des données de ces zones est légèrement plus complexe.

Pour les géographies non standard, les données doivent être réparties et agrégées dans des unités différentes de celles d'origine. La répartition des données utilise des points de peuplement générés par Esri afin de fournir davantage de détails pour les zones uniques que vous créez sur la carte.

À titre de comparaison, une analyse qui utilise les données disponibles directement auprès du Bureau du recensement des États-Unis s'appuient sur des centroïdes générés par le recensement. Un centroïde est le centre représentatif d'une entité, marqué d'un point. Si la zone que vous représentez sur la carte inclut un centroïde, l'analyse extrait les données de toute l'unité et l'extraction des données n'est donc pas précise.

Répartition des données avec des centroïdes

Mais où les gens vivent-ils en réalité à l'intérieur d'une géographie standard ? Dans la plupart des cas, ils ne sont pas regroupés autour du centroïde. Une analyse qui utilise des points de peuplement (générés par Esri) répartit les données en unités plus petites, en fonction de modèles de peuplement géographiques. De la sorte, les données extraites pour une zone correspondent davantage à la forme dessinée, d'après les localisations réelles des personnes.

Répartition des données avec des points de peuplement

Points de peuplement

Les points de peuplement sont des points représentant la densité de population d'une localisation. Les points de peuplement sont uniques car ils sont pondérés. Ils représentent l'endroit où les gens vivent à l'intérieur de l'unité géographique standard et affectent une pondération au point en fonction du nombre présumé de personnes y habitant. Par opposition, les centroïdes de recensement sont des mesures plus vastes qui agrègent la population d'une géographie standard ; si le polygone que vous dessinez intersecte le centroïde, les données de l'ensemble de la géographie sont recueillies dans les données renvoyées pour votre polygone. Cela signifie que les données agrègent toute l'unité géographique, même si votre polygone ne l'intersecte qu'un tout petit peu.

Esri utilise quelques méthodes pour tracer les points de peuplement, en fonction du pays. Pour en savoir plus sur les méthodologies, reportez-vous à la rubrique Fonctionnement de la répartition des données.

Bases de répartition

Les points de peuplement sont associés à deux types de résultats démographiques : les données sur la population et les données sur les ménages. Les données sur la population reflètent le nombre de personnes, tandis que les données sur les ménages reflètent le nombre de ménages constitués par ces personnes. Les points de peuplement fournissant des données aussi bien au niveau de la population qu'au niveau des ménages, les autres variables démographiques peuvent être réparties à l'aide de ces bases. Par exemple, les variables sur l'éducation reposent sur la population, tandis que les variables sur les revenus des ménages reposent sur les ménages.

Limitations

Il existe des limitations géographiques pour la répartition des données dans Business Analyst Web App.

Les données ne doivent être synthétisées qu’à leur niveau géographique d’origine ou à un niveau supérieur. Les niveaux géographiques supérieurs couvrent des zones plus vastes (par exemple, des états) que les niveaux géographiques plus petits (qui couvrent par exemple des secteurs de recensement). Par exemple, les variables de l’American Community Survey (ACS) ne sont disponibles qu’au niveau du secteur de recensement ou à des niveaux géographiques supérieurs. Les niveaux géographiques plus petits, tels que le niveau des groupes d’îlots, ne comportent pas forcément de valeurs pour les variables de l’ACS. Par conséquent, les données de l’ACS ne peuvent pas être réparties à ces niveaux géographiques plus petits. Ainsi, lorsque vous générez des rapports et des rapports de comparaison personnalisés, les variables de l’ACS qui sont disponibles dépendent du niveau géographique utilisé.

Si vous synthétisez des données à un niveau géographique inférieur à celui des données d’origine, des hypothèses sont introduites dans votre analyse. Par exemple, si vous disposez de données au niveau des comtés et que vous les synthétisez au niveau inférieur des secteurs de recensement, vos données sont réparties selon la méthode de répartition que vous avez définie. Lorsque vous synthétisez des données à un niveau géographique inférieur à celui des données d’origine, la distribution de vos données peut sembler généralisée de manière excessive selon la zone d’intérêt.

Lorsqu’une zone est peu peuplée, la répartition des données devient plus difficile. L’unité géographique la plus petite utilisée pour la répartition des données dans GeoEnrichment est l’îlot de recensement. Si la zone de votre analyse est très petite et n’intersecte aucune donnée d’îlot de recensement, le service GeoEnrichmentrenvoie des valeurs égales à zéro. Pour en savoir plus sur la synthétisation des données, reportez-vous à la rubrique How data apportionment works.

Ressources

Pour en savoir plus sur la répartition des données, consultez les ressources suivantes :