Referencia de distribución de datos

La distribución de datos en Business Analyst Web App es el resumen (o agregación) de datos en anillos y polígonos. La distribución de datos le permite utilizar los atributos disponibles en las geografías censales, como la población total, para calcular la información de sus áreas definidas a medida, como los anillos o las áreas de tiempo de conducción.

Distribución de datos en Business Analyst Web App

El software de ArcGIS utiliza un proceso denominado GeoEnrichment para proporcionar datos demográficos sobre áreas del mapa. Para las geografías estándar, como distritos censales y grupos de bloques, la recuperación de datos se simplificar porque la agencia que proporciona los datos (por ejemplo, la Oficina del Censo de los EE. UU.) ya ha notificado la información en estas unidades. Las áreas que crea en el mapa (dibujando un polígono, importando un shapefile o agregando zonas de influencia alrededor de un sitio) se consideran geografías no estándar, y el proceso de recuperación de datos para estas áreas es ligeramente más complejo.

En el caso de las geografías no estándar, los datos se deben distribuir, o distribuir y resumir, en unidades diferentes de las que se informaron originalmente. La distribución de datos utiliza puntos de asentamiento generados mediante Esri para proporcionar más detalles sobre las áreas únicas que cree en el mapa.

Para comparar, un análisis que utiliza datos disponibles directamente de la Oficina del Censo de los EE. UU. se basaría en centroides generados por el censo. Un centroide es el centro representativo de una entidad, marcado por un único punto. Si el área que dibuja en el mapa incluye un centroide, el análisis recuperaría los datos de toda la unidad, lo que resulta en una recuperación de datos imprecisa.

Distribución de datos con centroides

Pero ¿dónde vive realmente la gente en una geografía estándar? En la mayoría de los casos, no todos se agrupan alrededor del centroide. Un análisis que utiliza puntos de asentamiento (generados mediante Esri) distribuye los datos a unidades más pequeñas en función de patrones de asentamiento geográfico. De este modo, se recuperan los datos de una zona que se ajusta más a la forma dibujada, basándose en la ubicación real de las personas.

Distribución de datos con puntos de asentamiento

Puntos de asentamiento

Los puntos de asentamiento son puntos que representan la densidad de población de una ubicación. Los puntos de asentamiento son únicos porque están ponderados. Representan dónde vive la gente dentro de la unidad geográfica estándar y asignan un peso al punto en función de cuántas personas probablemente viven allí. En cambio, los centroides del censo son medidas más amplias que resumen la población de una geografía estándar; si el polígono que dibuja interseca con el centroide, los datos de toda la geografía se recogen en los datos devueltos para su polígono. Significa que los datos resumen toda la unidad geográfica, aunque el polígono solo interseque con él un poco.

Esri utiliza algunos métodos para trazar puntos de asentamiento, dependiendo del país. Para obtener más información sobre las metodologías, consulte Cómo funciona la distribución de datos.

Bases de distribución

Los puntos de asentamiento se asocian a dos tipos de recuentos demográficos: datos de población y datos de unidades familiares. Los datos de población reflejan el número de individuos, mientras que los datos de unidades familiares reflejan el número de unidades familiares en las que las personas se han agrupado residencialmente. Dado que los puntos de asentamiento proporcionan datos a nivel tanto de población como de unidades familiares, se pueden distribuir otras variables demográficas utilizando estas bases. Por ejemplo, las variables de educación se basan en la población, mientras que las variables de ingresos por unidad familiar se basan en las unidades familiares.

Limitaciones

Existen algunas limitaciones a nivel geográfico de la distribución de datos en Business Analyst Web App.

Los datos solo deben resumirse a su nivel geográfico original o superior. Los niveles geográficos más altos cubren áreas más grandes, como los estados, en comparación con los niveles geográficos más pequeños, como los bloques censales. Por ejemplo, algunas variables de la Encuesta sobre la Comunidad Estadounidense (ACS) solo están disponibles en el distrito censal o en niveles geográficos superiores. Es posible que los niveles geográficos más pequeños, como a nivel de grupo de bloques, no dispongan de valores de la variable ACS. Por lo tanto, los datos de la ACS no pueden distribuirse a estos niveles geográficos más pequeños. Como resultado, al elaborar informes personalizados e informes de comparación, las variables de la ACS disponibles dependen del nivel geográfico que se esté utilizando.

Si resume los datos a un nivel geográfico inferior al de los datos originales, se introducen suposiciones en su análisis. Por ejemplo, si tiene datos a nivel de condado y los resume hasta el nivel de distrito censal, sus datos se distribuyen en función del método de distribución que haya establecido. Al resumir los datos a un nivel geográfico inferior al de los datos originales, la distribución de sus datos puede parecer excesivamente generalizada en función del área de interés.

Cuando un área está escasamente rellenada, la distribución de los datos se hace más difícil. La unidad geográfica más pequeña utilizada para la distribución de datos en GeoEnrichment son los bloques censales. Si el área de su análisis es muy pequeña y no se cruza con ningún dato de bloque censal, el servicio de GeoEnrichment devuelve valores cero. Para obtener más información sobre cómo se resumen los datos, consulte Cómo funciona la distribución de datos.

Recursos

Para obtener más información sobre la distribución de datos, consulte los siguientes recursos: