Disponible en análisis de big data.
La herramienta Resumir dentro de calcula las estadísticas en áreas en las que una capa de entrada está dentro de una capa de límite o se superpone con ella. El área que se está resumiendo puede ser una capa de área o un bin hexagonal o cuadrado.
Diagrama de flujo de trabajo
Ejemplos
A continuación, se indican ejemplos de uso de la herramienta Resumir dentro de:
- Un proveedor de cable está iniciando un programa piloto en el que proporciona acceso de bajo coste a Internet a estudiantes universitarios de la comunidad con un nivel de ingresos bajo. Resumir dentro de por bins se puede utilizar para determinar el número de estudiantes con un nivel bajo de ingresos contenidos en bins cuadrados de un tamaño determinado, de tal forma que el proveedor de servicios por cable pueda determinar una región adecuada para su programa piloto.
- Para realizar de manera eficiente los proyectos de mantenimiento rutinario, la ciudad utiliza la herramienta Resumir dentro de para contar las farolas y contabilizar los kilómetros de carriles bici en cada distrito de valoración del mantenimiento. De este modo, puede calcular el material y el personal necesarios para completar la tarea en cada distrito.
Notas de uso
Tenga en cuenta lo siguiente cuando trabaje con la herramienta Resumir dentro de:
- La capa de entrada que se va a resumir puede ser una capa de puntos, líneas o polígonos.
- La capa de salida siempre es una capa de bin o área de polígono y solo se devuelven las entidades de área o bin en las que se producen entidades resumidas.
- Puede considerar la opción Resumir dentro de como si tomara dos capas, las entidades de área y las entidades de resumen de entrada, y las apilara unas sobre otras. Después de apilar estas capas, examina la pila y recuenta el número de entidades de resumen de entrada que están incluidas en las áreas. Además del número de entidades, también puede calcular estadísticas simples sobre los atributos de las entidades de resumen de entrada, como la suma, el valor medio, el mínimo, el máximo, etcétera.
- Puede utilizar la herramienta Resumir dentro de para calcular estadísticas estándar y estadísticas con ponderación geográfica. Las estadísticas estándar resumen los valores estadísticos sin ponderación. Las estadísticas ponderadas calculan los valores usando los valores ponderados de la proporción de líneas que hay dentro de un polígono o la proporción de polígonos que hay dentro de un polígono. Las estadísticas ponderadas no se aplican a los puntos contenidos dentro de polígonos.
Funcionamiento de la herramienta Resumir dentro de
A continuación, se describe cómo funciona la herramienta Resumir dentro de.
Ecuaciones
Para las entidades de línea y área resumidas, las estadísticas ponderadas incorporan los pesos de Área de resumen. No se pondera ninguna de las estadísticas de las entidades de puntos. La siguiente tabla muestra las ecuaciones empleadas para calcular la varianza, la media ponderada y la desviación estándar ponderada.
Estadística | Ecuación | Variables | Entidades |
---|---|---|---|
Varianza | Puntos | ||
Media ponderada | Las ponderaciones se calculan como el porcentaje de la entidad dentro del área de resumen. | Líneas y áreas | |
Desviación estándar ponderada | Las ponderaciones se calculan como el porcentaje de la entidad dentro del área de resumen. | Líneas y áreas |
Puntos
Las capas de puntos se resumen usando únicamente las entidades de punto contenidas en el Área de resumen. Las estadísticas ponderadas no se pueden aplicar cuando se resumen puntos.
La figura y la tabla siguientes explican los cálculos estadísticos de una Capa de resumen de puntos dentro áreas hipotéticas. Se utilizó el campo Population para calcular las estadísticas (Recuento, Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) de la capa.
Estadística numérica | Resultados del distrito A |
---|---|
Recuento | Recuento de:
|
Suma |
|
Mínimo | Mínimo de:
|
Máximo | Máximo de:
|
Rango |
|
Valor medio |
|
Varianza |
|
Desviación estándar |
|
Estadísticas de cadena de caracteres | Resultados del distrito A |
---|---|
Recuento |
|
Cualquiera | = Escuela secundaria |
Nota:
La estadística de recuento (para campos de cadena de caracteres y numéricos) cuenta el número de valores no nulos. Por ejemplo, el recuento de [0, 1, 10, 5, null, 6] es 5. El recuento de [Primary, Primary, Secondary, null] es 3.
Un caso de la vida real en el que se podría usar este análisis consiste en determinar el número total de estudiantes de cada distrito escolar. Cada punto representa un colegio. El campo Type proporciona el tipo de escuela (primaria o secundaria) y un campo de población de estudiantes indica el número de alumnos inscritos en cada colegio. En la tabla anterior se proporcionan los cálculos y los resultados para el distrito A. En los resultados, puede ver que el distrito A tiene 2.568 estudiantes. Cuando se ejecute la herramienta Resumir dentro de, se darán también los resultados para el distrito B.
Líneas
Para las estadísticas ponderadas, las capas de líneas se resumen usando únicamente las proporciones de las entidades de línea contenidas dentro del Área de resumen. Las estadísticas estándar (no ponderadas) resumen cualquier línea que interseca el Área de resumen. Cuando se resumen líneas mediante estadísticas ponderadas, utilice recuentos y cantidades (en lugar de tasas e índices) para que los cálculos proporcionales tengan lógica en su análisis.
La figura y la tabla siguientes explican los cálculos estadísticos de una Capa resumida dentro de un Área de resumen hipotética. Se utilizó el campo Volume para calcular las estadísticas (Recuento, Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) de la capa. Las estadísticas estándar se calculan usando líneas que intersecan el límite y las estadísticas ponderadas se calculan usando la proporción de las líneas que están dentro del Área de resumen.
Estadísticas numéricas | Estadísticas estándar | Estadísticas ponderadas |
---|---|---|
Calculando ponderaciones | No aplicable | Peso de la línea marrón (valor = 600):
Peso de la línea azul (valor = 1000):
|
Recuento | Recuento de:
| Recuento de:
|
Suma |
|
|
Mínimo | Mínimo de:
| Mínimo de:
|
Máximo | Máximo de:
| Máximo de:
|
Rango |
|
|
Valor medio |
|
|
Varianza |
|
|
Desviación estándar |
|
|
Un caso de la vida real en el que se podría usar este análisis consiste en determinar el volumen del agua que hay en los ríos dentro de los límites de un parque estatal. Cada línea representa un río que se encuentra parcialmente situado dentro del parque. En los resultados, puede ver que hay 5 millas de ríos dentro del parque y que el volumen total es de 900 unidades.
Áreas
Las capas de áreas se resumen usando únicamente las proporciones de las entidades de área contenidas en el límite de entrada. Al resumir áreas, utilice campos con números absolutos para que los cálculos proporcionales tengan lógica en el análisis.
Las estadísticas ponderadas de las capas de área resumidas se basan en las proporciones de las entidades de Área de resumen que se encuentran dentro de la Capa de resumen. Cuando se resumen áreas, utilice recuentos y cantidades (en lugar de tasas e índices) para que los cálculos proporcionales tengan lógica en su análisis.
La figura y la tabla siguientes explican los cálculos estadísticos de una capa de áreas dentro de un Área de resumen hipotética. Se utilizó el campo Población para calcular las estadísticas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) de la capa. Las estadísticas estándar se calculan usando áreas que intersecan el Área de resumen y las estadísticas ponderadas se calculan usando un peso proporcional basado en la parte de áreas de resumen contenidas dentro de cada Capa resumida.
Estadísticas numéricas | Estadísticas estándar: Resultados de vecindad 1 | Estadísticas ponderadas: Resultados de vecindad 1 |
---|---|---|
Calculando ponderaciones | Peso del área amarilla (valor = 3200):
Peso del área verde (valor = 4700):
Peso del área rosa (valor = 1000):
Peso del área azul (valor = 4500):
Peso del área naranja (valor = 3600):
| |
Recuento | Recuento de:
| Recuento de:
|
Suma |
|
|
Mínimo | Mínimo de:
| Mínimo de:
|
Máximo | Máximo de:
| Máximo de:
|
Rango |
|
|
Valor medio |
|
|
Varianza |
|
|
Desviación estándar |
|
|
Parámetros
A continuación, se indican los parámetros de la herramienta Resumir dentro de:
Parámetro | Descripción | Tipo de datos |
---|---|---|
Capa de entrada | Las entidades de punto, línea o polígono que se van a resumir dentro de entidades de área. | Entidades |
Tipo de bin | La forma de bin que se utilizará para crear los bins regulares. Las opciones son Cuadrado y Hexágono. Si se conecta un origen de polígono al puerto de unión de esta herramienta, este parámetro ya no aparecerá o no será necesario. | Cadena de caracteres |
Tamaño de bin | El intervalo de distancia que representa el tamaño de bin en el que se agregará la entrada de puntos. En el caso de los bins cuadrados, el tamaño de bin representa la altura de un cuadrado. Esta es la opción predeterminada. En el caso de los bins hexagonales, el tamaño de bin representa la altura entre dos lados paralelos. Si se conecta un origen de polígono al puerto de unión de esta herramienta, este parámetro ya no aparecerá o no será necesario. | Cadena de caracteres |
Resumir formas | Especifica si se resumirá o no la información de forma como parte del análisis (longitud de líneas o área de polígonos). Si las entidades de resumen de entrada son puntos, no hay información de forma que resumir. Solo se agrega el recuento de puntos dentro de cada entidad de área. | Booleano |
Unidades de forma | La unidad en la que se van a calcular los atributos de resumen de forma. Si las entidades de resumen de entrada son líneas, debe especificar una unidad lineal. Si las entidades de resumen de entrada son polígonos, debe especificar una unidad de área. | Cadena de caracteres |
Campos de resumen | Las estadísticas que se calcularán para campos concretos. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.
| Cadena de caracteres |
Estadísticas ponderadas | Las estadísticas ponderadas geográficamente que se calcularán para campos concretos. Las estadísticas ponderadas calculan los valores usando los valores ponderados de la proporción de líneas que hay dentro de un polígono o la proporción de polígonos que hay dentro de un polígono. Las estadísticas ponderadas no se aplican a los puntos contenidos dentro de polígonos. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.
| Cadena de caracteres |
Capa de salida
La capa de salida contendrá los siguientes campos en lugar de los campos originales. Si configuró campos de resumen, estos campos también se calcularán para la capa de salida.
Nombre de campo | Descripción | Tipo de campo |
---|---|---|
COUNT | El número de entidades de la capa de entrada que se resumieron en este bin de polígono. | Float64 |
sum_length_<units> | Si la capa de entrada es una entidad de polilínea y el parámetro Resumir formas se establece en Sí, la salida generará este campo que informa de la longitud total de las entidades de polilínea dentro de cada bin, en las unidades especificadas en el parámetro Unidades de forma. | Float64 |
sum_area_<units> | Si la capa de entrada es una entidad poligonal y el parámetro Resumir formas se establecen en Sí, la salida generará este campo que informa del área total de las entidades poligonales dentro de cada bin, en las unidades especificadas en el parámetro Unidades de forma. | Float64 |
Consideraciones y limitaciones
Las líneas y las áreas se resumen usando proporciones; por tanto, es mejor resumir los datos absolutos (como la población) en lugar de los datos relativos (como los ingresos medios) cuando se estén resumiendo líneas o áreas.