Resumir dentro de

Icono de la herramienta Disponible en análisis de big data.

La herramienta Resumir dentro de Herramienta Resumir dentro de calcula las estadísticas en áreas en las que una capa de entrada está dentro de una capa de límite o se superpone con ella. El área que se está resumiendo puede ser una capa de área o un bin hexagonal o cuadrado.

Diagrama de flujo de trabajo

Diagrama del flujo de trabajo de Resumir dentro de

Ejemplos

  • Un proveedor de cable está iniciando un programa piloto en el que proporciona acceso de bajo coste a Internet a estudiantes universitarios de la comunidad con un nivel de ingresos bajo. Resumir dentro de por bins se puede utilizar para determinar el número de estudiantes con un nivel bajo de ingresos contenidos en bins cuadrados de un tamaño determinado, de tal forma que el proveedor de servicios por cable pueda determinar una región adecuada para su programa piloto.
  • Para realizar de manera eficiente los proyectos de mantenimiento rutinario, la ciudad utiliza Resumir dentro de para contar las farolas y contabilizar los kilómetros de carriles bici en cada distrito de valoración del mantenimiento. De este modo, puede calcular el material y el personal necesarios para completar la tarea en cada distrito.

Notas de uso

  • La capa de entrada que se va a resumir puede ser una capa de puntos, líneas o polígonos.
  • La capa de salida siempre es una capa de bin o área de polígono y solo se devuelven las entidades de área o bin en las que se producen entidades resumidas.
  • Con la opción Resumir dentro de es como si tomara dos capas, las entidades de área y las entidades de resumen de entrada, y las apilara unas sobre otras. Después de apilar estas capas, examina la pila y recuenta el número de entidades de resumen de entrada que están incluidas en las áreas. Además del número de entidades, también puede calcular estadísticas simples sobre los atributos de las entidades de resumen de entrada, como la suma, el valor medio, el mínimo, el máximo, etcétera.
  • Puede utilizar Resumir dentro de para calcular estadísticas estándar y estadísticas con ponderación geográfica. Las estadísticas estándar resumen los valores estadísticos sin ponderación. Las estadísticas ponderadas calculan los valores usando los valores ponderados de la proporción de líneas que hay dentro de un polígono o la proporción de polígonos que hay dentro de un polígono. Las estadísticas ponderadas no se aplican a los puntos contenidos dentro de polígonos.

Cómo funciona Resumir dentro de

Ecuaciones

Para las entidades de línea y área resumidas, las estadísticas ponderadas incorporan los pesos de Área de resumen. No se pondera ninguna de las estadísticas de las entidades de puntos. La siguiente tabla muestra las ecuaciones empleadas para calcular la varianza, la media ponderada y la desviación estándar ponderada.

EstadísticaEcuaciónVariablesEntidades

Varianza

Ecuación de varianzaVariables de varianza

Puntos

Media ponderada

Ecuación del valor medio ponderado

Variables del valor medio ponderado

Las ponderaciones se calculan como el porcentaje de la entidad dentro del área de resumen.

Líneas y áreas

Desviación estándar ponderada

Ecuación de la desviación estándar ponderada

Variables de la desviación estándar ponderada

Las ponderaciones se calculan como el porcentaje de la entidad dentro del área de resumen.

Líneas y áreas

Puntos

Las capas de puntos se resumen usando únicamente las entidades de punto contenidas en el Área de resumen. Las estadísticas ponderadas no se pueden aplicar cuando se resumen puntos.

La figura y la tabla siguientes explican los cálculos estadísticos de una Capa de resumen de puntos dentro áreas hipotéticas. Se utilizó el campo Population para calcular las estadísticas (Recuento, Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) de la capa.

Resumir una capa de puntos
Las capas de puntos se resumen usando únicamente los puntos situados dentro de la capa de área. Una tabla de atributos de ejemplo muestra los valores que se van a usar en los cálculos estadísticos hipotéticos.

Estadística numéricaResultados del distrito A

Recuento

Recuento de:

[280, 408, 356, 361, 450, 713] = 6

Suma

280 + 408 + 356 + 361 + 450 + 713 = 2.568

Mínimo

Mínimo de:

[280, 408, 356, 361, 450, 713] = 280

Máximo

Máximo de:

[280, 408, 356, 361, 450, 713] = 713

Rango

713 - 280 = 433

Valor medio

2568/6 = 428

Varianza

Varianza de puntos
= 22737,2

Desviación estándar

Desviación estándar de puntos
= 150,7886

Estadísticas de cadena de caracteresResultados del distrito A

Recuento

= 6

Cualquiera

= Escuela secundaria

Nota:

La estadística de recuento (para campos de cadena de caracteres y numéricos) cuenta el número de valores no nulos. Por ejemplo, el recuento de [0, 1, 10, 5, null, 6] es 5. El recuento de [Primary, Primary, Secondary, null] es 3.

Un caso de la vida real en el que se podría usar este análisis consiste en determinar el número total de estudiantes de cada distrito escolar. Cada punto representa un colegio. El campo Type proporciona el tipo de escuela (primaria o secundaria) y un campo de población de estudiantes indica el número de alumnos inscritos en cada colegio. En la tabla anterior se proporcionan los cálculos y los resultados para el distrito A. En los resultados, puede ver que el distrito A tiene 2.568 estudiantes. Cuando se ejecute la herramienta Resumir dentro de, se darán también los resultados para el distrito B.

Líneas

Para las estadísticas ponderadas, las capas de líneas se resumen usando únicamente las proporciones de las entidades de línea contenidas dentro del Área de resumen. Las estadísticas estándar (no ponderadas) resumen cualquier línea que interseca el Área de resumen. Cuando se resumen líneas mediante estadísticas ponderadas, utilice recuentos y cantidades (en lugar de tasas e índices) para que los cálculos proporcionales tengan lógica en su análisis.

La figura y la tabla siguientes explican los cálculos estadísticos de una Capa resumida dentro de un Área de resumen hipotética. Se utilizó el campo Volume para calcular las estadísticas (Recuento, Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) de la capa. Las estadísticas estándar se calculan usando líneas que intersecan el límite y las estadísticas ponderadas se calculan usando la proporción de las líneas que están dentro del Área de resumen.

Resumir una capa de líneas
Las capas de líneas se resumen usando estadísticas estándar y estadísticas ponderadas.

Estadísticas numéricasEstadísticas estándarEstadísticas ponderadas

Calculando ponderaciones

No aplicable

Peso de la línea marrón (valor = 600):

2/3 = ,6667

Peso de la línea azul (valor = 1000):

3/6 = 0,5

Recuento

Recuento de:

[1000, 600] = 2

Recuento de:

1 x (3/6) + 1 x (2/3) = 1,1667

Suma

1000 + 600 = 1600
1000 x (3/6) + 600 x (2/3) = 900

Mínimo

Mínimo de:

[1000, 600] = 600

Mínimo de:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 400

Máximo

Máximo de:

[1000, 600] = 1000

Máximo de:

[1000 x (3/6), 600 x (2/3)]
[500, 400] = 500

Rango

1000 - 600 = 600
500 - 400 = 100

Valor medio

(1000 + 600)/2 = 800
(1000 x (3/6) + 600 x (2/3))/(3/6 + 2/3)
(500 + 400)/(7/6) = 771,4286

Varianza

Varianza de líneas
= 80000
Varianza ponderada de las líneas
= 1268571.4286

Desviación estándar

Desviación estándar de líneas
= 282.8427
Desviación estándar ponderada de las líneas
= 1126,3088

Un caso de la vida real en el que se podría usar este análisis consiste en determinar el volumen del agua que hay en los ríos dentro de los límites de un parque estatal. Cada línea representa un río que se encuentra parcialmente situado dentro del parque. En los resultados, puede ver que hay 5 millas de ríos dentro del parque y que el volumen total es de 900 unidades.

Áreas

Las capas de áreas se resumen usando únicamente las proporciones de las entidades de área contenidas en el límite de entrada. Al resumir áreas, utilice campos con números absolutos para que los cálculos proporcionales tengan lógica en el análisis.

Las estadísticas ponderadas de las capas de área resumidas se basan en las proporciones de las entidades de Área de resumen que se encuentran dentro de la Capa de resumen. Cuando se resumen áreas, utilice recuentos y cantidades (en lugar de tasas e índices) para que los cálculos proporcionales tengan lógica en su análisis.

La figura y la tabla siguientes explican los cálculos estadísticos de una capa de áreas dentro de un Área de resumen hipotética. Se utilizó el campo Población para calcular las estadísticas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) de la capa. Las estadísticas estándar se calculan usando áreas que intersecan el Área de resumen y las estadísticas ponderadas se calculan usando un peso proporcional basado en la parte de áreas de resumen contenidas dentro de cada Capa resumida.

Resumir una capa de área
Las estadísticas de resumen se calculan para las áreas de la capa resumida que intersecan las áreas de resumen. Las ponderaciones se basan en la proporción de las áreas de resumen que se superponen con las entidades de capa resumidas.

Estadísticas numéricasEstadísticas estándar: Resultados de vecindad 1Estadísticas ponderadas: Resultados de vecindad 1

Calculando ponderaciones

Peso del área amarilla (valor = 3200):

4/(2+4) = 4/6

Peso del área verde (valor = 4700):

4/(2+4) = 2/3

Peso del área rosa (valor = 1000):

1/(1+1.5) = 2/5

Peso del área azul (valor = 4500):

6/(2+6) = 3/4

Peso del área naranja (valor = 3600):

2/(2+2) = 1/2

Recuento

Recuento de:

[3200, 4700, 1000, 4500, 3600] = 5

Recuento de:

(2/3)+(2/3)+ (2/5)+(3/4)+ (1/2) = 2,98

Suma

3200 + 4700 + 1000 + 4500 + 3600 = 17000
(3/4) x 3200 +(2/3) x 4700 + (2/5) x 1000 +(3/4) x 4500 + (1/2) x 3600 = 10841.67

Mínimo

Mínimo de:

[3200, 4700, 1000, 4500, 3600] = 1000

Mínimo de:

[(2/3) x 3200, (2/3) x 4700, (2/5) x 1000, (3/4) x 4500, (1/2) x 3600]
[2133,33, 3133,33, 400, 3375, 1800] = 400

Máximo

Máximo de:

[3200, 4700, 1000, 4500, 3600] = 4700

Máximo de:

[2133,33, 3133,33, 400, 3375, 1800] = 3375

Rango

4700 - 1000 = 3700
3375 - 400 = 2.975

Valor medio

(17000)/5 = 3400
(10841.67)/[2.9833] = 3634.12

Varianza

Varianza de áreas
= 2185000
Varianza ponderada de las áreas
= 1727137.5112

Desviación estándar

Desviación estándar de áreas
= 1478.175
Desviación estándar ponderada de las áreas
= 1314,2060

Parámetros

ParámetroDescripciónTipo de datos

Capa de entrada

Las entidades de punto, línea o polígono que se van a resumir dentro de entidades de área.

Entidades

Tipo de bin

La forma de bin que se utilizará para crear los bins regulares. Las opciones son Cuadrado y Hexágono.

Si se conecta un origen de polígono al puerto de unión de esta herramienta, este parámetro ya no aparecerá o no será necesario.

Cadena de caracteres

Tamaño de bin

El intervalo de distancia que representa el tamaño de bin en el que se agregará la entrada de puntos. En el caso de los bins cuadrados, el tamaño de bin representa la altura de un cuadrado. Esta es la opción predeterminada. En el caso de los bins hexagonales, el tamaño de bin representa la altura entre dos lados paralelos.

Si se conecta un origen de polígono al puerto de unión de esta herramienta, este parámetro ya no aparecerá o no será necesario.

Cadena de caracteres

Resumir formas

Especifica si se resumirá o no la información de forma como parte del análisis (longitud de líneas o área de polígonos). Si las entidades de resumen de entrada son puntos, no hay información de forma que resumir. Solo se agrega el recuento de puntos dentro de cada entidad de área.

Booleano

Unidades de forma

La unidad en la que se van a calcular los atributos de resumen de forma. Si las entidades de resumen de entrada son líneas, debe especificar una unidad lineal. Si las entidades de resumen de entrada son polígonos, debe especificar una unidad de área.

Cadena de caracteres

Campos de resumen

Las estadísticas que se calcularán para campos concretos. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.

  • Cualquiera: una cadena de caracteres de un campo de tipo cadena de caracteres.
  • Recuento: calcula el número de valores no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El recuento de [nulo, 0, 2] es 2.
  • Recuento de valores diferenciados: calcula el número de valores distintos y no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El resultado de Count distinct de [nulo, 4, 3, 4] es 2.
  • Suma: la suma de valores numéricos en un campo. La suma de [nulo, 1, 3] es 4.
  • Suma de cuadrados: la suma, sobre todas las observaciones, de las diferencias cuadradas de cada observación respecto del valor medio general. La suma de cuadrados de [nulo, 2,2, 3,1, 4,7] es 3,206.
  • Mín: el valor mínimo de un campo numérico. El mínimo de [0, 2, nulo] es 0.
  • Máx: el valor máximo de un campo numérico. El máximo de [0, 2, nulo] es 2.
  • Valor medio: el valor medio de los valores numéricos. La media de [0, 2, nulo] es 1.
  • Rango: el rango de un campo numérico. Se calcula como el valor mínimo restado del valor máximo. El rango de [0, nulo, 1] es 1. El rango de [nulo, 4] es 0.
  • Varianza: la varianza de un campo numérico en un recorrido. La varianza de [1] es nulo. La varianza de [nulo, 1, 1, 1] es 1.
  • Desviación estándar: la desviación estándar de un campo numérico. La desviación estándar de [1] es nulo. La desviación estándar de [nulo, 1, 1, 1] es 1.

Cadena de caracteres

Estadísticas ponderadas

Las estadísticas ponderadas geográficamente que se calcularán para campos concretos. Las estadísticas ponderadas calculan los valores usando los valores ponderados de la proporción de líneas que hay dentro de un polígono o la proporción de polígonos que hay dentro de un polígono. Las estadísticas ponderadas no se aplican a los puntos contenidos dentro de polígonos. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.

  • Recuento: calcula el número de valores no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El recuento de [nulo, 0, 2] es 2.
  • Suma: la suma de valores numéricos en un campo. La suma de [nulo, 1, 3] es 4.
  • Mín: el valor mínimo de un campo numérico. El mínimo de [0, 2, nulo] es 0.
  • Máx: el valor máximo de un campo numérico. El máximo de [0, 2, nulo] es 2.
  • Valor medio: el valor medio de los valores numéricos. La media de [0, 2, nulo] es 1.
  • Rango: el rango de un campo numérico. Se calcula como el valor mínimo restado del valor máximo. El rango de [0, nulo, 1] es 1. El rango de [nulo, 4] es 0.

Cadena de caracteres

Capa de salida

La capa de salida contendrá los siguientes campos en lugar de los campos originales. Si configuró campos de resumen, estos campos también se calcularán para la capa de salida.

Nombre de campoDescripciónTipo de campo

COUNT

El número de entidades de la capa de entrada que se resumieron en este bin de polígono.

Float64

sum_length_<units>

Si la capa de entrada es una entidad de polilínea y el parámetro Resumir formas se establece en , la salida generará este campo que informa de la longitud total de las entidades de polilínea dentro de cada bin, en las unidades especificadas en el parámetro Unidades de forma.

Float64

sum_area_<units>

Si la capa de entrada es una entidad poligonal y el parámetro Resumir formas se establecen en , la salida generará este campo que informa del área total de las entidades poligonales dentro de cada bin, en las unidades especificadas en el parámetro Unidades de forma.

Float64

Consideraciones y limitaciones

Las líneas y las áreas se resumen usando proporciones; por tanto, es mejor resumir los datos absolutos (como la población) en lugar de los datos relativos (como los ingresos medios) cuando se estén resumiendo líneas o áreas.