Resumir atributos

Icono de la herramienta Disponible en análisis de big data.

La herramienta Resumir atributosIcono de la herramienta Resumir atributos resume valores de campo similares para generar una tabla de resumen. La capa resultante muestra el recuento de las entidades resumidas, así como cualquier otra estadística adicional que se haya especificado.

Diagrama de flujo de trabajo

Diagrama del flujo de trabajo de la herramienta Resumir atributos

Ejemplo

Los tornados y huracanes son algunos de los tipos de tormentas más destructivos que se producen en Estados Unidos. Quiere analizar los daños materiales y las pérdidas financieras derivados de los tornados y huracanes para comparar su impacto. Tiene acceso a los datos de los tornados y huracanes en Estados Unidos en un único dataset y desea resumir toda la información para ver un resumen de los valores para todos los huracanes y un resumen de los valores para todos los tornados. Puede resumir los datos utilizando el tipo de tormenta para determinar las estadísticas para cada tipo de tormenta.

Notas de uso

  • La herramienta Resumir atributos es una herramienta de análisis tabular, no espacial. La tabla de salida constará de campos que contienen el resultado de la operación estadística.
  • Con el parámetro Campos, si lo desea, puede especificar uno o varios campos por los que resumir, o bien resumir todas las entidades. Cuando se resume por un solo campo, las estadísticas se calculan para cada valor de atributo único. Cuando se resume por varios campos, las estadísticas se calculan para cada combinación única de valores de atributos.
  • La salida de esta herramienta siempre incluirá un recuento del número de entidades resumidas.
  • Se pueden calcular otras estadísticas con el parámetro Campos de resumen. Las estadísticas de los campos de resumen disponibles dependen del tipo de campo que esté resumiendo. Un campo de atributo de cadena de caracteres puede utilizar las estadísticas cualquiera, recuento y recuento de valores diferenciados. Un campo de atributo numérico puede utilizar las estadísticas cualquiera, recuento, recuento de valores diferenciados, suma, suma de cuadrados, mín., máx., rango, varianza y desviación estándar. Un campo de atributo de fecha puede utilizar las estadísticas cualquiera, recuento, mín., máx. y rango.

Cómo funciona Resumir atributos

A continuación, se describe cómo funciona la herramienta Resumir atributos.

Ecuaciones

La varianza se calcula usando la siguiente ecuación:

Ecuación de varianza
Variables de varianza

La desviación estándar se calcula como la raíz cuadrada de la varianza.

Cálculos

Las capas de entrada se resumen en grupos con valores de campos coincidentes. Los resultados son tabulares, de modo que no se pueden visualizar en el mapa.

En las tablas siguientes se ilustran los cálculos estadísticos de una capa que se ha resumido utilizando valores de campo similares. El campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) para la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) para la capa.

Capa de entrada que se va a resumir
Se muestra la capa de entrada que se va a resumir.

La tabla anterior se resumió en el campo Designation y el campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) para la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) para la capa. Este resultado es una tabla con dos entidades, que representan los distintos valores de Designation.

La capa de entrada resumida con el campo Designación.
Se muestra la capa de entrada que se ha resumido utilizando el campo Designación.

En la tabla siguiente se representa el aspecto de los primeros campos cuando la capa se resume con los campos Designation y Age Group. Las estadísticas se calculan utilizando los mismos métodos que en el ejemplo anterior.

La capa de entrada resumida utilizando los campos Designación y Grupo de edad
La capa de entrada se resume utilizando los campos Designation y Age Group.

La estadística de recuento (para campos de cadena de caracteres y numéricos) cuenta el número de valores no nulos. El recuento de los siguientes valores es de 5: [0, 1, 10, 5, null, 6] = 5. El recuento de este conjunto de valores es de 3: [Primary, Primary, Secondary, null] = 3.

Parámetros

ParámetroExplicaciónTipo de datos

Capa de entrada

Las entidades de punto cuya densidad se calculará.

Entidades

Campos (opcional)

Uno o varios campos usados para resumir entidades similares. Por ejemplo, si elige un único campo denominado PropertyType con los valores comercial y residencial, todos los campos residenciales se resumirán juntos, con el resumen de estadísticas calculado, y todos los campos comerciales se resumirán juntos.

Si elige más de un campo, cada combinación única de valores se resumiría junto con las estadísticas de resumen calculadas. Por ejemplo, considere un primer campo PropertyType con los valores comercial y residencial, y un segundo campo Occupied con los valores o No. Hay cuatro posibles combinaciones que se podrían resumir con las estadísticas de resumen calculadas.

Cadena de caracteres

Campos de resumen (opcional)

Las estadísticas que se calcularán para campos concretos. Existen diferentes estadísticas disponibles dependiendo de si el campo especificado es un campo de cadena de caracteres, numérico o de fecha.

Los siguientes son los tipos de estadísticas disponibles:

  • Cualquiera: esta es una cadena de caracteres de muestra de un campo de tipo cadena de caracteres.
  • Recuento: calcula el número de valores no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El recuento de [nulo, 0, 2] es 2.
  • Recuento de valores diferenciados: calcula el número de valores distintos y no nulos. Se puede usar en campos numéricos o de cadenas de caracteres. El resultado de Count distinct de [nulo, 4, 3, 4] es 2.
  • Suma: la suma de valores numéricos en un campo. La suma de [nulo, 1, 3] es 4.
  • Suma de cuadrados: la suma, sobre todas las observaciones, de las diferencias cuadradas de cada observación respecto del valor medio general. La suma de cuadrados de [nulo, 2,2, 3,1, 4,7] es 3,206.
  • Mín: el valor mínimo de un campo numérico. El mínimo de [0, 2, nulo] es 0.
  • Máx: el valor máximo de un campo numérico. El máximo de [0, 2, nulo] es 2.
  • Valor medio: el valor medio de los valores numéricos. El valor medio de [0,2, nulo] es 1.
  • Rango: el rango de un campo numérico. Se calcula como el valor mínimo restado del valor máximo. El rango de [0, nulo, 1] es 1. El rango de [nulo, 4] es 0.
  • Varianza: la varianza de un campo numérico en un recorrido. La varianza de [1] es nulo. La varianza de [nulo, 1,1,1] es 1.
  • Desviación estándar: la desviación estándar de un campo numérico. La desviación estándar de [1] es nulo. La desviación estándar de [nulo, 1,1,1] es 1.

Cadena de caracteres

Capa de salida

La capa de salida será una tabla que contendrá los campos proporcionados en el parámetro Campos, un atributo de recuento del número de entidades resumidas por ese registro y cualquier atributo resumido tal y como se especifica en el parámetro Campos de resumen.

Consideraciones y limitaciones

  • Las entradas pueden ser una capa tabular o una capa con geometría (puntos, líneas o áreas).
  • Aunque puede utilizar esta herramienta con datos espaciales, el resultado será tabular. A continuación, puede unir los resultados a los datos espaciales mediante la herramienta Unir entidades.