Resumir atributos

Icono de la herramienta Disponible en análisis de big data.

La herramienta Resumir atributos resume valores de campos similares para generar una tabla de resumen. La tabla de salida resultante muestra el recuento de las entidades resumidas, así como cualquier otra estadística adicional que se haya especificado.

Diagrama de flujo de trabajo

Diagrama del flujo de trabajo de la herramienta Resumir atributos

Ejemplo

A continuación se expone un ejemplo de caso de uso de la herramienta Resumir atributos:

Los tornados y huracanes son algunos de los tipos de tormentas más destructivos que se producen en Estados Unidos. Para entender cómo difiere su impacto, es necesario analizar los daños materiales y las pérdidas financieras causadas tanto por tornados como por huracanes. Tiene acceso a los datos de los tornados y huracanes en Estados Unidos en un único dataset y desea resumir toda la información para ver un resumen de los valores para todos los huracanes y un resumen de los valores para todos los tornados. Puede resumir los datos utilizando el tipo de tormenta para determinar las estadísticas para cada tipo de tormenta.

Notas de uso

Tenga en cuenta lo siguiente cuando trabaje con la herramienta Resumir atributos:

  • Las entradas pueden ser una capa tabular o una capa con geometría (puntos, líneas o áreas).
  • Puede utilizar esta herramienta con datos espaciales. Sin embargo, el resultado será tabular. A continuación, puede unir los resultados a los datos espaciales mediante la herramienta Unir entidades.
  • Esta es una herramienta de análisis tabular, no espacial. La tabla de salida consta de campos que contienen el resultado de la operación estadística.
  • Con el parámetro Campos, puede especificar uno o varios campos por los que resumir, o bien resumir todas las entidades. Cuando se resume por un solo campo, las estadísticas se calculan para cada valor de atributo único. Cuando se resume por varios campos, las estadísticas se calculan para cada combinación única de valores de atributos.
  • La tabla de salida de esta herramienta siempre incluye un recuento del número de entidades resumidas.
  • Se pueden calcular otras estadísticas con el parámetro Campos de resumen. Las estadísticas de los campos de resumen disponibles dependen del tipo de campo que esté resumiendo.
    • Un campo de atributo de cadena de caracteres puede utilizar las estadísticas cualquiera, recuento y recuento de valores diferenciados.
    • Un campo de atributo numérico puede utilizar las estadísticas Cualquiera, Recuento, Recuento de valores diferenciados, Suma, Suma de cuadrados, Mín., Máx., Rango, Varianza y Desviación estándar.
    • Un campo de atributo de fecha puede utilizar las estadísticas Cualquiera, Recuento, Mín., Máx. y Rango.

Funcionamiento de la herramienta Resumir atributos

La herramienta Resumir atributos calcula la varianza y resume las capas de entrada en grupos con valores de campo coincidentes. En las secciones siguientes se describen las ecuaciones, los cálculos, los parámetros y la tabla de salida.

Ecuaciones

La varianza se calcula usando la siguiente ecuación:

Ecuación de varianza
Variables de varianza

La desviación estándar se calcula como la raíz cuadrada de la varianza.

Cálculos

Las capas de entrada se resumen en grupos con valores de campos coincidentes. Los resultados son tabulares, de modo que no se pueden visualizar en el mapa. Puede utilizar un tipo de salida que incluya una capa de entidades. Para obtener más información sobre la tabla de salida generada por la capa de entidades, consulte la sección Tabla de salida de esta página.

En las tablas siguientes se ilustran los cálculos estadísticos de una capa que se ha resumido utilizando valores de campo similares. El campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento, Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) de la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) de la capa.

Campos de metadatos de la capa de entrada que se van a resumir

La tabla anterior se resumió en el campo Designation y el campo VO2 se utilizó para calcular las estadísticas numéricas (Recuento,Suma, Mínimo, Máximo, Rango, Valor medio, Desviación estándar y Varianza) para la capa. El campo Rating se utilizó para calcular las estadísticas de cadena de caracteres (Recuento y Cualquiera) para la capa. Este resultado es una tabla con dos entidades, que representan los distintos valores de Designation.

Agregar datos para la capa de resumen utilizando el campo Designación
Cuando la capa de entrada se resume utilizando el campo Designación, se proporcionan los valores de suma, mínimo y máximo.

En la tabla siguiente se representa el aspecto de los primeros campos cuando la capa se resume con los campos Designation y Age Group. Las estadísticas se calculan utilizando los mismos métodos que en el ejemplo anterior.

Resumen tabular de los campos Designación y Grupo de edad
La capa de entrada se resume utilizando los campos Designation y Age Group.

La estadística de recuento para los campos de cadena de caracteres y numéricos cuenta el número de valores no nulos. El recuento de los siguientes valores es de 5: [0, 1, 10, 5, nulo, 6] = 5. El recuento de este conjunto de valores es de 3: [Primario, Primario, Secundario, nulo] = 3.

Parámetros

A continuación se describen los parámetros de la herramienta Resumir atributos:

ParámetroExplicaciónTipo de datos

Capa de entrada

Las entidades de punto para las que se calcula la densidad.

Entidades

Campos (opcional)

Los campos utilizados para resumir entidades similares. Se puede utilizar uno o varios campos. Por ejemplo, si elige un solo campo llamado PropertyType que incluye valores de Comercial y Residencial, todos los campos residenciales se resumen juntos, los campos comerciales se resumen por separado y se calculan estadísticas de resumen para cada grupo.

Si se elige más de un campo, se resume cada combinación única de valores y se calculan estadísticas de resumen para esas combinaciones. Por ejemplo, considere un primer campo llamado PropertyType con los valores Comercial y Residencial, y un segundo campo llamado Occupied que incluye los valores y No. Hay cuatro combinaciones posibles para resumir; las estadísticas de resumen se calculan por separado para cada uno de estos cuatro grupos.

Cadena de caracteres

Campos de resumen (opcional)

Las estadísticas calculadas para los campos especificados. Las estadísticas disponibles varían según si el campo es un campo de fecha, numérico o de cadena de caracteres.

Los siguientes son los tipos de estadísticas disponibles:

  • Cualquiera: una cadena de caracteres de muestra tomada de un campo que contiene valores de cadena de caracteres.
  • Recuento: calcula el número de valores no nulos. Se puede utilizar en campos con valores numéricos o de cadena de caracteres. El recuento de [nulo, 0, 2] es 2.
  • Recuento de valores diferenciados: calcula el número de valores distintos y no nulos. Se puede utilizar en campos con valores numéricos o de cadena de caracteres. El resultado del recuento de valores diferenciados [nulo, 4, 3, 4] es 2.
  • Suma: la suma de valores numéricos en un campo. La suma de [nulo, 1, 3] es 4.
  • Suma de cuadrados: calcula la suma de las diferencias de valor cuadrado de cada observación respecto del valor medio general. La suma de cuadrados de [nulo, 2,2, 3,1, 4,7] es 3,206.
  • Mín: el valor mínimo de un campo numérico. El valor mínimo de [0, 2, nulo] es 0.
  • Máx: el valor máximo de un campo numérico. El valor máximo de [0, 2, nulo] es 2.
  • Valor medio: el valor medio de los valores numéricos. El valor medio de [0, 2, nulo] es 1.
  • Rango: el rango de un campo numérico. Se calcula como el valor mínimo restado del valor máximo. El rango de [0, nulo, 1] es 1, mientras que el rango de [nulo, 4] es 0.
  • Varianza: la varianza de un campo numérico en un recorrido. La varianza de [1] es nula, mientras que la varianza de [nulo, 1,1,1] es 1.
  • Desviación estándar: desviación estándar de un campo numérico. La desviación estándar de [1] es nula, mientras que la desviación estándar de [nulo, 1,1,1] es 1.

Cadena de caracteres

Tabla de salida

La salida de esta herramienta será una tabla que contendrá los campos proporcionados en el parámetro Campos, un atributo de recuento del número de entidades resumidas por ese registro y cualquier atributo resumido tal y como se especifica en el parámetro Campos de resumen.

Si se utiliza una capa de entidades espaciotemporales como tipo de salida, se crean tanto una capa de entidades espaciotemporales como una capa de imágenes de mapa.Si se utiliza una capa de entidades alojada de ArcGIS Online como tipo de salida, la tabla de salida es una Tabla (alojada).