Usar herramientas de columna

Insights Desktop
Nota:

La ingeniería de datos está disponible en Insights desktop. Todos los usuarios de Insights in ArcGIS Online y Insights in ArcGIS Enterprise tienen acceso a Insights desktop. Para obtener más información, consulte Introducción a ArcGIS Insights.

La ingeniería de datos está actualmente en Vista previa.

Las herramientas de columna se utilizan para hacer cambios en los datos de una columna específica y se accede a ellas desde columnas individuales de las tablas situadas debajo del modelo. Las herramientas de columna se agregan al modelo de datos después de aplicarse.

Convertir tipo de datos

Los tipos de datos se aplican a todas las columnas de Insights. Según el formato de los datos de entrada, es posible que el tipo de datos predeterminado no sea correcto para todas las columnas. Por ejemplo, los archivos .csv no admiten el formato de fecha/hora, por lo que todas las columnas de fecha/hora se importarán como cadenas de caracteres.

Las columnas se pueden convertir en tipos de datos de cadena de caracteres, entero, doble o fecha/hora mediante la herramienta Convertir tipo de datos.

Siga los pasos que se indican a continuación para convertir el tipo de datos:

  1. Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
  2. Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
    Nota:

    Si la vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla Mostrar tabla.

  3. Seleccione Convertir tipo de datos.
  4. En Tipo de datos de salida, elija el tipo de datos en el que desea convertir la columna y aplique las opciones de formato necesarias:
    • Para convertir una columna en fecha/hora, especifique el formato de fecha/hora.
    • Para convertir el entero o doble, seleccione el tipo de separador decimal utilizado en los datos (Punto o Coma).
  5. Haga clic en Aplicar.

La columna se convierte en el tipo de datos seleccionado.

Entero

Los tipos de datos enteros son números sin valores decimales.

Cualquier columna con números se puede convertir en un entero. Si la columna contiene caracteres que no son números, estos caracteres se eliminan.

Si la columna contiene valores decimales, los números situados detrás del decimal se eliminan y el entero no se redondea. Para redondear un número, puede convertir la columna en doble y calcular una nueva columna con la función ROUND().

Los tipos de datos enteros se leen como campos numéricos en un libro de trabajo Insights.

Doble

Los tipos de datos dobles (o punto flotante de precisión doble) son números que permiten valores decimales.

Cualquier columna con números se puede convertir en doble. Si la columna contiene caracteres que no son números, estos caracteres se eliminan.

Los tipos de datos dobles se leen como campos numéricos en los libros de trabajo de Insights.

Fecha/hora

Las columnas de fecha/hora pueden ser de solo fecha, solo hora o fecha y hora.

Se requiere un formato de fecha/hora para convertir una columna en un tipo de datos de fecha/hora. El formato de fecha/hora predeterminado es ISO 8601. Si los datos no utilizan el formato ISO 8601, debe cambiar el formato en el cuadro Formato personalizado para que coincida con los datos.

Nota:

Todas las fechas y horas de una única columna deben utilizar el mismo formato. Se recomienda incluir un componente de periodo para todos los valores de tiempo que utilicen un reloj de 12 horas a fin de garantizar que se utiliza la hora correcta.

Se admiten las siguientes variables para el formato de fecha/hora:

Componente de fecha/horaVariableValores admitidos

Mes

MM

01 a 12

M

1 a 12

Día

DD

01 a 31

D

1 a 31

Año

AAAA

Año de cuatro dígitos

AA

Año de dos dígitos (00 a 99)

Hora

HH

00 a 24

H

0 a 24

hh

01 a 12

h

1 a 12

Minuto

mm

00 a 59

m

0 a 59

Segundo

ss

00 a 59

s

0 a 59

Periodo

A

AM, PM o el formato de período compatible basado en su ubicación.

a

Zona horaria

ZZ

+HHmm o -HHmm

TZD

+hh:mm o -hh:mm

Valores de filtro

Los filtros de atributos utilizan consultas para eliminar datos innecesarios de un dataset. Puede utilizar la herramienta Filtrar valores para reducir el tamaño del dataset e incluir solo los datos que sean relevantes para el análisis. Por ejemplo, puede eliminar entradas con valores nulos o filtrar datos solo en función de un área de estudio o un rango de fechas especificados.

Siga estos pasos para filtrar valores:

  1. Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
  2. Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
    Nota:

    Si la vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla Mostrar tabla.

  3. Elija Filtrar valores.
  4. Para filtrar columnas, lleve a cabo una de las siguientes acciones:
    • Para columnas de cadena de caracteres, seleccione o anule la selección de los valores únicos que desea mostrar o excluir.
    • Para columnas de números o índice/ratio, ajuste el control deslizante por los extremos superior e inferior del rango o haga clic en los nodos y proporcione un nuevo valor.
    • Para columnas de fecha/hora, utilice los botones de calendario y reloj para ajustar la fecha y hora de inicio y finalización, respectivamente. También puede escribir una fecha u hora directamente en el filtro.

    Para obtener más información acerca de cómo aplicar la configuración de filtro para cada tipo de datos, consulte Filtrar datos.

  5. Haga clic en Aplicar.

Se aplica el filtro y se eliminan las filas que no coinciden con los criterios del filtro.

Buscar y reemplazar

Nota:

La herramienta Buscar y reemplazar actualmente solo está disponible para las columnas de cadena de caracteres. Para reemplazar los valores de las columnas número o fecha/hora, debe convertir la columna en una cadena de caracteres, reemplazar la cadena de caracteres y volver a convertir la columna al tipo de datos original.

Buscar y reemplazar se utiliza para buscar valores específicos en la columna y reemplazarlos por un nuevo valor. Esta herramienta se puede utilizar para reemplazar valores de marcador de posición o predeterminados con valores nulos, corregir cadenas mal escritas o crear mayúsculas y minúsculas coherentes entre otros usos.

Realice estos pasos buscar y reemplazar valores:

  1. Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
  2. Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
    Nota:

    Si la vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla Mostrar tabla.

  3. Elija Buscar y reemplazar.
  4. Para buscar y reemplazar valores, realice una de las siguientes acciones:
    • Para cadenas personalizadas, permanezca en la pestaña Cadena de caracteres (predeterminada) y, en el cuadro de texto Buscar, escriba una cadena de caracteres personalizada para buscarla en la columna. Si lo desea, seleccione Hacer coincidir casos para que la búsqueda distinga entre mayúsculas y minúsculas y seleccione Coincidir solo palabra completa para que solo se devuelvan las coincidencias de cadenas de caracteres completas.
    • Para valores cadena de caracteres vacía, haga clic en la pestaña Cadena de caracteres vacía.
    • Para valores nulos, haga clic en la pestaña Nulo.
  5. Especifique el valor de sustitución realizando una de las acciones siguientes:
    • En el cuadro de texto Reemplazar por, escriba la cadena de caracteres que desea utilizar para reemplazar las cadenas de caracteres coincidentes.
    • Deje el cuadro de texto Reemplazar por vacío para reemplazar por cadenas de caracteres vacías.
    • Para reemplazar cadenas de caracteres vacías por valores nulos (pestaña Cadena de caracteres vacía), seleccione Reemplazar por nulo.
  6. De manera opcional, haga clic en Buscar para buscar y resaltar las cadenas de caracteres coincidentes.
  7. Haga clic en Reemplazar para buscar y reemplazar las cadenas de caracteres coincidentes.
  8. Repita los pasos anteriores para buscar y reemplazar cadenas de caracteres adicionales o haga clic en Hecho para cerrar el cuadro de diálogo.

Se actualizan las cadenas de caracteres coincidentes.

Quitar columna

Utilice la herramienta Quitar columna para excluir columnas innecesarias del dataset de salida. Una columna eliminada no se puede mostrar más tarde durante el análisis usando Mostrar campos ocultos. Quitar una columna solo afecta al dataset de salida y no elimina la columna del dataset de origen.

Nota:

Los datasets de los libros de trabajo de datos deben tener al menos una columna. La herramienta Eliminar columna está deshabilitada para los datasets con solo una columna.

Siga estos pasos para eliminar una columna del dataset:

  1. Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
  2. Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
    Nota:

    Si la vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla Mostrar tabla.

  3. Seleccione Eliminar columna.

La columna se elimina de la tabla.

Mostrar resumen de columnas

La herramienta Mostrar resumen de columnas crea un gráfico de distribución y calcula estadísticas usando datos de la columna. El resumen se puede utilizar para buscar problemas en los datos, como, por ejemplo, cadenas de caracteres mal escritas o valores atípicos.

Nota:

La herramienta Mostrar resumen de columnas crea una visualización de los valores de una columna, en lugar de cambiar los valores. Mostrar resumen de columnas no se agrega al modelo de datos.

Siga estos pasos para crear un resumen de columnas:

  1. Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
  2. Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
    Nota:

    Si la vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla Mostrar tabla.

  3. Haga clic en Mostrar resumen de columnas.

Aparece un panel lateral con un gráfico y estadísticas para la columna.

Columnas de cadena de caracteres

Las columnas de cadena de caracteres crean un resumen de gráfico de barras. El gráfico de barras muestra los valores únicos en la columna con el recuento de entidades y el resumen presenta estadísticas del recuento total de entidades, el recuento de valores nulos, el recuento de cadenas de caracteres vacías y el número total de valores únicos. Use el control deslizante del lado del gráfico para acercar todos los valores únicos si es necesario. Utilice el botón Ordenar Ordenar para ordenar el gráfico en orden ascendente, descendente o alfabético.

Para realizar selecciones en el resumen del gráfico de barras, haga clic en las barras individuales. Las selecciones del resumen de la columna se reflejan en la vista de tabla o en la vista de mapa si corresponde.

Estos son los posibles problemas de un resumen de columnas de cadenas de caracteres:

  • ¿La columna contiene valores nulos y cadenas vacías? Los valores nulos y las cadenas de caracteres vacías se analizarán por separado. Utilice la herramienta Buscar y reemplazar para reemplazar valores nulos con cadenas vacías, o viceversa.
  • ¿Todos los valores utilizan mayúsculas o minúsculas? El uso incoherente de mayúsculas y minúsculas puede dar lugar a valores separados incorrectamente que deberían agregarse como un único valor único. Utilice la herramienta Buscar y reemplazar para realizar una búsqueda de una cadena de caracteres sin distinción entre mayúsculas y reemplazar todos los valores coincidentes por un único valor.
  • ¿La columna contiene valores mal escritos? Los errores ortográficos darán lugar a agregaciones inexactas. Utilice la herramienta Buscar y reemplazar para buscar el valor mal escrito y escribirlo correctamente.

Número de columnas

Las columnas numéricas crean un resumen del histograma. El histograma agrega los números en bins y muestra la frecuencia de los valores dentro de cada bin. La media y la mediana se muestran en el histograma y el resumen muestra estadísticas para el recuento total de entidades, el recuento de valores nulos, el valor medio, la mediana aproximada, el cuartil superior e inferior, la desviación estándar, el sesgo y el exceso de curtosis. Use el control deslizante que hay debajo del eje x para cambiar el número de bins del histograma.

Para realizar selecciones en el resumen del histograma, haga clic en las barras individuales. Las selecciones del resumen del histograma se reflejan en la vista de tabla o en la vista de mapa si corresponde.

Estos son los posibles problemas de un resumen de columnas de números:

  • ¿Contiene el dataset valores atípicos o valores fuera del rango esperado? Por ejemplo, si la columna incluye valores porcentuales, el rango esperado es de 0 a 100. Use la herramienta Filtrar valores para eliminar las filas con valores incorrectos.
  • ¿Los datos están distribuidos normalmente? Algunos análisis estadísticos, como Crear modelo de regresión, requieren datos distribuidos normalmente. Utilice la herramienta Calcular columna para aplicar una transformación a la columna.
  • ¿Contiene el dataset un marcador de posición o valores predeterminados que se deben eliminar (por ejemplo, 9999)? Utilice la herramienta Buscar y reemplazar para reemplazar los valores nulos, si procede, o utilice la herramienta Filtrar valores para eliminar las filas que contengan un marcador de posición o valores predeterminados.
    Nota:

    Actualmente, la herramienta Buscar y reemplazar solo admite columnas de cadenas de caracteres. Debe convertir la columna de números en una cadena de caracteres, reemplazar la cadena de caracteres y volver a convertir la columna en un número (entero o doble).

Columnas de fecha/hora

Las columnas de fecha/hora crean un resumen de serie temporal. La serie temporal agrega los valores de fecha/hora en intervalos y muestra el recuento de cada intervalo. El resumen muestra el recuento total de entidades, la fecha mínima, la fecha máxima y el recuento de valores nulos. Utilice el control deslizante sobre la serie temporal para acercarse y visualizar el gráfico a una escala más granular. Si el nivel de zoom supera un umbral requerido, el intervalo de fecha/hora se actualiza al intervalo adecuado.

Para realizar selecciones en el resumen de la serie temporal, haga clic en puntos de tiempo individuales. Las selecciones del resumen de la serie temporal se reflejan en la vista de tabla o en la vista de mapa, si corresponde.

Estos son los posibles problemas de un resumen de columnas de fecha/hora:

  • ¿Las fechas están dentro del rango de fechas requerido? Utilice la herramienta Filtrar valores para mantener solo los valores comprendidos dentro del rango de fecha/hora deseado.
  • ¿Contiene el dataset un marcador de posición o valores predeterminados que se deben eliminar (por ejemplo, 1000-01-01)? Utilice la herramienta Buscar y reemplazar para reemplazar los valores nulos, si procede, o utilice la herramienta Filtrar valores para eliminar las filas que contengan un marcador de posición o valores predeterminados.
    Nota:

    Actualmente, la herramienta Buscar y reemplazar solo admite columnas de cadenas de caracteres. Debe convertir la columna de fecha/hora en una cadena de caracteres, reemplazar la cadena de caracteres y volver a convertir la columna en fecha/hora.