Nota:
La ingeniería de datos está disponible en Insights desktop. Todos los usuarios de Insights in ArcGIS Online y Insights in ArcGIS Enterprise tienen acceso a Insights desktop. Para obtener más información, consulte Descripción general de ArcGIS Insights.
La ingeniería de datos está actualmente en Vista previa.
Las herramientas de columna se utilizan para hacer cambios en los datos de una columna específica y se accede a ellas desde columnas individuales de las tablas situadas debajo del modelo. Las herramientas de columna se agregan al modelo de datos después de aplicarse.
Convertir tipo de datos
Los tipos de datos se aplican a todas las columnas de Insights. Según el formato de los datos de entrada, es posible que el tipo de datos predeterminado no sea correcto para todas las columnas. Por ejemplo, los archivos .csv no admiten el formato de fecha/hora, por lo que todas las columnas de fecha/hora se importarán como cadenas de caracteres.
Las columnas se pueden convertir en tipos de datos de cadena de caracteres, entero, doble o fecha/hora.
Realice los siguientes pasos para utilizar Convertir tipo de datos:
- Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
- Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
Nota:
Si su vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla .
- Seleccione Convertir tipo de datos.
- En Tipo de datos de salida, elija el tipo de datos en el que desea convertir la columna y aplique las opciones de formato necesarias:
- Si va a convertir una columna en fecha/hora, introduzca el formato de fecha/hora.
- Si va a convertir en entero o doble, seleccione el tipo de separador decimal utilizado en sus datos (punto o coma).
- Haga clic en Aplicar.
La columna se convierte en el tipo de datos seleccionado.
Entero
Los tipos de datos enteros son números sin valores decimales.
Cualquier columna con números se puede convertir en un entero. Si la columna contiene caracteres que no son números, estos caracteres se eliminan.
Si la columna contiene valores decimales, los números situados detrás del decimal se eliminan y el entero no se redondea. Si desea redondear el número, puede convertir la columna en doble y calcular una nueva columna con la función ROUND().
Los tipos de datos enteros se leen como campos numéricos en un libro de trabajo Insights.
Doble
Los tipos de datos dobles (o punto flotante de precisión doble) son números que permiten valores decimales.
Cualquier columna con números se puede convertir en doble. Si la columna contiene caracteres que no son números, estos caracteres se eliminan.
Los tipos de datos dobles se leen como campos numéricos en los libros de trabajo de Insights.
Fecha/hora
Las columnas de fecha/hora pueden ser de solo fecha, solo hora o fecha y hora.
Se requiere un formato de fecha/hora para convertir una columna en un tipo de datos de fecha/hora. El formato de fecha/hora predeterminado es ISO 8601. Si sus datos no utilizan el formato ISO 8601, debe cambiar el formato en el cuadro Formato personalizado para que coincida con sus datos.
Nota:
Todas las fechas y horas de una única columna deben utilizar el mismo formato. Se recomienda incluir un componente de periodo para todos los valores de tiempo que utilicen un reloj de 12 horas para garantizar que se utiliza la hora correcta.
Se admiten las siguientes variables para crear su formato de fecha/hora:
Componente de fecha/hora | Variable | Valores admitidos |
---|---|---|
Mes | MM | 01 a 12 |
M | 1 a 12 | |
Día | DD | 01 a 31 |
D | 1 a 31 | |
Año | AAAA | Año de cuatro dígitos |
aa | Año de dos dígitos (00 a 99) | |
Hora | HH | 00 a 24 |
H | 0 a 24 | |
hh | 01 a 12 | |
h | 1 a 12 | |
Minuto | mm | 00 a 59 |
m | 0 a 59 | |
Segundo | ss | 00 a 59 |
s | 0 a 59 | |
Periodo | A | AM, PM o el formato de período compatible basado en su ubicación. |
a | ||
Zona horaria | ZZ | +HHmm o -HHmm |
TZD | +hh:mm o -hh:mm |
Valores de filtro
Los filtros de atributos utilizan consultas para eliminar datos innecesarios del dataset. Esta herramienta se puede utilizar para reducir el tamaño del dataset e incluir solo los datos que sean relevantes para su análisis. Por ejemplo, es posible que desee eliminar entradas con valores nulos o filtrar datos solo en función de un área de estudio o un rango de fechas especificados.
Realice estos pasos para utilizar Filtrar valores:
- Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
- Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
Nota:
Si su vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla .
- Elija Filtrar valores.
- Realice una de las siguientes acciones:
- Para filtrar columnas de cadena de caracteres, seleccione o anule la selección de los valores únicos que desea mostrar o excluir.
- Para filtrar columnas de números o índice/ratio, ajuste el control deslizante por los extremos superior e inferior del rango o haga clic en los nodos y proporcione un nuevo valor.
- Para filtrar columnas de fecha/hora, utilice los botones de calendario y reloj para ajustar la fecha y hora de inicio y finalización, respectivamente. También puede escribir una fecha u hora directamente en el filtro.
Para obtener más información sobre cómo aplicar la configuración de filtro para cada tipo de datos, consulte Filtrar datos.
- Haga clic en Aplicar.
Se aplica el filtro y se eliminan las filas que no coinciden con los criterios del filtro.
Buscar y reemplazar
Nota:
Buscar y reemplazar está disponible actualmente para las columnas de cadena de caracteres. Para reemplazar los valores de las columnas número o fecha/hora, debe convertir la columna en una cadena de caracteres, reemplazar la cadena de caracteres y volver a convertir la columna al tipo de datos original.
Buscar y reemplazar se utiliza para buscar valores específicos en la columna y reemplazarlos por un nuevo valor. Esta herramienta se puede utilizar para reemplazar valores de marcador de posición o predeterminados con valores nulos, corregir cadenas mal escritas o crear mayúsculas y minúsculas coherentes entre otros usos.
Realice estos pasos para usar Buscar y reemplazar:
- Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
- Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
Nota:
Si su vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla .
- Elija Buscar y reemplazar.
- Realice una de las siguientes acciones:
- Para buscar y reemplazar cadenas de caracteres personalizadas, permanezca en la pestaña Cadena de caracteres (predeterminado). En el cuadro Buscar, escriba una cadena de caracteres personalizada para buscar en la columna. Seleccione Hacer coincidir casos para que la búsqueda distinga entre mayúsculas y minúsculas seguido de Coincidir solo palabra completa para que solo se devuelvan las coincidencias de cadenas de caracteres completas, si es necesario.
- Para buscar y reemplazar valores de cadena de caracteres vacíos, haga clic en la pestaña Cadena de caracteres vacía.
- Para buscar y reemplazar valores nulos, haga clic en la pestaña Nulo.
- En el cuadro Reemplazar por, escriba la cadena de caracteres por la que desea reemplazar las cadenas de caracteres coincidentes. Deje el cuadro Reemplazar por para reemplazar por cadenas de caracteres vacías. Si va a reemplazar cadenas de caracteres vacías por valores nulos (pestaña Cadena de caracteres vacía), seleccione Reemplazar por nulo.
- De manera opcional, haga clic en Buscar para buscar y resaltar las cadenas de caracteres coincidentes.
- Haga clic en Reemplazar para buscar y reemplazar las cadenas de caracteres coincidentes.
- Repita los pasos para buscar y reemplazar cadenas de caracteres adicionales o haga clic en Hecho para cerrar el cuadro de diálogo.
Se actualizan las cadenas de caracteres coincidentes.
Quitar columna
La herramienta Quitar columna se utiliza para excluir columnas innecesarias del dataset de salida. Una columna eliminada no se puede mostrar más tarde durante el análisis usando Mostrar campos ocultos. Quitar una columna solo afecta al dataset de salida y no elimina la columna del dataset de origen.
Nota:
Los datasets de los libros de trabajo de datos deben tener al menos una columna. Eliminar columna está deshabilitada para los datasets con solo una columna.
Siga estos pasos para eliminar una columna del dataset.
- Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
- Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
Nota:
Si su vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla .
- Seleccione Eliminar columna.
La columna se elimina de la tabla.
Mostrar resumen de columnas
Mostrar resumen de columnas crea un gráfico de distribución y calcula estadísticas usando datos de la columna. El resumen se puede utilizar para buscar problemas en sus datos, como cadenas de caracteres mal escritas o valores atípicos.
Nota:
Mostrar resumen de columnas crea una visualización de los valores de una columna, en lugar de cambiar los valores. Por lo tanto, Mostrar resumen de columnas no se agrega al modelo de datos.
Siga estos pasos para crear un resumen de columnas:
- Abra un libro de trabajo de datos en Insights desktop y agregue datos, si es necesario.
- Haga clic en la flecha situada junto al nombre de una columna para expandir el menú de herramientas de la columna.
Nota:
Si su vista es solo de modelo o mapa, haga clic en el botón Mostrar tabla .
- Haga clic en Mostrar resumen de columnas.
Aparece un panel lateral con un gráfico y estadísticas para la columna.
Columnas de cadena de caracteres
Las columnas de cadena de caracteres crean un resumen de gráfico de barras. El gráfico de barras muestra los valores únicos en la columna con el recuento de entidades y el resumen presenta estadísticas del recuento total de entidades, el recuento de valores nulos, el recuento de cadenas de caracteres vacías y el número total de valores únicos. Use el control deslizante del lado del gráfico para acercar y ver todos los valores únicos, si es necesario. Utilice el botón Ordenar para ordenar el gráfico en orden ascendente, descendente o alfabéticamente.
Puede realizar selecciones en el resumen del gráfico de barras haciendo clic en barras individuales. Las selecciones del resumen de la columna se reflejan en la vista de tabla o en la vista de mapa, si corresponde.
Busque los siguientes problemas en un resumen de columnas de cadenas de caracteres:
- ¿La columna contiene valores nulos y cadenas vacías? Los valores nulos y las cadenas de caracteres vacías se analizarán por separado. Utilice la herramienta Buscar y reemplazar para reemplazar valores nulos con cadenas vacías, o viceversa.
- ¿Todos los valores utilizan mayúsculas o minúsculas? El uso incoherente de mayúsculas y minúsculas puede dar lugar a valores separados incorrectamente que deberían agregarse como un único valor único. Utilice la herramienta Buscar y reemplazar para buscar una cadena de caracteres sin distinción entre mayúsculas y minúsculas y reemplazar todos los valores coincidentes con un solo valor.
- ¿La columna contiene valores mal escritos? Los errores ortográficos darán lugar a agregaciones inexactas. Utilice la herramienta Buscar y reemplazar para buscar el valor mal escrito y escribirlo correctamente.
Número de columnas
Las columnas numéricas crean un resumen del histograma. El histograma agrega los números en bins y muestra la frecuencia de los valores dentro de cada bin. Los valores medio y la mediana se muestran en el histograma y el resumen muestra estadísticas para el recuento total de entidades, el recuento de valores nulos, el valor medio, la mediana aproximada, el cuartil superior e inferior, la desviación estándar, el sesgo y el exceso de curtosis. Use el control deslizante que hay debajo del eje x para cambiar el número de bins del histograma.
Puede realizar selecciones en el resumen del histograma haciendo clic en barras individuales. Las selecciones del resumen del histograma se reflejan en la vista de tabla o en la vista de mapa, si corresponde.
Busque los siguientes problemas en un resumen de columnas de números:
- ¿Contiene el dataset valores atípicos o valores fuera del rango esperado? Por ejemplo, si la columna incluye valores porcentuales, el rango esperado es de 0 a 100. Use la herramienta Filtrar valores para eliminar las filas con valores incorrectos.
- ¿Los datos están distribuidos normalmente? Algunos análisis estadísticos, como Crear modelo de regresión, requieren datos distribuidos normalmente. Utilice la herramienta Calcular columna para aplicar una transformación a la columna.
- ¿Contiene el dataset un marcador de posición o valores predeterminados que se deben eliminar (por ejemplo, 9999)? Utilice la herramienta Buscar y reemplazar para reemplazar los valores nulos, si procede, o utilice la herramienta Filtrar valores para eliminar las filas que contengan un marcador de posición o valores predeterminados.
Nota:
Actualmente, Buscar y reemplazar solo admite columnas de cadena de caracteres. Debe convertir la columna de números en una cadena de caracteres, reemplazar la cadena de caracteres y después volver a convertir la columna en un número (entero o doble).
Columnas de fecha/hora
Las columnas de fecha/hora crean un resumen de serie temporal. La serie temporal agrega los valores de fecha/hora en intervalos y muestra el recuento de cada intervalo. El resumen muestra el recuento total de entidades, la fecha mínima, la fecha máxima y el recuento de valores nulos. Utilice el control deslizante sobre la serie temporal para acercarse y visualizar el gráfico a una escala más granular. Si el nivel de zoom supera un umbral requerido, el intervalo de fecha/hora se actualiza al intervalo adecuado.
Puede realizar selecciones en el resumen de la serie temporal haciendo clic en puntos de tiempo individuales. Las selecciones del resumen de la serie temporal se reflejan en la vista de tabla o en la vista de mapa, si corresponde.
Busque los siguientes problemas en un resumen de columnas de fecha/hora:
- ¿Las fechas están dentro del rango de fechas requerido? Utilice la herramienta Filtrar valores para mantener solo los valores comprendidos dentro del rango de fecha/hora deseado.
- ¿Contiene su dataset un marcador de posición o valores predeterminados que se deben eliminar (por ejemplo, 1000-01-01)? Utilice la herramienta Buscar y reemplazar para reemplazar los valores nulos, si procede, o utilice la herramienta Filtrar valores para eliminar las filas que contengan un marcador de posición o valores predeterminados.
Nota:
Actualmente, Buscar y reemplazar solo admite columnas de cadena de caracteres. Debe convertir la columna de fecha/hora en una cadena de caracteres, reemplazar la cadena de caracteres y volver a convertir la columna en fecha/hora.