Archivo—ArcGIS Data Pipelines

Utilice registros en archivos como entrada para ArcGIS Data Pipelines.

Notas de uso

Tenga en cuenta lo siguiente a la hora de trabajar con archivos:

El uso de entrada de archivo permite cargar datos de archivos disponibles en el contenido de ArcGIS Online.
Cuando agregue una entrada de archivo al lienzo, aparecerá el cuadro de diálogo Seleccionar un archivo con las siguientes opciones:
- Explorar archivos existentes: busque contenido de un elemento cargado anteriormente. Puede examinar su contenido, el contenido que se ha compartido con usted y el contenido que está disponible para su organización y ArcGIS Online.
- Cargar un archivo nuevo: cargue un archivo desde el disco o elija de una lista de opciones alojadas en la nube. Consulta Agregar archivos como elementos para obtener más información.
Data Pipelines no es compatible con todos los tipos de archivos que se pueden cargar directamente en su contenido. Consulte la información de formato de archivo siguiente correspondiente a los formatos admitidos.
El parámetro Formato de archivo se completa automáticamente con el formato del archivo que selecciona. Son compatibles las siguientes opciones de formato:
- CSV o delimitado: archivo que contiene valores delimitados (.csv)
- Shapefile: una carpeta comprimida que contiene un conjunto de archivos relacionados que componen el shapefile (.shp)
- GeoJSON: un formato de intercambio de datos geoespaciales de código abierto que representa entidades geográficas sencillas y sus atributos no espaciales (.geojson o .json)
- Parquet: un formato de almacenamiento y uso compartido no espacial, tabular, en columnas y muy comprimido (.parquet)
- Geodatabase de archivos: geodatabase de archivos comprimida (.gdb)
Si se especifica la opción de formato CSV o delimitado, estarán disponibles los siguientes parámetros de definición del dataset:
- Delimitador: el delimitador se utiliza para dividir los valores de campo (o columna) y registro (o fila). De manera predeterminada está delimitado por comas (,). Otros formatos de delimitador habituales son, entre otros, el tabulador (\t), el punto y coma (;), la barra vertical (|) y las barras diagonales e invertidas (/ y \).
- Tiene fila de encabezado: especifica si el dataset contiene una fila de encabezado. El valor predeterminado es true. Si se establece en false (falso), la primera fila del dataset se considerará un registro.
- Tiene datos multilínea: especifica si el dataset incluye registros que contienen caracteres de nueva línea. El valor predeterminado es falso. Si se establece en true, los datos que contengan datos multilínea se leerán y formatearán correctamente.
- Codificación de caracteres: especifica el tipo de codificación que se utilizará para leer el dataset especificado. El valor predeterminado es UTF -8. Puede elegir entre las opciones de codificación disponibles o especificar un tipo de codificación. No se admiten espacios en los valores de codificación. Por ejemplo, especificar un valor de ISO 8859-8 no es válido y debe especificarse como ISO-8859-8.

Campos está disponible para configurar tipos y nombres de campo cuando el valor del formato de datos es CSV o delimitado. El botón Configurar esquema abre un cuadro de diálogo que contiene los campos de dataset con las opciones siguientes:

Incluir o anular campos: puede eliminar los campos activando la casilla de verificación situada junto al campo. Por defecto, se incluyen todos los campos.
Nombre de campo: nombre del campo tal y como se utilizará en Data Pipelines. Este valor se puede editar. De forma predeterminada, este valor será igual que el del campo del dataset de origen a menos que el nombre de origen contenga caracteres no válidos o sea una palabra reservada. Los caracteres no válidos se sustituirán por un guion bajo (_) y las palabras reservadas tendrán un prefijo y un guion bajo (_).
Tipo de campo: el tipo de campo tal como se utilizará en Data Pipelines. Este valor se puede editar.

En la siguiente tabla se describen los tipos de campos disponibles:


Tipo de campo	Descripción
Cadena de caracteres	Los campos de cadena de caracteres admiten una cadena de caracteres de texto.
Entero pequeño	Los campos de enteros pequeños admiten números enteros entre -32768 y 32767.
Entero	Los campos de enteros admiten números enteros entre -2147483648 y 2147483647.
Entero grande	Los campos de enteros grandes admiten números enteros entre -9223372036854776000 y 9223372036854776000.
Flotante	Los campos flotantes admiten números fraccionarios entre -3,4E38 y 3,4E38, aproximadamente.
Doble	Los campos dobles admiten números fraccionarios entre -2,2E308 y 1,8E308, aproximadamente.
Fecha	Los campos de fecha admiten valores en formato yyyy-MM-dd HH:mm:ss; por ejemplo, un valor válido es 2022-12-31 13:30:30. Si los valores de fecha se almacenan en un formato de diferente, utilice la herramienta Crear fecha y hora para calcular un campo de fecha.
Booleano	Los campos booleanos admiten valores de True y False. Si un campo contiene representaciones de enteros de valores booleanos (0 y 1), utilice la herramienta Actualizar campos para convertir los números enteros en valores booleanos.

Si se especifica la opción de formato GeoJSON, el parámetro Tipo de geometría está disponible. Este parámetro es opcional. De forma predeterminada, se utiliza el tipo de geometría del archivo GeoJSON. Si el archivo GeoJSON contiene más de un tipo de geometría, debe especificar el valor para este parámetro. Los tipos de geometría mixtos son incompatibles y solo se utilizará el tipo especificado. Las opciones son Punto, Multipunto, Polilínea y Polígono. Se calculará automáticamente un campo de geometría que contiene las ubicaciones de los datos GeoJSON y se agregará al dataset de entrada. El campo geometría puede utilizarse como entrada para operaciones espaciales o para activar la geometría en el resultado de salida.
Si se especifica la opción de formato Geodatabase de archivos, el parámetro Clase de entidades o nombre de tabla pasará a estar disponible. Utilice este parámetro para especificar el nombre de la clase o tabla de entidades que desea utilizar como entrada. Solo se admiten clases de entidades de punto, multipunto, polilínea y polígono, y tablas. No se admiten datasets como ráster, mosaico, trayectoria y otros. No se admiten tipos de entidades avanzadas, como las entidades de red geométrica.
Para mejorar el rendimiento de la lectura de los datasets de entrada, tenga en cuenta las opciones siguientes:
- Utilice el parámetro Usar almacenamiento en caché para almacenar una copia del dataset. La copia en caché solo se mantiene mientras al menos una pestaña abierta del navegador esté conectada al editor. Esto puede hacer que sea más rápido acceder a los datos durante el procesamiento. Si los datos de origen se han actualizado desde que se almacenaron en caché, desmarque este parámetro y vuelva a realizar la vista previa o a ejecutar la herramienta.
- Tras configurar un dataset de entrada, configure cualquiera de las herramientas siguientes que limitan la cantidad de datos que se procesan:
  - Filtrar por atributo: conserva un subconjunto de registros que contienen determinados valores de atributo.
  - Seleccionar campos: conserva solo los campos de interés.
  - Filtrar por extensión: conserva un subconjunto de registros dentro de una extensión espacial determinada.

Limitaciones

Las siguientes son limitaciones conocidas:

Los archivos Excel (.xlsx) no se admiten en Data Pipelines.
Los archivos de texto (.txt), los archivos ORC (.orc), los archivos JSON (.json), GeoParquet (.geoparquet) y los archivos EsriJSON (.esrijson) no son compatibles con la carga de archivos. Para obtener más información sobre los elementos admitidos en ArcGIS Online, consulte ¿Qué puede agregar en ArcGIS Online?
Si tiene un archivo .txt que contiene valores delimitados, guárdelo como archivo .csv y cárguelo en ese formato.
Si el dataset incluye nombres de campo con espacios o caracteres no válidos, los nombres se actualizan automáticamente para utilizar guiones bajos. Por un ejemplo, un campo llamado Population 2022 cambia el nombre a Population_2022 y un campo llamado %Employed cambia el nombre a _Employed.

Requisitos de licencia

Se requieren las siguientes licencias y configuraciones:

Tipo de usuario Creator o Professional
Rol de publicador, moderador o administrador, o rol personalizado equivalente

Para obtener más información sobre los requisitos de Data Pipelines, consulte Requisitos.

Temas relacionados

Consulte Configuración del dataset para obtener más información.

¿Algún comentario sobre este tema?

Notas de uso

Limitaciones

Requisitos de licencia

Temas relacionados

En este tema