URL—ArcGIS Data Pipelines

Utilice registros de una URL o de una API como entrada para ArcGIS Data Pipelines.

Notas de uso

Tenga en cuenta lo siguiente al trabajar con direcciones URL:

Utilice el parámetro URL para especificar el dataset que se usará como entrada para su canalización de datos. Solo se admiten URL HTTP y HTTPS.
No se recomienda utilizar tablas y capas de entidades de ArcGIS como entrada de URL. Las capas de entidades de ArcGIS deben agregarse a su contenido y, a continuación, utilizarse como entrada de Capa de entidades. Para obtener información sobre cómo agregar una capa de entidades a su contenido, consulte Agregar un servicio o documento desde una dirección URL.
El parámetro Esta URL requiere autenticación (beta) determina si la URL requiere autenticación para acceder a los datos (activado), o si los datos son de acceso público (desactivado). Este parámetro se encuentra actualmente en la versión beta.
Para cargar datos desde una URL que requiere autenticación, primero debe crear un elemento de conexión de servicio. Los elementos de conexión del servicio almacenan de forma segura las credenciales y secretos que se incluirán en la solicitud a la URL. Para crear una conexión de servicio, siga los pasos descritos en la sección Conectarse a direcciones URL que requieren autenticación. Esta característica se encuentra en versión beta en la actualidad.
Para cambiar el elemento de conexión de servicio configurado, utilice el parámetro Conexión de servicio (beta) para eliminar el elemento seleccionado actualmente y elija una de las siguientes opciones:
- Agregar conexión: cree un elemento de conexión del servicio.
- Seleccionar elemento: explore su contenido para seleccionar un elemento de conexión de servicio existente.
Este parámetro se encuentra actualmente en la versión beta.
Utilice el parámetro Encabezados personalizados (beta) para especificar los nombres y valores de los encabezados que deben enviarse en la solicitud URL. Por ejemplo, una API puede requerir un encabezado de Content-type que se establece en un determinado valor. No se recomienda especificar credenciales o secretos como encabezados. Las credenciales y los secretos deben almacenarse en elementos de conexión de servicio. Este parámetro se encuentra actualmente en la versión beta.
Utilice el parámetro Formato de respuesta para especificar el formato de los datos que se devuelven de la URL. Dispone de las siguientes opciones de formato:
- CSV o delimitado (por ejemplo, .csv, .tsv y .txt)
- JSON (.json)
- GeoJSON(.geojson)
- Parquet (.parquet)
- GeoParquet (.parquet)
Si se especifica la opción de formato CSV o delimitado, estarán disponibles los siguientes parámetros de definición del dataset:
- Delimitador: el delimitador se utiliza para dividir los valores de campo (o columna) y registro (o fila). Puede elegir entre las siguientes opciones o introducir un valor propio:
  - Coma (,): los valores de registro y campo se separan mediante comas (,). Esta es la opción predeterminada.
  - Tabulador (\t): los valores de registro y campo se separan mediante tabuladores (\t).
  - Barra vertical (|): los valores de registro y campo se separan mediante barras verticales (|).
  - Punto y coma (;): los valores de registro y campo se separan mediante puntos y comas (;).
  - Espacio (): los valores de registro y campo se separan mediante espacios ( ).
  Si introduce un valor propio, debe tener uno o dos caracteres, incluidos los espacios. No se admiten delimitadores de más de dos caracteres.
- Tiene fila de encabezado: especifica si el dataset contiene una fila de encabezado. El valor predeterminado es true. Si se establece en false (falso), la primera fila del dataset se considerará un registro.
- Tiene datos multilínea: especifica si el dataset incluye registros que contienen caracteres de nueva línea. El valor predeterminado es falso. Si se establece en true, los datos que contengan datos multilínea se leerán y formatearán correctamente.
- Codificación de caracteres: especifica el tipo de codificación que se utilizará para leer el dataset especificado. El valor predeterminado es UTF -8. Puede elegir entre las opciones de codificación disponibles o especificar un tipo de codificación. No se admiten espacios en los valores de codificación. Por ejemplo, especificar un valor de ISO 8859-8 no es válido y debe especificarse como ISO-8859-8.

Campos está disponible para configurar tipos y nombres de campo cuando el valor del formato de datos es CSV o delimitado. El botón Configurar esquema abre un cuadro de diálogo que contiene los campos de dataset con las opciones siguientes:

Incluir o anular campos: puede eliminar los campos activando la casilla de verificación situada junto al campo. Por defecto, se incluyen todos los campos.
Nombre de campo: nombre del campo tal y como se utilizará en Data Pipelines. Este valor se puede editar. De forma predeterminada, este valor será igual que el del campo del dataset de origen a menos que el nombre de origen contenga caracteres no válidos o sea una palabra reservada. Los caracteres no válidos se sustituirán por un guion bajo (_) y las palabras reservadas tendrán un prefijo y un guion bajo (_).
Tipo de campo: el tipo de campo tal como se utilizará en Data Pipelines.

La eliminación o modificación de campos en Data Pipelines no afectará a los datos de origen.

En la siguiente tabla se describen los tipos de campos disponibles:


Tipo de campo	Descripción
Cadena de caracteres	Los campos de cadena de caracteres admiten una cadena de caracteres de texto.
Entero pequeño	Los campos de enteros pequeños admiten números enteros entre -32768 y 32767.
Entero	Los campos de enteros admiten números enteros entre -2147483648 y 2147483647.
Entero grande	Los campos de enteros grandes admiten números enteros entre -9223372036854776000 y 9223372036854776000.
Flotante	Los campos flotantes admiten números fraccionarios entre -3,4E38 y 3,4E38, aproximadamente.
Doble	Los campos dobles admiten números fraccionarios entre -2,2E308 y 1,8E308, aproximadamente.
Fecha	Los campos de fecha admiten valores en formato yyyy-MM-dd HH:mm:ss; por ejemplo, un valor válido es 2025-12-31 13:30:30. Si los valores de fecha se almacenan en un formato de diferente, utilice la herramienta Crear fecha y hora para calcular un campo de fecha.
Solo fecha	Los campos de fecha admiten valores en formato yyyy-MM-dd; por ejemplo, un valor válido es 2025-12-31. Si los valores de solo fecha se almacenan en un formato diferente, utilice los valores como entrada de la herramienta Calcular campo para calcular un campo de solo fecha.
Booleano	Los campos booleanos admiten valores de True y False. Si un campo contiene representaciones de enteros de valores booleanos (0 y 1), utilice la herramienta Actualizar campos para convertir los números enteros en valores booleanos.

Si se especifica la opción de formato JSON, el parámetro Propiedad de raíz está disponible. Puede utilizar este parámetro para especificar una propiedad en el JSON para leer datos. Puede hacer referencia a propiedades anidadas utilizando un separador decimal entre cada propiedad, por ejemplo, property.subProperty. De forma predeterminada, se leerá el archivo JSON completo.
Si se especifica la opción de formato GeoJSON, el parámetro Tipo de geometría está disponible. Este parámetro es opcional. De forma predeterminada, se utiliza el tipo de geometría del archivo GeoJSON. Si el archivo GeoJSON contiene más de un tipo de geometría, debe especificar el valor para este parámetro. Los tipos de geometría mixtos son incompatibles y solo se utilizará el tipo especificado. Las opciones son Punto, Multipunto, Polilínea y Polígono. Se calculará automáticamente un campo de geometría que contiene las ubicaciones de los datos GeoJSON y se agregará al dataset de entrada. El campo geometría puede utilizarse como entrada para operaciones espaciales o para activar la geometría en el resultado de salida.
Para mejorar el rendimiento de la lectura de los datasets de entrada, tenga en cuenta las opciones siguientes:
- Utilice el parámetro Usar almacenamiento en caché para almacenar una copia del dataset. La copia en caché solo se mantiene mientras al menos una pestaña abierta del navegador esté conectada al editor. Esto puede hacer que sea más rápido acceder a los datos durante el procesamiento. Si los datos de origen se han actualizado desde que se almacenaron en caché, desmarque este parámetro y vuelva a realizar la vista previa o a ejecutar la herramienta.
- Tras configurar un dataset de entrada, configure cualquiera de las herramientas siguientes que limitan la cantidad de datos que se procesan:
  - Filtrar por atributo: conserva un subconjunto de registros que contienen determinados valores de atributo.
  - Filtrar por extensión: conserva un subconjunto de registros dentro de una extensión espacial determinada.
  - Seleccionar campos: conserva solo los campos de interés.
  - Recortar: conserva un subconjunto de registros que intersecan con geometrías específicas.

Conectarse a direcciones URL que requieren autenticación (beta)

Para autenticar direcciones URL seguras, siga los pasos que se indican a continuación para crear un elemento de conexión de servicio en el editor de Data Pipelines:

En la barra de herramientas del editor de Data Pipelines, haga clic en Entradas y elija URL.
Aparece el cuadro de diálogo Agregar una URL.
En el parámetro URL, especifique la URL del dataset, incluido el prefijo https://.
Utilice el parámetro Formato de respuesta para especificar el formato del dataset tal como se devuelve en la URL.
Active la opción Esta URL requiere autenticación (beta).
Elija Agregar conexión de servicio nueva.
Haga clic en Siguiente.
Aparece el cuadro de diálogo Agregar una conexión de servicio.
En el parámetro URL base, especifique el nombre de dominio al que la conexión de servicio enviará credenciales o secretos.
Elija una de las opciones siguientes en el menú desplegable Tipo de autenticación:
- Clave de API: requiere una clave de API que se utilizará como valor de encabezado o parámetro de consulta.
- Básico: requiere un nombre de usuario y una contraseña.
Especifique los valores de los parámetros de autenticación. Utilice la vista previa de la parte inferior del cuadro de diálogo para confirmar que el formato coincide con los requisitos de la URL.
Si ha especificado Clave de API en el paso anterior, proporcione los siguientes parámetros de autenticación:
- Ubicación del parámetro: especifica si la clave de API se envía en un encabezado o en un parámetro de consulta.
- Nombre del parámetro: especifica el nombre del encabezado o del parámetro de consulta.
- Clave de API: especifica la clave de API.
- Prefijo de clave de API (opcional): especifica un valor que se antepone a la clave de API, por ejemplo, "Bearer". Este parámetro es opcional.
Haga clic en Siguiente.
Aparece el panel de detalles del elemento.
Proporcione un título para el nuevo elemento de conexión de servicio.
Este título aparecerá en el contenido. También puede guardar el elemento en una carpeta específica y proporcionar etiquetas de elemento o un resumen.
Haga clic en Guardar para crear el elemento de conexión de servicio.
Se agrega un elemento URL al lienzo.

Limitaciones

Las siguientes son limitaciones conocidas:

Si su organización ha bloqueado las aplicaciones y funciones beta, no podrá acceder a los siguientes parámetros:
- Esta URL requiere autenticación (beta)
- Conexión de servicio (beta)
- Encabezados personalizados (beta)
Estas funciones están actualmente en versión beta. Si utiliza estos parámetros, comparta su experiencia y busque apoyo a través del foro de comentarios sobre la versión beta de la Comunidad de Data Pipelines.
Si la URL no se puede leer en Data Pipelines, pero puede descargar los datos directamente desde la URL, intente en su lugar usar los datos descargados como entrada para la herramienta Archivo.
Los archivos Esri JSON (.esrijson) no son compatibles.
Si el dataset incluye nombres de campo con espacios o caracteres no válidos, los nombres se actualizan automáticamente para utilizar guiones bajos. Por un ejemplo, un campo llamado Population 2022 cambia el nombre a Population_2022 y un campo llamado %Employed cambia el nombre a _Employed.
Algunos valores de encabezado no se admiten como entrada en el parámetro Encabezados personalizados (beta), incluido el encabezado Authorization. Para saber cómo almacenar secretos de forma segura, consulte la sección Conectarse a direcciones URL que requieren autenticación.
No se admiten las URL que utilicen certificados HTTPS no válidos.
No se admiten direcciones URL que utilicen direcciones IP personalizadas. Solo se admiten nombres de dominio.
No se admiten las URL que utilicen el dominio arcgis.com. En lugar de utilizar las URL de ArcGIS como entrada, utilice en su lugar las herramientas de entrada de Archivo o Capa de entidad.
No se admiten las URL que utilicen puertos personalizados.
Es posible que no se admitan las URL de redireccionamiento.
Más información sobre el diagnóstico de redireccionamientos de URL en la Comunidad de Data Pipelines.
No se admiten las URL que requieran OAuth para autenticarse.
No se adminten las API que utilicen paginación.
Para utilizar un elemento de conexión de servicio para conectarse a direcciones URL que requieren autenticación, debe ser el propietario del elemento. Los elementos de conexión de servicio son privados y no pueden compartirse.

Temas relacionados

Consulte Configuración del dataset para obtener más información.

¿Algún comentario sobre este tema?

Notas de uso

Conectarse a direcciones URL que requieren autenticación (beta)

Limitaciones

Temas relacionados

En este tema