Crear conexión de entidades multiarchivo (GeoAnalytics Desktop)

Resumen

Crea un archivo de conexión de entidades multiarchivo (.mfc) y un elemento. Los datasets registrados en una conexión de entidades multiarchivo (MFC) pueden utilizarse como entrada en las herramientas de GeoAnalytics Desktop y otras herramientas de geoprocesamiento.

Uso

  • Esta herramienta permite establecer una conexión con uno o varios datasets, que pueden utilizarse como entrada en las herramientas de geoprocesamiento.

    Nota:

    Si lo desea, puede crear una conexión de entidades multiarchivo mediante el cuadro de diálogo Nueva conexión de entidades multiarchivo.

  • Las conexiones de entidades multiarchivo admiten los siguientes datasets:

    • Archivos delimitados (por ejemplo, .csv, .tsv y .txt)
    • Shapefiles (.shp)
    • Archivos PARQUET (.parquet)
      Nota:

      Solo se admiten los archivos PARQUET no cifrados.

    • Archivos ORC (.orc)

    Para obtener más información sobre los tipos de archivo compatibles, consulte Conexiones de entidades multiarchivo.

  • Para usar sus datasets como entradas de una MFC, los datos deben estar correctamente estructurados. Para preparar los datos para una MFC, debe formatear los datasets como subcarpetas de una sola carpeta de origen que usted registra. En esta carpeta de origen, los nombres de las subcarpetas representan los nombres de los datasets.

    Una carpeta de origen con tres subcarpetas de datasets
    Se muestra una carpeta de origen que contiene tres subcarpetas, cada una de ellas en representación de un dataset.

    La imagen que aparece arriba representa la estructura correcta de una MFC. La carpeta de origen está registrada, y cada subcarpeta de la carpeta de origen representa un dataset. En este ejemplo, se registraría la carpeta de origen y se incluirían tres datasets en la MFC: Dataset-1, Dataset-2 y Dataset-3.

    Más información sobre la estructuración de una conexión de entidades multiarchivo

  • Especifique la ubicación de origen desde la que desee crear una MFC mediante el parámetro Carpeta de fuente de datos.

  • Una MFC se puede almacenar localmente en el equipo o en una unidad de red. Si está compartiendo una MFC, asegúrese de utilizar una ubicación de origen a la que puedan acceder todos los usuarios. Se recomienda no almacenar una MFC en la carpeta de origen.

  • Para acceder a una MFC de un proyecto, agregue la ubicación de la MFC almacenada como una conexión a carpetas.

  • Al configurar la visibilidad de la geometría o el tiempo no se elimina ninguno de estos del datasets. La configuración de tiempo y geometría se aplicará siempre. Por ejemplo, si tiene un dataset de punto con la geometría representada por dos campos, latitude y longitude, a continuación, se describe cómo funcionará la configuración de visibilidad con el dataset:

    • Visible: los campos latitude y longitude estarán disponibles en los parámetros de la herramienta de geoprocesamiento y los resultados.
    • No visible: los campos latitude y longitude no estarán disponibles en los parámetros de la herramienta de geoprocesamiento ni en los resultados de salida.

    En ambos casos, el dataset tendrá la geometría definida por los campos latitude y longitude.

  • Se recomienda configurar los campos de geometría en No visible cuando se utilicen valores de cadena de caracteres larga, como WKT, para representar la geometría.

  • No se recomienda modificar manualmente los archivos .mfc. El archivo .mfc contiene las siguientes propiedades:

    • Información de conexión: ruta de origen
    • Información de dataset: nombres y tipos de dataset, campos, geometría y tiempo

  • Los mensajes de la herramienta incluirán la siguiente información sobre los datasets detectados y su estado:

    • Correcto: se han descubierto y agregado nuevos datasets a la MFC
    • Con fallos: datasets que no se agregaron correctamente a la MFC

    Al descubrir datasets en su MFC, es posible que se encuentre con uno de los dos problemas siguientes:

    • Faltan los datasets que esperaba. En este caso, verifique que la ruta que especificó como una carpeta de origen que contiene subcarpetas es correcta y corresponde a un tipo de datos admitido.
    • Uno o varios datasets no se registran. Si los datasets no se registran, observará una o varias de las siguientes consecuencias:

      ProblemaSoluciónEjemplo

      El dataset no presenta el formato esperado.

      Abra el archivo para comprobar si tiene el aspecto esperado. Si los datos no están estructurados correctamente, actualícelos e inténtelo de nuevo.

      Un archivo .csv contiene unas pocas líneas y un resumen de los datos, pero solo líneas vacías a partir de ese punto.

      Los esquemas de los datasets de una carpeta no coinciden.

      Todos los archivos de una carpeta de dataset deben tener el mismo esquema. Abra los archivos para comparar los esquemas. Resuelva cualquier discrepancia en los esquemas e intente registrar de nuevo el dataset.

      Tiene un archivo .csv con 10 campos y otro con 8.

      Los tipos de archivo de un dataset de una carpeta no coinciden.

      Todos los archivos de una carpeta de dataset deben tener la misma extensión (tipo de archivo). Compruebe los tipos de archivo de la ubicación de la fuente de datos y elimine o reubique cualquier archivo mal ubicado.

      Un dataset de shapefile está en la misma carpeta que un archivo PARQUET.

      Tiene un formato de campo no reconocido.

      Aunque es una situación improbable, puede ocurrir si el ORC y PARQUET utilizan un formato inesperado. Asegúrese de utilizar formatos de campo válidos.

      Tiene un archivo PARQUET con un formato de campo desconocido.

    Más información sobre por qué los datasets no se han agregado a un archivo de MFC

  • Una vez que se crea una MFC, es posible modificar la información de conexión y los datasets con las siguientes herramientas:

  • Esta herramienta de geoprocesamiento se basa en Spark. Consulte Conexiones de entidades multiarchivo para obtener más información sobre las conexiones de entidades multiarchivo y cómo usarlas.

Parámetros

EtiquetaExplicaciónTipo de datos
Ubicación de salida de la conexión de entidades multiarchivo
(Opcional)

La carpeta donde se creará el archivo .mfc.

Folder
Nombre de la conexión de entidades multiarchivo de salida

El nombre del archivo .mfc que se va a crear.

String
Tipo de conexión

Especifica el tipo de conexión que se va a crear.

  • CarpetaEstablece la conexión con una ubicación del sistema de archivos. Esta es la opción predeterminada.
String
Carpeta de fuente de datos
(Opcional)

La carpeta que contiene los datasets que se van a registrar con la MFC.

Folder
Campos Geometría visible
(Opcional)

Especifica si los campos utilizados para especificar la geometría estarán visibles como campos cuando se utilice el archivo de MFC como entrada para otras herramientas de geoprocesamiento. Cuando los campos de geometría no están visibles, la geometría sigue aplicándose al dataset. La configuración de visibilidad de la geometría se puede modificar en la MFC.

  • Activado: los campos de geometría se incluirán como campos para el análisis. Esta es la opción predeterminada.
  • Desactivado: los campos de geometría no se incluirán como campos de análisis.

Boolean
Campos Tiempo visible
(Opcional)

Especifica si los campos utilizados para especificar el tiempo estarán visibles como campos cuando el archivo de MFC se utilice como entrada para otras herramientas de geoprocesamiento. Cuando los campos de tiempo no están visibles, el tiempo sigue aplicándose al dataset. La configuración de visibilidad de tiempo se puede modificar en la MFC.

  • Activado: los campos de tiempo se incluirán como campos para el análisis. Esta es la opción predeterminada.
  • Desactivado: los campos de tiempo no se incluirán como campos de análisis.

Boolean

Salida derivada

EtiquetaExplicaciónTipo de datos
MFC de salida

El archivo .mfc que se crea.

File

arcpy.geoanalytics.CreateBDC({bdc_location}, bdc_name, connection_type, {data_source_folder}, {visible_geometry}, {visible_time})
NombreExplicaciónTipo de datos
bdc_location
(Opcional)

La carpeta donde se creará el archivo .mfc.

Folder
bdc_name

El nombre del archivo .mfc que se va a crear.

String
connection_type

Especifica el tipo de conexión que se va a crear.

  • FOLDEREstablece la conexión con una ubicación del sistema de archivos. Esta es la opción predeterminada.
String
data_source_folder
(Opcional)

La carpeta que contiene los datasets que se van a registrar con la MFC.

Folder
visible_geometry
(Opcional)

Especifica si los campos utilizados para especificar la geometría estarán visibles como campos cuando se utilice el archivo de MFC como entrada para otras herramientas de geoprocesamiento. Cuando los campos de geometría no están visibles, la geometría sigue aplicándose al dataset. La configuración de visibilidad de la geometría se puede modificar en la MFC.

  • GEOMETRY_VISIBLELos campos de geometría se incluirán como campos para el análisis. Esta es la opción predeterminada.
  • GEOMETRY_NOT_VISIBLELos campos de geometría no se incluirán como campos de análisis.
Boolean
visible_time
(Opcional)

Especifica si los campos utilizados para especificar el tiempo estarán visibles como campos cuando el archivo de MFC se utilice como entrada para otras herramientas de geoprocesamiento. Cuando los campos de tiempo no están visibles, el tiempo sigue aplicándose al dataset. La configuración de visibilidad de tiempo se puede modificar en la MFC.

  • TIME_VISIBLELos campos de tiempo se incluirán como campos para el análisis. Esta es la opción predeterminada.
  • TIME_NOT_VISIBLELos campos de tiempo no se incluirán como campos de análisis.
Boolean

Salida derivada

NombreExplicaciónTipo de datos
output_bdc

El archivo .mfc que se crea.

File

Muestra de código

CreateBDC (script independiente)

En el siguiente script de Python se muestra cómo utilizar la función CreateBDC.

# Name: CreateBigDataConnection.py
# Description: Establishes a connection to a folder location containing one or 
#              more datasets. Datasets will be used as input to GeoAnalytics 
#              Desktop Tools.
#
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
sourceFolder = r"\\FileShare\MyLargeDatasets"
outName = "my_new_MultifileFeatureConnection"
outFolder = r"c:\Projects\MyProjectFolder"
time = "TIME_NOT_VISIBLE"
geometry = "GEOMETRY_VISIBLE"

# Run Create Multifile Feature Connection
arcpy.gapro.CreateBDC(outFolder, outName, "FOLDER", sourceFolder, geometry, time)

Entornos

Esta herramienta no utiliza ningún entorno de geoprocesamiento.