Actualizar propiedades de dataset de conexión de entidades multiarchivo (GeoAnalytics Desktop)

Resumen

Actualiza las propiedades de un dataset de conexión de entidades multiarchivo (MFC). Esta herramienta modifica la configuración de campo, geometría, tiempo y archivo de un dataset de MFC específico.

Uso

  • Esta herramienta requiere una MFC. Para crear una MFC, utilice el cuadro de diálogo Nueva conexión de entidades multiarchivo o la herramienta Crear conexión de entidades multiarchivo.

  • Utilice esta herramienta para modificar el tiempo, la geometría o el esquema de dataset de MFC para el uso en análisis o visualización en situaciones como la siguiente:

    • Su dataset CSV se ha registrado con todos los campos de tipo cadena de caracteres y desea configurar los campos como numéricos para usarlos en el análisis.
    • El dataset de MFC tiene valores de atributos para dos ubicaciones separadas, como paradas de taxi para la subida y bajada de pasajeros, y desea cambiar la geometría que se va a utilizar para el análisis.
    • El flujo de trabajo requiere que la hora esté definida en la capa de entrada.
    • Desea compartir un dataset de MFC con un compañero que solo está interesado en un subconjunto de entidades, por lo que agrega una expresión de consulta de definición y oculta algunos campos que no se utilizan.

  • Puede modificar las siguientes propiedades:

    • Consulta de definición: una expresión que se utiliza para limitar las entidades empleadas en el análisis.
    • Campos: el nombre de campo, su tipo y visibilidad.
    • Geometría: cómo se representa la geometría. No se pueden editar en el caso de los shapefiles.
    • Tiempo: cómo se representa el tiempo.
    • Archivo: las propiedades del archivo que se utilizan para leer el dataset.

  • Utilice el cuadro de diálogo Nueva conexión de entidades multiarchivo para disfrutar de una experiencia simplificada para crear, editar y obtener una vista previa de una conexión de entidades multiarchivo.

  • Especifique el dataset de MFC con las propiedades que desee modificar utilizando el parámetro Dataset de conexión de entidades multiarchivo. Puede explorar el dataset o especificarlo con una ruta como c:\<path>\MyMFC.mfc\<dataset_name>, por ejemplo, c:\MyMFCFolder\MyMFC.mfc\earthquakes_dataset.

  • Defina una expresión para limitar las entidades utilizadas en análisis con el parámetro Expresión. Agregar un filtro a un dataset de MFC es similar a aplicar una consulta de definición a un dataset en un mapa: especifique una expresión SQL para filtrar las entidades de interés.

  • Puede actualizar el tipo de campo correspondiente a archivos delimitados. No puede actualizar el tipo de campo de otras fuentes de datos (como archivos ORC, de parquet y shapefiles).

  • Puede modificar la geometría de archivos delimitados, ORC o de parquet. No puede modificar la geometría de un dataset con origen en un shapefile.

  • En la siguiente tabla se describe cómo especificar formatos de tiempo para los parámetros Hora inicial y Hora final al editar un dataset de MFC. Los ejemplos muestran cómo se representa la hora 9:45:02.05 p.m. del 2 de enero de 2016.

    Formatos de tiempo en conexiones de entidades multiarchivo

    SímboloSignificadoEjemplo

    aa

    El año, representado por dos dígitos.

    16

    aaaa

    El año, representado por cuatro dígitos.

    2016

    MM

    El mes, representado numéricamente.

    01 o 1

    MMM

    El mes, representado con tres letras.

    Jan

    MMMM

    El mes, representado con el nombre completo.

    January

    dd

    El día.

    02 o 2

    HH

    La hora usando un día de 24 horas; valores entre 0 y 23.

    21

    hh

    La hora usando un día de 12 horas; valores entre 1 y 12.

    9

    mm

    Los minutos; valores entre 0 y 59.

    45

    ss

    Los segundos; valores entre 0 y 59.

    02

    SSS

    Los milisegundos; valores entre 0 y 999.

    50

    a

    Marcador AM/PM.

    PM

    epoch_millis

    El tiempo en milésimas de segundo desde epoch.

    1509581781000

    epoch_seconds

    El tiempo en segundos desde epoch.

    1509747601

    Z

    El desplazamiento de zona horaria expresado en horas.

    -0100 o -01:00

    ZZZ

    El desplazamiento de zona horaria expresado mediante Id.

    America/Los_Angeles

    ''

    Use comillas simples para agregar texto que no represente un valor descrito en esta tabla.

    'T'

    En la siguiente tabla se muestran ejemplos de distintos formatos de la misma fecha, 2 de enero de 2016 a las 9:45:02.05 PM:

    Ejemplos de formato de tiempo

    Fecha de entradaFormato de fecha

    01/02/2016 9:45:02PM

    MM/dd/aaaa hh:mm:ssa

    Ene02-16 21:45:02

    MMMdd-aa HH:mm:ss

    2 de enero 2016 9:45:02.050PM

    MMMM dd aaaa hh:mm:ss.SSSa

    01/02/2017T9:45:14:05-0000

    MM/dd/yyyy'T'HH:mm:ssZ

    You can specify the time zone using one of the following:
    • El nombre completo de la zona horaria, por ejemplo, Hora estándar del Pacífico
    • El desfase de zona horaria expresado en horas: -0100 o -01:00
    • Las siglas UTC o GMT
  • Puede modificar las siguientes propiedades de un archivo delimitado:

    • Delimitador de campo: el delimitador de cada campo. Delimitadores habituales son la coma (,) y el punto y coma (;).
    • Finalizador de registro: el finalizador de cada fila de datos. Finalizaciones habituales son \n y \t.
    • Carácter de comillas: carácter utilizado para las comillas en el dataset de origen.
    • Tiene fila de encabezado: valor true o false que indica si el dataset de origen incluye encabezados. Si en el dataset se incluye una fila de encabezado, los encabezados se usarán para los nombres de campo.
    • Codificación: tipo de codificación utilizado por el dataset de origen. El valor predeterminado es UTF -8.

  • La herramienta Actualizar propiedades de dataset de conexión de entidades multiarchivo actualiza las propiedades de un dataset individual. Utilice estas herramientas para modificar una MFC:

  • Si lo desea, puede editar manualmente su archivo de MFC. El archivo .mfc siempre debería modificarse manualmente en las situaciones siguientes:

    • Está utilizando uno o varios campos para representar la ubicación x-, y- o z-.
    • Desea actualizar la ruta de origen.

    Más información sobre el formateo de archivos de conexiones de entidades multiarchivo.

  • Esta herramienta de geoprocesamiento se basa en Spark. Consulte Conexiones de entidades multiarchivo para obtener más información sobre las conexiones de entidades multiarchivo y cómo usarlas.

Parámetros

EtiquetaExplicaciónTipo de datos
Dataset de conexión de entidades multiarchivo

El dataset de MFC que se actualizará. Las opciones de edición diferirán en función de los datos de origen (shapefile, archivo delimitado, ORC o de parquet).

Table View
Expresión
(Opcional)

Una expresión que se utiliza para limitar las entidades empleadas en el análisis.

SQL Expression
Propiedades del campo
(Opcional)

Especifica los nombres de campo y las propiedades que se modificarán.

Especifica si los campos estarán visibles u ocultos.

  • Activado: los campos estarán visibles y disponibles para su uso en herramientas de geoprocesamiento. Esta es la opción predeterminada.
  • Desactivado: los campos estarán ocultos y no se podrán usar como entrada en herramientas de geoprocesamiento.

  • CortoEl campo será de tipo corto.
  • LargoEl campo será de tipo largo.
  • DobleEl campo será de tipo doble.
  • FlotanteEl campo será de tipo flotante.
  • Cadena de caracteresEl campo será de tipo cadena de caracteres.
  • FechaEl campo será de tipo fecha.
  • BLOBEl campo será de tipo BLOB.
Value Table
Tipo de geometría
(Opcional)

Especifica el tipo de geometría que se utilizará para representar espacialmente el dataset. No se puede modificar la geometría de datasets con origen en un shapefile.

  • PuntoEl tipo de geometría será punto.
  • PolilíneaEl tipo de geometría será polilínea.
  • PolígonoEl tipo de geometría será polígono.
  • NingunoNo se especifica ningún tipo de geometría.
String
Referencia espacial
(Opcional)

El valor WKID o la cadena WKT que se usará para la referencia espacial del dataset. El valor predeterminado es WKID 4326 (WGS84). No se puede modificar la referencia espacial de datos con origen en un shapefile.

String
Tipo de formato de geometría
(Opcional)

Especifica cómo se formateará la geometría. No se puede modificar la geometría de datos con origen en un shapefile.

  • XYZDos o más campos representarán x, y, y opcionalmente z.
  • WKTLa geometría se representará mediante un único campo en un campo de texto conocido.
  • WKBLa geometría se representará mediante un único campo en un campo binario conocido.
  • GeoJSONLa geometría se representará mediante un único campo en formato GeoJSON.
  • EsriJSONLa geometría se representará mediante un único campo en formato EsriJSON.
  • EsriShapeLa geometría se representará mediante un único campo en formato EsriShape.
String
Campo de geometría
(Opcional)

Un solo campo utilizado para representar la geometría. Este campo se utiliza cuando el formato de geometría es WKT, WKB, GeoJSON, EsriJSON o EsriShape.

String
Campo X
(Opcional)

El campo utilizado para representar la ubicación x. Si más de un campo representa la ubicación x, modifique manualmente el archivo .mfc.

String
Campo Y
(Opcional)

El campo utilizado para representar la ubicación y. Si más de un campo representa la ubicación y, modifique manualmente el archivo .mfc.

String
Campo Z
(Opcional)

El campo utilizado para representar la ubicación z. Si más de un campo representa la ubicación z, modifique manualmente el archivo .mfc.

String
Tipo de hora
(Opcional)

Especifica el tipo de tiempo que se utilizará para representar temporalmente el dataset.

  • IntervaloEl tipo de tiempo representará una duración de tiempo, con una hora de inicio y una hora de finalización.
  • InstanteEl tipo de tiempo representará un instante en el tiempo.
  • NingunoEl tiempo no está habilitado.
String
Zona horaria
(Opcional)

La zona horaria del dataset.

String
Hora de inicio
(Opcional)

Los campos utilizados para definir la hora de inicio y el formato de tiempo.

Value Table
Hora de finalización
(Opcional)

Los campos utilizados para definir la hora de finalización y el formato de tiempo.

Value Table
Extensión de archivo
(Opcional)

La extensión de archivo del dataset de origen. El valor del parámetro no se puede modificar.

String
Delimitador de campo
(Opcional)

El delimitador de campo utilizado en el dataset de origen.

String
Finalizador de registro
(Opcional)

El finalizador de registro utilizado en el dataset de origen.

String
Carácter de comillas
(Opcional)

El carácter de comillas utilizado en el dataset de origen.

String
Tiene fila de encabezado
(Opcional)

Especifica si el dataset de origen incluye una fila de encabezado.

  • Activado: el dataset de origen incluye una fila de encabezado.
  • Desactivado: el dataset de origen no incluye una fila de encabezado.

Boolean
Codificación
(Opcional)

El tipo de codificación utilizado por el dataset de origen. Se utiliza UTF-8 por defecto.

String

Salida derivada

EtiquetaExplicaciónTipo de datos
MFC actualizado

El archivo de MFC actualizado con las propiedades editadas aplicadas al dataset especificado.

File

arcpy.geoanalytics.UpdateBDCDatasetProperties(bdc_dataset, {expression}, {field_properties}, {geometry_type}, {spatial_reference}, {geometry_format_type}, {geometry_field}, {x_field}, {y_field}, {z_field}, {time_type}, {time_zone}, {start_time_format}, {end_time_format}, {file_extension}, {field_delimiter}, {record_terminator}, {quote_character}, {has_header_row}, {encoding})
NombreExplicaciónTipo de datos
bdc_dataset

El dataset de MFC que se actualizará. Las opciones de edición diferirán en función de los datos de origen (shapefile, archivo delimitado, ORC o de parquet).

Table View
expression
(Opcional)

Una expresión que se utiliza para limitar las entidades empleadas en el análisis.

SQL Expression
field_properties
[field_properties,...]
(Opcional)

Especifica los nombres de campo y las propiedades que se modificarán.

  • SHORTEl campo será de tipo corto.
  • LONGEl campo será de tipo largo.
  • DOUBLEEl campo será de tipo doble.
  • FLOATEl campo será de tipo flotante.
  • STRINGEl campo será de tipo cadena de caracteres.
  • DATEEl campo será de tipo fecha.
  • BLOBEl campo será de tipo BLOB.

Especifica si los campos estarán visibles u ocultos.

  • TRUELos campos estarán visibles y disponibles para su uso en herramientas de geoprocesamiento. Esta es la opción predeterminada.
  • FALSELos campos estarán ocultos y no se podrán usar como entrada en herramientas de geoprocesamiento.
Value Table
geometry_type
(Opcional)

Especifica el tipo de geometría que se utilizará para representar espacialmente el dataset. No se puede modificar la geometría de datasets con origen en un shapefile.

  • POINTEl tipo de geometría será punto.
  • LINEEl tipo de geometría será polilínea.
  • POLYGONEl tipo de geometría será polígono.
  • NONENo se especifica ningún tipo de geometría.
String
spatial_reference
(Opcional)

El valor WKID o la cadena WKT que se usará para la referencia espacial del dataset. El valor predeterminado es WKID 4326 (WGS84). No se puede modificar la referencia espacial de datos con origen en un shapefile.

String
geometry_format_type
(Opcional)

Especifica cómo se formateará la geometría. No se puede modificar la geometría de datos con origen en un shapefile.

  • XYZDos o más campos representarán x, y, y opcionalmente z.
  • WKTLa geometría se representará mediante un único campo en un campo de texto conocido.
  • WKBLa geometría se representará mediante un único campo en un campo binario conocido.
  • GEOJSONLa geometría se representará mediante un único campo en formato GeoJSON.
  • ESRIJSONLa geometría se representará mediante un único campo en formato EsriJSON.
  • ESRISHAPELa geometría se representará mediante un único campo en formato EsriShape.
String
geometry_field
(Opcional)

Un solo campo utilizado para representar la geometría. Este campo se utiliza cuando el formato de geometría es WKT, WKB, GeoJSON, EsriJSON o EsriShape.

String
x_field
(Opcional)

El campo utilizado para representar la ubicación x. Si más de un campo representa la ubicación x, modifique manualmente el archivo .mfc.

String
y_field
(Opcional)

El campo utilizado para representar la ubicación y. Si más de un campo representa la ubicación y, modifique manualmente el archivo .mfc.

String
z_field
(Opcional)

El campo utilizado para representar la ubicación z. Si más de un campo representa la ubicación z, modifique manualmente el archivo .mfc.

String
time_type
(Opcional)

Especifica el tipo de tiempo que se utilizará para representar temporalmente el dataset.

  • INTERVALEl tipo de tiempo representará una duración de tiempo, con una hora de inicio y una hora de finalización.
  • INSTANTEl tipo de tiempo representará un instante en el tiempo.
  • NONEEl tiempo no está habilitado.
String
time_zone
(Opcional)

La zona horaria del dataset.

String
start_time_format
[start_time_format,...]
(Opcional)

Los campos utilizados para definir la hora de inicio y el formato de tiempo.

Value Table
end_time_format
[end_time_format,...]
(Opcional)

Los campos utilizados para definir la hora de finalización y el formato de tiempo.

Value Table
file_extension
(Opcional)

La extensión de archivo del dataset de origen. El valor del parámetro no se puede modificar.

String
field_delimiter
(Opcional)

El delimitador de campo utilizado en el dataset de origen.

String
record_terminator
(Opcional)

El finalizador de registro utilizado en el dataset de origen.

String
quote_character
(Opcional)

El carácter de comillas utilizado en el dataset de origen.

String
has_header_row
(Opcional)

Especifica si el dataset de origen incluye una fila de encabezado.

  • HAS_HEADEREl dataset de origen incluye una fila de encabezado.
  • NO_HEADEREl dataset de origen no incluye una fila de encabezado.
Boolean
encoding
(Opcional)

El tipo de codificación utilizado por el dataset de origen. Se utiliza UTF-8 por defecto.

String

Salida derivada

NombreExplicaciónTipo de datos
updated_bdc

El archivo de MFC actualizado con las propiedades editadas aplicadas al dataset especificado.

File

Muestra de código

Ejemplo de UpdateBDCDatasetProperties (script independiente)

El siguiente script de Python demuestra cómo utilizar la función UpdateBDCDatasetProperties.


# Name: UpdateBDCDatasetProperties.py
# Description: Add a filter and modify the schema, time, and geometry for a MFC dataset
# Requirements: ArcGIS Pro Advanced License

# Import system modules
import arcpy

# Set local variables
dataset = r"c:\Projects\MyProjectFolder\my_BigDataConnection.mfc\myBigDataset"
filter = "COUNT > 500"
field_properties = "Field1 FLOAT true;Field2 STRING true;Field3 DOUBLE true"
geometry_type = "POINT"
sref = "4326"
geometry_format = "XYZ"
x_field = "Long"
y_field = "Lat"
z_field = ""
time_type = "INSTANT"
time_zone = "UTC"
time_formats = "Year yyyy"
file_extension = "csv"
file_delimiter = ","
file_terminator = r"\n"
file_quotechar = '"'
has_header_row = True
file_encoding = "UTF-8"


# Run Update MFC Dataset Properties
arcpy.gapro.UpdateBDCDatasetProperties(dataset, filter, field_properties, geometry_type, sref, geometry_format, "",
x_field, y_field, z_field, time_type, time_zone, time_formats, None, file_extension, file_delimiter, file_terminator, 
file_quotechar, has_header_row, file_encoding)

Entornos

Esta herramienta no utiliza ningún entorno de geoprocesamiento.