Extraer ubicaciones de documentos y texto

Como parte de la extensión ArcGIS LocateXT, el panel Extraer ubicaciones de ArcGIS AllSource permite escanear documentos y texto en busca de coordenadas espaciales y ubicaciones personalizadas. Abra el mapa al que desea agregar las ubicaciones encontradas. Los puntos que representan las ubicaciones se almacenan en una clase de entidad y se agregan como una capa al mapa activo.

Abrir el panel Extraer ubicaciones

Debe haber un mapa activo en ArcGIS AllSource para abrir el panel Extraer ubicaciones.

  1. Cree o abra un mapa. Por ejemplo, en la pestaña Mapa, en el grupo Insertar, haga clic en Nuevo mapa.
  2. En la pestaña Datos, en el grupo Herramientas, haga clic en Extraer ubicaciones Extraer ubicaciones, y haga clic en Extraer ubicacionesExtraer ubicaciones.

    Aparece el panel Extraer ubicaciones.

Extraer ubicaciones

En el panel Extraer ubicaciones, puede especificar lo siguiente en la pestaña Extraer:

  • Los archivos, carpetas o texto que se escanean en busca de ubicaciones
  • El nombre de la capa de mapa y la clase de entidad de salida que se crearán o actualizarán
  • El sistema de coordenadas de la clase de entidad de salida, si se crea uno

Cada vez que se extraen ubicaciones de documentos o texto, se puede elegir si crear una nueva clase de entidad y agregar una nueva capa al mapa activo, si se actualiza una capa de mapa y una clase de entidad existentes o si se sobrescribe una clase de entidad existente.

Agregar una nueva capa en el mapa

Se crea una clase de entidad para almacenar las ubicaciones extraídas. Se crea una capa de mapa en el mapa activo para mostrar el contenido de la clase de entidad.

  1. Abra el panel Extraer ubicaciones.
  2. Proporcione un nombre para la nueva capa de mapa y clase de entidad que se creará realizando una de las siguientes acciones:
    • Escriba un nombre para la nueva capa de mapa y clase de entidad en el cuadro de texto Nombre. Se creará una nueva clase de entidad con este nombre en la geodatabase predeterminada del proyecto.
    • Haga clic en el botón Buscar Examinar y, en el cuadro de diálogo Nueva clase de entidad, vaya a la ubicación donde desea crear una clase de entidad o shapefile. Escriba un nombre para el nuevo elemento en el cuadro de texto Nombre y haga clic en Guardar.
      Precaución:

      Si selecciona una clase de entidad existente en lugar de proporcionar un nombre para una nueva clase de entidad, aparecerá una advertencia en el panel Extraer ubicaciones. La clase de entidad existente se eliminará y se creará una clase de entidad nueva con el mismo nombre. Otros mapas pueden verse afectados.

  3. Haga clic en la lista desplegable Sistema de coordenadas o en el botón Seleccionar sistema de coordenadas Sistema de coordenadas y haga clic en el sistema de coordenadas que desea utilizar para la clase de entidad de salida.

    El sistema de coordenadas de las entidades de entrada se especifica de forma independiente en la pestaña Coordenadas y en el archivo de ubicaciones personalizadas. Las ubicaciones encontradas se transforman al sistema de coordenadas de la clase de entidad de salida.

  4. Haga clic en la pestaña Archivos y carpetas y especifique los elementos que desea escanear en busca de ubicaciones.
    • Arrastre los archivos y carpetas desde el Explorador de Windows a la pestaña.
    • Haga clic en Buscar y, en el cuadro de diálogo Agregar archivos y carpetas, busque y seleccione los archivos y carpetas adecuados y haga clic en Aceptar. Haga clic en Agregar más para agregar archivos y carpetas a la lista.
  5. Haga clic en la pestaña Texto y especifique el texto que desee escanear en busca de ubicaciones.
    • Copie el texto de un documento, correo electrónico o página web y péguelo en la pestaña.
    • Seleccione el texto que desea escanear en un documento, correo electrónico o página web y arrástrelo a ArcGIS AllSource y a la pestaña.
  6. Al menos un archivo o carpeta, o texto, debe especificarse como entrada. Todos pueden ser escaneados a la vez, si es apropiado.
  7. Haga clic en Extraer.

Puede cancelar el proceso en cualquier momento. Cuando se completa el proceso, aparece un mensaje en la parte inferior del panel que indica si se realizó correctamente.

Se crea la clase de entidad especificada y las ubicaciones encontradas se almacenan en la clase de entidad como puntos. Se agrega al mapa activo una capa de mapa que hace referencia a la clase de entidad. Si no se encuentran ubicaciones en los documentos y el texto, la clase de entidad y la capa del mapa quedan vacías.

Nota:

Si eligió sobrescribir una clase de entidad existente agregada anteriormente al mapa, se creará y agregará al mapa que accede a la nueva clase de entidad una nueva capa de mapa.

Para extraer ubicaciones de un conjunto diferente de documentos o texto capturado desde una ubicación diferente, haga clic en Borrar todas las entradas en la parte inferior de la pestaña Extraer. Se eliminan todos los archivos de la lista de la pestaña Archivos y carpetas y se elimina todo el texto de la pestaña Texto. Especifique un nuevo conjunto de elementos a procesar.

Actualizar una capa existente en el mapa

Puede agregar ubicaciones progresivamente a una clase de entidad existente. Por ejemplo, cada semana puede procesar un nuevo conjunto de informes y agregar ubicaciones desde esos archivos al conjunto existente. O bien, después de procesar un conjunto de muestra de documentos, si queda conforme con los resultados, puede procesar documentos adicionales y agregar esas ubicaciones a la clase de entidad existente.

  1. Abra el panel Extraer ubicaciones.
  2. Haga clic en la lista desplegable Nombre y haga clic en la capa de mapa existente a actualizar.

    Las ubicaciones extraídas de los documentos y el texto se agregan a la clase de entidad existente a la que hace referencia la capa del mapa. Los controles utilizados para especificar el sistema de coordenadas de la clase de entidad de salida estarán deshabilitados.

  3. Haga clic en la pestaña Archivos y carpetas y especifique los elementos que desea escanear en busca de ubicaciones.
  4. Haga clic en la pestaña Texto y especifique el texto que desee escanear en busca de ubicaciones.
  5. Haga clic en Extraer.

    Aparece el panel Coincidencia de campos en el panel Extraer ubicaciones.

  6. Especifique el campo de la tabla de atributos de la capa existente que va a almacenar la información extraída de los documentos y el texto.

    A continuación, se describe el conjunto completo de campos que se pueden completar en la clase de entidad de salida.

  7. Si ningún campo en la clase de entidad existente puede almacenar la información extraída, haga clic en Atrás Atrás y seleccione una capa de salida diferente o cree una capa en su lugar.
  8. Cuando esté satisfecho con la coincidencia entre los campos de la capa existente y los campos de información extraídos de los documentos y el texto, haga clic en Aceptar.

Puede cancelar el proceso en cualquier momento. Cuando se completa el proceso, aparece un mensaje en la parte inferior del panel que indica si se realizó correctamente.

Si se encuentran ubicaciones al escanear los documentos y el texto, esas ubicaciones se agregan a la clase de entidad especificada. La capa de mapa existente y su tabla de atributos se actualizan para mostrar las nuevas ubicaciones.

Revisar las ubicaciones extraídas

Una vez escaneados los documentos y el texto y creada la clase de entidad de salida, la capa de mapa de salida se agrega al mapa y se selecciona en el panel Contenido. Haga clic en una ubicación encontrada para obtener más información sobre ella. La ventana emergente muestra la ubicación extraída, el documento del que se extrajo y la información extraída del documento en torno a la ubicación que proporciona el contexto. Abra la tabla de atributos de la capa para comparar el rango completo de ubicaciones encontradas. Conforme evalúa los datos, puede eliminar las ubicaciones ajenas al alcance actual o exportar el subconjunto de ubicaciones que represente su interés principal.

El panel Extraer ubicaciones usa distintas configuraciones predeterminadas para reconocer las ubicaciones más comunes. Cuando comprenda mejor las ubicaciones presentes en los datos, podrá ajustar esa configuración en la pestaña Propiedades para extraer ubicaciones adicionales o información más específica en los campos de salida.

Más información sobre las configuraciones utilizadas para extraer ubicaciones y atributos

Definiciones del campo de salida

Cuando se crea una nueva clase de entidad de salida para almacenar las ubicaciones extraídas, la clase de entidad tendrá los siguientes campos predeterminados y cualquier campo adicional definido por un archivo de atributos personalizados.

Más información sobre los archivos de atributos personalizados

Nombre de campoAlias del campoTipo de datosDescripción

Name

Nombre

Texto: 50 caracteres, de forma predeterminada

El nombre del archivo que fue procesado o Text para indicar que se procesó texto. El tamaño se controla mediante la configuración de la pestaña Salida.

Pre_Text

Texto previo

Texto: 254 caracteres, de forma predeterminada

Un extracto del archivo o texto que precede a la ubicación encontrada. El tamaño se controla mediante la configuración de la pestaña Salida.

Ext_Text

Texto extraído

Texto: 120 caracteres, de forma predeterminada

La ubicación encontrada, tal y como se encontró en el archivo o texto, por ejemplo, 52.825°N, 169.944°W para una coordenada espacial, o LAX para una ubicación personalizada que asocia un código de aeropuerto con una coordenada espacial. El tamaño se controla mediante la configuración de la pestaña Salida.

Ext_Type

Tipo extraído

Texto: 50 caracteres, de forma predeterminada

El tipo de ubicación encontrada, por ejemplo, una coordenada de grados decimales (DD). Cuando se encuentra una ubicación personalizada, se registra la ubicación definida en el archivo de ubicaciones personalizadas que coincida. El tamaño se controla mediante la configuración de la pestaña Salida.

Post_Text

Texto posterior

Texto: 254 caracteres, de forma predeterminada

Un extracto del archivo o texto que sigue a la ubicación encontrada. El tamaño se controla mediante la configuración de la pestaña Salida.

Precision

Precisión (m)

Largo

En las coordenadas espaciales, el nivel de precisión en el terreno en el que la ubicación es exacta, en metros. Por ejemplo, una coordenada de grados decimales con muchas posiciones decimales será más precisa y tendrá una distancia menor.

En las ubicaciones personalizadas, la cantidad de letras que no coincidieron al comparar el texto original con la ubicación coincidente. Cuando la coincidencia aproximada está deshabilitada, se requiere una coincidencia exacta y el valor es 0. Cuando está habilitada y la ubicación mal escrita Redalnds se compara con Redlands, el valor es 2.

Std_Coord

Coord. estand. Coord.

Texto: 30 caracteres

Una versión estandarizada de la ubicación extraída, por ejemplo, 52.825000N 169.944000W. El formato de esta coordenada se controla mediante la configuración de la pestaña Salida.

First_Date

Primera fecha

Fecha

La primera fecha encontrada en el archivo o texto, si se extraen fechas. De lo contrario, el campo contiene valores nulos. Las fechas solo se extraen si están dentro del rango especificado en la pestaña Salida, la fecha no está configurada para omitirse y no se ha alcanzado el límite del número de fechas extraídas.

Early_Date

Fecha más temprana

Fecha

La fecha más antigua encontrada en el archivo o texto, si se extraen fechas. De lo contrario, el campo contiene valores nulos. Las fechas solo se extraen si están dentro del rango especificado en la pestaña Salida, la fecha no está configurada para omitirse y no se ha alcanzado el límite del número de fechas extraídas.

Late_Date

Fecha más tardía

Fecha

La fecha más reciente encontrada en el archivo o texto, si se extraen fechas. De lo contrario, el campo contiene valores nulos. Las fechas solo se extraen si están dentro del rango especificado en la pestaña Salida, la fecha no está configurada para omitirse y no se ha alcanzado el límite del número de fechas extraídas.

All_Dates

Todas las fechas

Texto: 254 caracteres, de forma predeterminada

Una lista delimitada por comas de todas las fechas encontradas en el texto, si se extraen fechas. De lo contrario, el campo contiene valores nulos. Todas las fechas están estandarizadas en el formato aaaa-mm-dd. Las fechas solo se extraen si están dentro del rango especificado en la pestaña Salida, la fecha no está configurada para omitirse y no se ha alcanzado el límite del número de fechas extraídas. Si la lista de fechas delimitada por comas es demasiado grande para el tamaño de este campo, la lista se truncará. El tamaño se controla mediante la configuración de la pestaña Salida.

ExDateText

Texto de fecha extraído

Texto: 254 caracteres, de forma predeterminada

Las fechas encontradas, tal como se encontraron en el archivo o texto, por ejemplo, 18 de agosto de 2019 o 2/3/2020. Si la lista de fechas delimitada por comas es demasiado grande para el tamaño de este campo, la lista se truncará. El tamaño se controla mediante la configuración de la pestaña Salida.

Filename

Nombre de archivo

Texto: 254 caracteres, de forma predeterminada

Ruta completa al archivo procesado o un valor nulo si se procesó texto. Puede elegir los archivos a procesar u omitir. El tamaño se controla mediante la configuración de la pestaña Salida.

File_Type

Tipo de archivo

Texto: 10 caracteres, de forma predeterminada

Formato del archivo procesado o un valor nulo si se procesó texto. Puede elegir procesar tipos de archivos específicos. El tamaño se controla mediante la configuración de la pestaña Salida.

Modified

Modificación (UTC)

Texto: 20 caracteres

Fecha y hora en que se modificó el archivo por última vez, en formato aaaa-mm-dd hh:mm:ss.

Scanned

Escaneado (UTC)

Texto: 20 caracteres

Fecha y hora en que se procesó el archivo, en formato aaaa-mm-dd hh:mm:ss.

Evaluar los resultados

La primera vez que se escanea un documento, es posible que no se obtengan las ubicaciones esperadas. Además de la capa de mapa de salida y la clase de entidad, se pueden crear dos archivos de registro: un registro de escaneado y un registro de coordenadas no válidas. Si proporcionó un documento de entrada del que conoce su contenido, y el número de ubicaciones creadas en la clase de entidad de salida no coincide con el número esperado, los archivos de registro pueden ayudar a evaluar los resultados.

Una vez escaneados los documentos y el texto y creada la clase de entidad de salida, aparece un mensaje en la parte inferior del panel Extraer ubicaciones para indicar que el proceso ha finalizado correctamente. El mensaje incluye vínculos a los archivos de registro, que son temporales. Para conservarlos para futuras revisiones, abra los archivos y guárdelos en una ubicación permanente, como la carpeta de inicio del proyecto. Por ejemplo, agregue el nombre de la capa de mapa o clase de entidad con la que está asociado el archivo de registro.

Registro de escaneado

Haga clic en el vínculo Ver registro de escaneado dentro del mensaje de la parte inferior del panel Extraer ubicaciones para abrir el archivo de registro de escaneado. Por cada documento escaneado, el registro indica la siguiente información:

  • El nombre del archivo del documento y su ubicación en el equipo local o de red
  • Un mensaje para indicar que se encontró un problema al escanear el documento, si corresponde
  • El número de ubicaciones potenciales encontradas
  • El número de fechas únicas encontradas

Una ubicación potencial es el texto encontrado en el contenido del documento que se asemeja a una coordenada espacial o una ubicación personalizada. Al proporcionar texto como entrada, el registro de escaneado no proporciona un nombre de archivo y una ubicación, pero el resto de la información del archivo de registro es el mismo.

Si esperaba que se extrajeran nueve ubicaciones, pero solo se han creado seis ubicaciones como salida, por ejemplo, el registro de análisis puede explicar lo que sucedió. El registro podría indicar que, con la configuración actual del panel Extraer ubicaciones, solo se encontraron seis ubicaciones posibles. El registro también podría indicar que se encontraron más fechas de las esperadas y es posible que una coordenada se haya interpretado como una fecha. Ajuste la configuración antes de volver a intentar extraer ubicaciones del documento.

Registro de coordenadas no válidas

Si se evalúa una ubicación potencial y se encuentra que no es válida, se crea un registro de coordenadas no válidas. Haga clic en Ver registro de coordenadas incorrectas para abrirlo.

El registro de coordenadas no válidas indica lo siguiente:

  • El documento en el que se encontró la ubicación potencial
  • El texto original que se determinó como ubicación potencial
  • El formato de coordenadas utilizado para evaluar la ubicación

Por ejemplo, si se encontró una coordenada de latitud y longitud, pero la latitud de la coordenada es mayor de 90 grados, la coordenada se considera no válida. Puede averiguar que las ubicaciones potenciales del documento se evaluaron utilizando un formato de coordenadas diferente al esperado. Ajuste la configuración antes de volver a intentar extraer ubicaciones del documento.

Si no encuentra útil el registro de coordenadas no válidas, puede desactivar la casilla de verificación Registrar coordenadas no válidas en la pestaña Coordenadas para que las coordenadas no válidas no se registren para los formatos de coordenadas espaciales que está utilizando.