Panel Extraer ubicaciones

La extensión ArcGIS LocateXT permite usar el panel Extraer ubicaciones para buscar datos no estructurados para ubicaciones espaciales y generar entidades de puntos que representan dichas ubicaciones.

Los datos no estructurados son cualquier texto o documento, incluyendo, entre otros, el contenido de páginas web, informes, correos electrónicos y redes sociales. Pueden procesarse los documentos de Microsoft Office (Word, PowerPoint y Excel), los documentos PDF de Adobe, los archivos de texto, etc. El panel Extraer ubicaciones puede procesar muchas carpetas y archivos a la vez, o escanear un disco completo. También puede arrastrar el texto de un correo electrónico o una página web al panel para analizarlo.

Cada punto en la clase de entidad de salida tiene contenido en la tabla de atributos que indica el archivo en el que se encontró la ubicación espacial. El texto alrededor de la ubicación espacial se extrae del documento original y se almacena en atributos para proporcionar un contexto a la ubicación. También se pueden extraer fechas y palabras clave asociadas con la ubicación. El panel Extraer ubicaciones no reconoce automáticamente el texto que representa una dirección como una ubicación espacial y, por lo tanto, no puede usar un localizador para producir el punto que represente esa ubicación.

Las capacidades proporcionas en el panel Extraer ubicaciones también están disponibles usando las herramientas de geoprocesamiento Extraer ubicaciones de un documento y Extraer ubicaciones de un texto.

Ejemplo de texto de formato libre

Si está revisando artículos de noticias sobre terremotos en Alaska, por ejemplo, y desea ver cada ubicación mencionada en un artículo en un mapa, el texto de entrada de muestra que figura a continuación se puede copiar directamente en el panel.

Texto de entrada

El promedio en Alaska es de 100 terremotos al día. La tectónica de la región está dominada por la interacción de las placas del Pacífico y de América del Norte. Esta interacción ha explicado tres de los terremotos más grandes registrados en la historia. El más grande, que midió 9,2 en la escala de Richter, ocurrió en Prince William Sound (60,91°N, 147,34°O) el 28 de marzo de 1964. El segundo terremoto más grande de Alaska, que midió 8,7, ocurrió el 4 de febrero de 1965 cerca de las Islas Rata (51,25°N, 178,72°E). El tercero, que midió 8,6, ocurrió el 9 de marzo de 1957 cerca de las Islas Andreanof (51,50°N, 175,63°O).

Entidades de salida

Una vez extraídas del texto de entrada las ubicaciones de los tres terremotos, la clase de entidad de salida aparece en el panel Contenido y los puntos son visibles en el mapa activo.

Ubicaciones de terremotos extraídas en Alaska

De forma predeterminada, las fechas encontradas en el texto de entrada y que se encuentren dentro de un periodo de tiempo relativamente reciente también se extraen y registran en la tabla de atributos de la clase de entidad de salida. Sin embargo, las fechas del texto de entrada anterior se encuentran dentro del rango de fechas predeterminado.

Nota:

Algunos formatos de coordenadas espaciales internaciones y formatos de fechas internacionales no se reconocen por defecto cuando ocurren en el texto de entrada. Por ejemplo, sucede si una coordenada espacial utiliza abreviaturas de dirección traducidas a idiomas distintos del inglés, o si no se proporcionan fechas en formato ISO y se escriben en idiomas distintos del inglés. Estos ajustes se pueden personalizar para reconocer correctamente coordenadas y fechas en otros idiomas, ya sean distintos del inglés o además de este.

Ejemplo de texto semiestructurado

Además de reconocer las coordenadas espaciales, se pueden definir ubicaciones personalizadas que asocian un lugar con una coordenada espacial. Por ejemplo, si la palabra Portland se encuentra en cualquier parte de un documento, un punto que representa una ubicación en la ciudad puede asociarse con esa palabra. De manera similar, si se encuentra un código de aeropuerto, un punto que representa la ubicación del aeropuerto puede asociarse con ese código.

Algunos documentos tienen una cierta cantidad de estructura. Si dispone de una carpeta con formularios de viaje, se puede extraer de ellos la información y almacenarla en atributos personalizados en la tabla de atributos de la clase de entidad de salida. Por ejemplo, con un documento que contenga el texto de entrada que figura a continuación, se pueden definir atributos personalizados que extraigan texto siguiendo las etiquetas Name, Address y Purpose. Más tarde, los atributos se pueden procesar utilizando otras herramientas disponibles en ArcGIS AllSource.

Texto de entrada

Name: Doe, Jane

Address: 380 New York St, Redlands, CA, 92373

Date: 2019-03-14

Destination: PDX

Purpose: reunirse con el equipo en el Centro de I+D de Esri en 309 SW 6th Ave #600, Portland, OR, 97204.

Entidades de salida

Una vez extraídas del texto de entrada las ubicaciones personalizadas de Portland, la clase de entidad de salida aparece en el panel Contenido y los puntos son visibles en el mapa activo. Haga clic en las entidades para explorar la información extraída del documento. Para este ejemplo, las fechas se extraen y almacenan en la tabla de atributos. Los atributos personalizados también se usan para extraer texto desde el final de una etiqueta hasta el final de la línea y almacenar ese contenido en campos que representan el nombre y la dirección de la persona que viaja y el motivo del viaje. Para localizar las palabras clave que existen en el documento y almacenarlas en otro campo se utiliza un atributo personalizado adicional.

Ubicaciones extraídas de Portland

El contenido del campo Address de la tabla de atributos de la clase de entidad de salida puede geocodificarse utilizando otras herramientas (no se geocodifica automáticamente). De manera similar, la dirección almacenada en el texto de formato libre que describe la finalidad del viaje no se identifica automáticamente como dirección y se geocodifica.

Nota:

Si tiene datos de texto estructurados, como un archivo de texto delimitado por comas, donde las coordenadas x e y se almacenan en columnas separadas de la tabla, use la herramienta De tabla XY a punto para crear entidades de puntos que representen estas ubicaciones.