L’extension ArcGIS LocateXT permet d’utiliser la fenêtre Extract Locations (Extraire les emplacements) pour rechercher des emplacements spatiaux dans des données non structurées et générer des entités ponctuelles représentant ces emplacements.
Les données non structurées désignent tout texte ou document incluant, sans que cela soit limitatif, des pages web, des rapports, des messages électroniques, du contenu issu des réseaux sociaux, etc. Les documents Microsoft Office (Word, PowerPoint et Excel), les documents PDF Adobe, les fichiers texte, entre autres, peuvent tous être traités. La fenêtre Extract Locations (Extraire les emplacements) est en mesure de traiter de nombreux dossiers et fichiers en une seule opération ou encore d’analyser l’intégralité du disque. Vous pouvez également faire glisser du texte depuis un message électronique ou une page Web et le déposer dans la fenêtre pour l’analyser.
Chaque point dans la classe d’entités en sortie possède un contenu dans la table attributaire qui indique le fichier dans lequel se trouve l’emplacement spatial. Le texte entourant l’emplacement spatial est extrait du document d’origine et stocké dans les attributs afin de délivrer le contexte de l’emplacement. Il est également possible d’extraire les dates et les mots-clés associés à l’emplacement. La fenêtre Extract Locations (Extraire les emplacements) ne reconnaît pas automatiquement le texte désignant une adresse en tant qu’emplacement spatial et, par conséquence, ne peut pas utiliser un localisateur pour produire un point représentant cet emplacement.
Les fonctionnalités fournies dans la fenêtre Extract Locations (Extraire les emplacements) sont également disponibles via les outils de géotraitement Extract Locations From Document (Extraire les emplacements du document) et Extract Locations From Text (Extraire les emplacements du texte).
Exemple de texte libre
Si vous consultez des articles sur les tremblements de terre en Alaska, par exemple, et que vous souhaitez visualiser sur une carte chaque emplacement mentionné dans l’article, vous pouvez copier et coller l’exemple de texte en entrée ci-dessous directement dans la fenêtre.
Texte en entrée
L’Alaska connaît en moyenne 100 tremblements de terre chaque jour. La tectonique de la région est dominée par l’interaction des plaques pacifique et nord-américaine. Cette interaction est responsable de trois des plus importants tremblements de terre jamais enregistrés au cours de l’histoire. Le plus puissant, d’une magnitude de 9,2 sur l’échelle de Richter, s’est produit dans la baie du Prince-William (60,91°N, 147,34°O) le 28 mars 1964. Le deuxième tremblement de terre le plus fort survenu en Alaska, d’une magnitude de 8,7, a eu lieu le 4 février 1965, à proximité des îles Rat (51,25°N, 178,72°E). Le troisième, d’une magnitude de 8,6, s’est produit le 9 mars 1957 près des îles Andreanof (51,50°N, 175,63°O).
Entités en sortie
Une fois que les emplacements des trois tremblements de terre ont été extraits du texte en entrée, la classe d’entités en sortie apparaît dans la fenêtre Contents (Contenu) et les points sont visibles dans la carte active.
Par défaut, toute date relativement récente trouvée dans le texte en entrée est également extraite et enregistrée dans la table attributaire de la classe d’entités en sortie. Les dates dans le texte en entrée ci-dessus ne sont toutefois pas comprises dans la plage de dates par défaut.
Remarque :
Certains formats de coordonnées spatiales internationaux et certains formats de date internationaux ne sont pas reconnus par défaut lorsqu’ils se trouvent dans le texte en entrée. Ceci est le cas par exemple lorsque des coordonnées spatiales utilisent des abréviations d’adresses traduites dans d’autres langues que l’anglais, et quand les dates ne sont pas fournies au format ISO mais rédigées dans une langue autre que l’anglais. Les paramètres peuvent être personnalisés afin de reconnaître correctement les coordonnées et les dates dans d’autres langues, à la place ou en plus de l’anglais.
Exemple de texte semi-structuré
Outre la reconnaissance des coordonnées spatiales, vous pouvez définir des emplacements personnalisés pour associer un lieu à des coordonnées spatiales. Si, par exemple le mot Portland est trouvé dans un document, un point représentant un emplacement dans la ville peut être associé à ce mot. De même, si le code d’un aéroport est trouvé, un point représentant l’emplacement de l’aéroport en question peut être associé à ce code.
Certains documents possèdent une structure plus ou moins développée. Si vous détenez un dossier de formulaires de voyage, il est possible d’en extraire des informations et de les stocker dans les attributs personnalisés au sein de la table attributaire de la classe d’entités en sortie. Par exemple, avec un document contenant le texte en entrée mentionné ci-dessous, vous pouvez définir les attributs personnalisés pour extraire le texte selon les étiquettes Name (Nom :), Address (Adresse :) et Purpose (But du voyage :). Par la suite, les attributs sont traités au moyen d’autres outils disponibles dans ArcGIS AllSource.
Texte en entrée
Name: Doe, Jane
Address: 380 New York St, Redlands, CA, 92373
Date: 2019-03-14
Destination: PDX
Purpose: Meet with the team at the Esri R&D Center at 309 SW 6th Ave #600, Portland, OR, 97204.
Entités en sortie
Une fois que les emplacements personnalisés dans Portland ont été extraits du texte en entrée, la classe d’entités en sortie apparaît dans la fenêtre Contents (Contenu) et les points sont visibles dans la carte active. Cliquez sur les entités pour explorer les informations extraites du document. Dans cet exemple, les dates sont extraites et stockées dans la table attributaire. Les attributs personnalisés sont également utilisés pour extraire le texte depuis la fin d’une étiquette jusqu’à la fin de la ligne, et pour stocker ce contenu dans les champs désignant le nom et l’adresse du voyageur, ainsi que la raison de son voyage. Tout autre attribut personnalisé permet de localiser les mots-clés figurant dans le document et de les stocker dans un autre champ.
Le contenu du champ Address dans la table attributaire de la classe d’entités en sortie peut être géocodé à l’aide d’autres outils, mais il ne l’est pas de façon automatique. De la même manière, l’adresse stockée dans le texte libre décrivant le but du voyage n’est pas automatiquement identifiée comme une adresse et géocodée.
Remarque :
Si vous possédez des données textuelles structurées (un fichier de texte dont les valeurs sont séparées par des virgules, par exemple) dans lesquelles les coordonnées x et y sont stockées dans des colonnes séparées de la table, utilisez l’outil XY Table to Point (Table XY vers points) pour créer des entités ponctuelles représentant ces emplacements.
Vous avez un commentaire à formuler concernant cette rubrique ?