Bereich "Positionen extrahieren"

AllSource 1.2    |

Mit der Erweiterung ArcGIS LocateXT können Sie im Bereich Positionen extrahieren unstrukturierte Daten nach räumlichen Positionen durchsuchen und Punkt-Features generieren, die diese Positionen darstellen.

Unstrukturierte Daten sind Text oder Dokumente, beispielsweise Webseiten, Berichte, E-Mails und Social-Media-Inhalte. Es können Microsoft Office-Dokumente (Word, PowerPoint und Excel), Adobe PDF-Dokumente, Textdateien u. a. m. verarbeitet werden. Im Bereich Positionen extrahieren können viele Ordner und Dateien gleichzeitig verarbeitet oder auch ein gesamter Datenträger gescannt werden. Sie können auch Text aus einer E-Mail oder Webseite in den Bereich ziehen, um ihn analysieren zu lassen.

Für jeden Punkt in der Ausgabe-Feature-Class wird in der Attributtabelle die Datei angegeben, in der die räumliche Position gefunden wurde. Text in der Nähe der räumlichen Position wird aus dem ursprünglichen Dokument extrahiert und in Attributen gespeichert, um Kontext für die Position bereitzustellen. Es können auch mit der Position verknüpfte Datumsangaben und Schlüsselwörter extrahiert werden. Da im Bereich Positionen extrahieren Text, der eine Adresse darstellt, nicht automatisch als räumliche Position erkannt wird, kann nicht mit einem Locator ein Punkt erzeugt werden, der die Position darstellt.

Die Funktionen im Bereich Positionen extrahieren sind auch mit den Geoverarbeitungswerkzeugen Positionen aus Dokument extrahieren und Positionen aus Text extrahieren verfügbar.

Beispiel mit freiem Text

Wenn Sie beispielsweise Artikel über Erdbeben in Alaska lesen und jede in den Artikeln erwähnte Position auf einer Karte darstellen möchten, kann der Beispiel-Eingabetext unten direkt in den Bereich kopiert werden.

Eingabetext

Alaska averages 100 earthquakes a day. The tectonics of the region are dominated by the interaction of the Pacific and North American plates. This interaction has accounted for three of the largest recorded earthquakes in history. The largest, measuring 9.2 on the Richter scale, occurred in the Prince William Sound (60.91°N, 147.34°W) on March 28th, 1964. The second largest Alaskan earthquake, measuring 8.7, occurred on February 4th, 1965, near the Rat Islands (51.25°N, 178.72°E). The third, measuring 8.6, occurred on March 9th, 1957, near the Andreanof Islands (51.50°N, 175.63°W).

Ausgabe-Features

Sobald die Positionen der drei Erdbeben aus dem Eingabetext extrahiert wurden, wird die Ausgabe-Feature-Class im Bereich Inhalt angezeigt, und die Punkte sind auf der aktiven Karte sichtbar.

Extrahierte Erdbebenpositionen in Alaska

Standardmäßig werden alle Datumsangaben im Eingabetext, die aus dem aktuellen Zeitraum stammen, ebenfalls in die Attributtabelle der Ausgabe-Feature-Class extrahiert und aufgezeichnet. Allerdings liegen die Datumsangaben im Eingabetext außerhalb des Standarddatumsbereichs.

Hinweis:

Einige internationale Formate für räumliche Koordinaten und internationale Datumsformate, die im Eingabetext vorkommen können, werden nicht automatisch erkannt. Dies trifft zum Beispiel auf räumliche Koordinaten zu, in denen Abkürzungen für Richtungen in eine andere Sprache als Englisch übertragen werden, und auf Datumsangaben, die nicht im ISO-Format, sondern in einer anderen Sprache als Englisch verfasst wurden. Die Einstellungen können angepasst werden, sodass Koordinaten und Datumsangaben in anderen Sprachen ordnungsgemäß erkannt werden, entweder anstelle der englischen Angaben oder zusätzlich dazu.

Beispiel mit grob strukturiertem Text

Zusätzlich zur Erkennung räumlicher Koordinaten können benutzerdefinierte Positionen definiert werden, die einen Ort mit einer räumlichen Koordinate verknüpfen. Wenn z. B. an einer beliebigen Stelle im Dokument das Wort "Portland" gefunden wird, kann mit diesem Wort ein Punkt verknüpft werden, der eine Position in der Stadt darstellt. Und wenn ein Flughafencode gefunden wird, kann mit diesem ein Punkt verknüpft werden, der die Position des Flughafens darstellt.

Manche Dokumente weisen eine Struktur auf. Wenn ein Ordner Reiseformulare enthält, können daraus Informationen extrahiert und in der Attributtabelle der Ausgabe-Feature-Class in benutzerdefinierten Attributen gespeichert werden. Beispielsweise können für ein Dokument, das den unten stehenden Eingabetext enthält, benutzerdefinierte Attribute definiert werden, die Text gemäß den Beschriftungen Name, Address und Purpose extrahieren. Die Attribute können später mit anderen Werkzeugen verarbeitet werden, die in ArcGIS AllSource verfügbar sind.

Eingabetext

Name: Doe, Jane

Address: 380 New York St, Redlands, CA, 92373

Date: 14.03.2019

Destination: PDX

Purpose: Meet with the team at the Esri R&D Center at 309 SW 6th Ave #600, Portland, OR, 97204.

Ausgabe-Features

Sobald die benutzerdefinierten Positionen in Portland aus dem Eingabetext extrahiert wurden, wird die Ausgabe-Feature-Class im Bereich Inhalt angezeigt, und die Punkte sind auf der aktiven Karte sichtbar. Klicken Sie auf die Features, um die aus dem Dokument extrahierten Informationen zu erkunden. In diesem Beispiel werden Datumsangaben extrahiert und in der Attributtabelle gespeichert. Zudem wird mithilfe benutzerdefinierter Attribute Text vom Ende einer Beschriftung bis zum Ende der Zeile extrahiert. Dieser Inhalt wird in Feldern gespeichert, die den Namen und die Adresse der reisenden Person und den Grund für die Reise darstellen. Mit einem zusätzlichen benutzerdefinierten Attribut werden im Dokument vorhandene Schlüsselwörter gesucht und in einem weiteren Feld gespeichert.

Extrahierte Positionen in Portland

Der Inhalt des Feldes Address in der Attributtabelle der Ausgabe-Feature-Class kann mit anderen Werkzeugen geokodiert werden. Er wird jedoch nicht automatisch geokodiert. Ebenso wird die im freien Text, der den Zweck der Reise beschreibt, gespeicherte Adresse nicht automatisch als Adresse identifiziert und geokodiert.

Hinweis:

Wenn Sie über Daten mit strukturiertem Text verfügen, z. B. eine durch Kommas getrennte Textdatei, in der die X- und Y-Koordinaten in gesonderten Tabellenspalten gespeichert sind, erstellen Sie mit dem Werkzeug XY-Tabelle in Punkt Punkt-Features, die diese Positionen darstellen.