Beschriftung | Erläuterung | Datentyp |
Eingabeordner | Der Ordner mit den Textdateien, aus denen benannte Entitäten extrahiert werden sollen. | Folder |
Ausgabetabelle | Die Ausgabe-Feature-Class oder Ausgabetabelle, die die extrahierten Entitäten enthält. Wenn ein Locator angegeben wird und mit dem Modell Adressen extrahiert werden, wird die Feature-Class durch Geokodierung der extrahierten Adressen erzeugt. | Feature Class; Table |
Eingabe-Modelldefinitionsdatei | Das trainierte Modell, das für die Klassifizierung verwendet werden soll. Als Modelldefinitionsdatei kann eine JSON-Datei mit der Esri Modelldefinition (.emd) oder ein lokal gespeichertes Deep-Learning-Modellpaket (.dlpk) verwendet werden. | File |
Modellargumente (optional) |
Zusätzliche Argumente wie beispielsweise ein Konfidenzschwellenwert, die zum Anpassen der Empfindlichkeit des Modells verwendet werden. Die Namen der Argumente werden vom Werkzeug gefüllt. | Value Table |
Batch-Größe (optional) | Die Anzahl der Trainingsgebiete, die gleichzeitig verarbeitet werden sollen. Der Standardwert ist 4. Durch größere Batches kann die Leistung des Werkzeugs erhöht werden. Aber größere Batches belegen mehr Arbeitsspeicher. Wird die Fehlermeldung "Nicht genügend Arbeitsspeicher" angezeigt, verwenden Sie kleinere Batches. | Double |
Region oder Zone zur Verortung (optional) | Die geographische Region oder Zone, in der sich die Adressen vermutlich befinden. Der angegebene Text wird an die Adresse angehängt, die vom Modell extrahiert wurde. Vom Locator werden die Informationen der Verortungszone verwendet, um die Region oder den geographischen Bereich zu identifizieren, in der bzw. in dem sich die Adresse vermutlich befindet, und um bessere Ergebnisse zu erzielen. | String |
Eingabe-Locator (optional) | Der Locator, der verwendet wird, um Adressen in Eingabetextdokumenten zu geokodieren. Für jede erfolgreich geokodierte Adresse wird ein Punkt erzeugt und in der Ausgabe-Feature-Class gespeichert. | Address Locator |
Zusammenfassung
Damit wird ein trainiertes Modell zur Erkennung benannter Entitäten für Textdateien in einem Ordner zum Extrahieren von Entitäten und Positionen (wie Adressen, Namen von Orten oder Personen, Datumsangaben und Geldwerte) in eine Tabelle ausgeführt. Wenn die extrahierten Entitäten eine Adresse enthalten, wird diese vom Werkzeug mithilfe des angegebenen Locators geokodiert und eine Feature-Class als Ausgabe erzeugt.
Weitere Informationen zur Funktionsweise der Entitätenerkennung
Verwendung
Für dieses Werkzeug müssen Deep-Learning-Frameworks installiert sein. Informationen zum Einrichten des Computers für Deep-Learning-Frameworks in AllSource finden Sie unter Installieren von Deep-Learning-Frameworks for ArcGIS.
Dieses Werkzeug erfordert eine Modelldefinitionsdatei, die Informationen zum trainierten Modell enthält. Das Modell kann mit dem Werkzeug Textklassifizierungsmodell trainieren trainiert werden. Als Parameterwert für die Eingabe-Modelldefinitionsdatei kann eine JSON-Datei mit der Esri Modelldefinition (.emd) oder ein Deep-Learning-Modellpaket (.dlpk) verwendet werden. Die Modelldateien müssen lokal gespeichert werden.
Dieses Werkzeug kann in einer CPU oder einem Grafikprozessor ausgeführt werden. Deep Learning ist jedoch rechenintensiv, sodass ein Grafikprozessor empfohlen wird. Wenn Sie dieses Werkzeug mit dem Grafikprozessor ausführen möchten, legen Sie die Umgebungsvariable Prozessortyp auf "GPU" fest. Wenn Sie mehrere Grafikprozessoren haben, geben Sie stattdessen die Umgebung "GPU-ID" an.
Weitere Informationen zu den Voraussetzungen für die Ausführung dieses Werkzeugs und eventuell dabei auftretenden Problemen finden Sie unter Häufig gestellte Fragen zu Deep Learning.
Parameter
arcpy.geoai.ExtractEntitiesUsingDeepLearning(in_folder, out_table, in_model_definition_file, {model_arguments}, {batch_size}, {location_zone}, {in_locator})
Name | Erläuterung | Datentyp |
in_folder | Der Ordner mit den Textdateien, aus denen benannte Entitäten extrahiert werden sollen. | Folder |
out_table | Die Ausgabe-Feature-Class oder Ausgabetabelle, die die extrahierten Entitäten enthält. Wenn ein Locator angegeben wird und mit dem Modell Adressen extrahiert werden, wird die Feature-Class durch Geokodierung der extrahierten Adressen erzeugt. | Feature Class; Table |
in_model_definition_file | Das trainierte Modell, das für die Klassifizierung verwendet werden soll. Als Modelldefinitionsdatei kann eine JSON-Datei mit der Esri Modelldefinition (.emd) oder ein lokal gespeichertes Deep-Learning-Modellpaket (.dlpk) verwendet werden. | File |
model_arguments [model_arguments,...] (optional) |
Zusätzliche Argumente wie beispielsweise ein Konfidenzschwellenwert, die zum Anpassen der Empfindlichkeit des Modells verwendet werden. Die Namen der Argumente werden vom Werkzeug gefüllt. | Value Table |
batch_size (optional) | Die Anzahl der Trainingsgebiete, die gleichzeitig verarbeitet werden sollen. Der Standardwert ist 4. Durch größere Batches kann die Leistung des Werkzeugs erhöht werden. Aber größere Batches belegen mehr Arbeitsspeicher. Wird die Fehlermeldung "Nicht genügend Arbeitsspeicher" angezeigt, verwenden Sie kleinere Batches. | Double |
location_zone (optional) | Die geographische Region oder Zone, in der sich die Adressen vermutlich befinden. Der angegebene Text wird an die Adresse angehängt, die vom Modell extrahiert wurde. Vom Locator werden die Informationen der Verortungszone verwendet, um die Region oder den geographischen Bereich zu identifizieren, in der bzw. in dem sich die Adresse vermutlich befindet, und um bessere Ergebnisse zu erzielen. | String |
in_locator (optional) | Der Locator, der verwendet wird, um Adressen in Eingabetextdokumenten zu geokodieren. Für jede erfolgreich geokodierte Adresse wird ein Punkt erzeugt und in der Ausgabe-Feature-Class gespeichert. | Address Locator |
Codebeispiel
Das folgende Skript für das Python-Fenster veranschaulicht, wie Sie die Funktion ExtractEntitiesUsingDeepLearning verwenden.
# Name: ExtractEntities.py
# Description: Extract useful entities like "Address", "Date" from text.
#
# Requirements: ArcGIS Pro Advanced license
# Import system modules
import arcpy
import os
arcpy.env.workspace = "C:/textanalysisexamples/data"
dbpath = "C:/textanalysisexamples/Text_analysis_tools.gdb"
# Set local variables
in_folder = 'test_data'
out_table = os.path.join(dbpath, "ExtractedEntities")
pretrained_model_path_emd = "c:\\extractentities\\EntityRecognizer.emd"
# Run Extract Entities Using Deep Learning
arcpy.geoai.ExtractEntitiesUsingDeepLearning(in_folder, out_table, pretrained_model_path_emd)