Sie können das Modell "Address Standardization" an Ihren geographischen Bereich anpassen. Für die Optimierung eines Modells sind weniger Trainingsdaten, Rechenressourcen und Zeit erforderlich als für das Training eines neuen Modells.
Eine Optimierung des Modells wird empfohlen, wenn Sie damit keine zufriedenstellenden Ergebnisse erzielen. Dies kann der Fall sein, wenn Sie es in einer Geographie anwenden, für die es nicht trainiert wurde.
Sie können dieses Modell mithilfe des Werkzeugs Texttransformationsmodell trainieren, das Sie in ArcGIS Pro in der Toolbox "GeoAI" finden, optimieren.
Führen Sie die folgenden Schritte aus, um das Modell zu optimieren:
- Laden Sie das Modell Address Standardization aus dem ArcGIS Living Atlas of the World herunter.
- Navigieren Sie zu Werkzeuge auf der Registerkarte Analyse.

- Klicken Sie im Bereich Geoverarbeitung auf die Registerkarte Toolboxes, wählen Sie GeoAI Tools aus, und navigieren Sie unter Textanalyse zum Werkzeug Texttransformationsmodell trainieren.

- Legen Sie die Variablen auf der Registerkarte Parameter wie folgt fest:
- Eingabetabelle: Die Point-, Line- oder Polygon-Eingabe-Feature-Class oder Eingabetabelle, die den zu transformierenden Text und den transformierten Zieltext für das Modelltraining enthält
- Textfeld: Das Textfeld in der Eingabe-Feature-Class oder Eingabetabelle, das den zu transformierenden Text enthält
- Beschriftungsfeld: Das Textfeld in der Eingabe-Feature-Class oder Eingabetabelle, das den transformierten Zieltext für das Modelltraining enthält
- Datei des vortrainierten Modells: Wählen Sie die .dlpk-Datei des vortrainierten Modells Address Standardization aus.
- Ausgabemodell: Der Speicherort des Ausgabeordners, in dem das trainierte Modell gespeichert wird
- Max. Epochen: 100 (Je nach der Anzahl der Iterationen, für die Sie das Modell optimieren möchten. Eine Epoche entspricht der Anzahl der Iterationen, die das Werkzeug für die Daten ausführt.)
- Legen Sie die Variablen der Option Modellparameter wie folgt fest:
Modell-Backbone (optional): Gibt das vorkonfigurierte neuronale Netzwerk an, das als Architektur für das Training des Modells verwendet werden soll.
- Batch-Größe: Die Anzahl der Zeilen, die gleichzeitig verarbeitet werden können. Durch größere Batches kann die Leistung des Werkzeugs erhöht werden. Aber größere Batches belegen mehr Arbeitsspeicher.
- Sequenzlänge: Maximale Sequenzlänge (auf Teilwortebene nach Tokenisierung) der Trainingsdaten, die für das Training des Modells berücksichtigt werden sollen. Der Standardwert ist 512. Dies gilt nur für Modelle mit HuggingFace-Transformer-Backbones.
- Verwenden Sie die Optionen unter Erweitert, um genauere Ergebnisse zu erhalten:
- Lernrate (optional): Die Schrittgröße, die angibt, in welchem Umfang die Modellgewichtungen beim Trainingsprozess angepasst werden sollen. Wenn kein Wert angegeben ist, wird automatisch eine optimale Lernrate abgeleitet.
- Validierungsprozentsatz (optional): Der Prozentsatz der Trainingsgebiete, die für die Überprüfung des Modells verwendet werden sollen. Der Standardwert ist 10.
- Beenden, wenn sich das Modell nicht mehr verbessert (optional): Gibt an, ob das Modelltraining beendet wird, wenn sich das Modell nicht mehr verbessert, oder erst dann, wenn der Wert für Max. Epochen erreicht wurde.
- HTML-Tags entfernen (optional): Gibt an, ob HTML-Tags aus dem Eingabetext entfernt werden sollen.
- URLs entfernen (optional): Gibt an, ob URLs aus dem Eingabetext entfernt werden sollen.
- Legen Sie die Variablen auf der Registerkarte Umgebungen fest, indem Sie CPU oder GPU für Prozessortyp auswählen.
Wenn eine GPU verfügbar ist, wird empfohlen, die Option GPU auszuwählen und GPU-ID auf die zu verwendende GPU festzulegen.
- Klicken Sie auf Ausführen.
Das Ausgabemodell wird am gewünschten Speicherort gespeichert.