Skip To Content

Einführung in das Modell

Bannerbild für das Modell

Text in Form von Straßenschildern, Reklametafeln, Hausnummern oder Ortsnamen ist in unserer Umgebung allgegenwärtig. Textbeschriftungen sind außerdem integraler Bestandteil von Katasterkarten und Grundrissen. Durch Extrahieren dieser Texte können zusätzlicher Kontext und weitere Details zu den mit den Texten beschriebenen Orten und den auf diese Weise vermittelten Informationen gewonnen werden.

Dieses Deep-Learning-Modell basiert auf dem PaddleOCR-Modell und verwendet OCR-Technologie (Optical Character Recognition, optische Zeichenerkennung) zum Erkennen von Text in Bildern. Das Modell wurde mit einem großen Dataset mit verschiedenen Textarten und -stilen mit unterschiedlichem Hintergrund und Kontext trainiert, um eine präzise Textextraktion zu ermöglichen. Es kann für verschiedene Aufgaben eingesetzt werden, beispielsweise zum automatischen Erkennen und Lesen von Text auf Reklametafeln, auf Schildern, in gescannten Karten usw. Dabei werden Bilder, die Text enthalten, in verwertbare Daten umgewandelt.

Lizenzanforderungen

Für diesen Workflow gelten die folgenden Lizenzanforderungen:

  • ArcGIS Desktop: ArcGIS Image Analyst-Erweiterung für ArcGIS Pro
  • ArcGIS Enterprise: ArcGIS Image Server mit konfigurierter Raster-Analyse
  • ArcGIS Online: ArcGIS Image for ArcGIS Online

Modelldetails

Dieses Modell hat die folgenden Merkmale:

  • Eingabe: Hochauflösende 3-Band-Bilddaten auf Straßenniveau oder ausgerichtete Bilddaten mit mittlerem bis großem Text
  • Ausgabe: Ein Feature-Layer mit Rahmen um den im Eingabebild erkannten Text
  • Verarbeitung: Dieses Modell kann nur auf einer CPU ausgeführt werden.
  • Architektur: Das Modell "Scene Text Parsing" stellt basierend auf dem Artikel PP-OCR: A Practical Ultra Lightweight OCR System einen Wrapper für das vortrainierte PaddleOCR-Texterkennungsmodell dar. Weitere Informationen zur Modellarchitektur und zu den für das Modell verwendeten Trainingsdaten finden Sie in dem Artikel.

Zugreifen auf das Modell und Herunterladen des Modells

Laden Sie das vortrainierte Modell Scene Text Parsing aus dem ArcGIS Living Atlas of the World herunter. Alternativ können Sie direkt über ArcGIS Pro auf das Modell zugreifen oder es in ArcGIS Image for ArcGIS Online verwenden.

  1. Navigieren Sie zum ArcGIS Living Atlas of the World.
  2. Melden Sie sich mit Ihren ArcGIS Online-Anmeldedaten an.
  3. Suchen Sie nach Scene Text Parsing, und öffnen Sie in den Suchergebnissen die entsprechende Elementseite.
  4. Klicken Sie auf die Schaltfläche Herunterladen, um das Modell herunterzuladen.
    Sie können die heruntergeladene .dlpk-Datei direkt in ArcGIS Pro verwenden, oder sie in ArcGIS Enterprise hochladen und dort verwenden.<a

Versionshinweise

Es folgen die Versionshinweise:

DatumBeschreibung

März 2022

  • Erste Version von "Scene Text Parsing"