Skip To Content

Einführung in das Modell

Bannerbild für das Modell, in dem ein Verkehrsschild identifiziert wird, das auf eine falsche Fahrrichtung hinweist

Textbeschriftungen sind integraler Bestandteil von Katasterkarten und Grundrissen. Text in Form von Straßenschildern, Reklametafeln, Hausnummern oder Ortsnamen ist auch in unserer Umgebung allgegenwärtig. Durch Extrahieren dieser Texte können zusätzlicher Kontext und weitere Details zu den mit den Texten beschriebenen Orten und den auf diese Weise vermittelten Informationen gewonnen werden. Die Digitalisierung von Dokumenten und das Extrahieren von Text aus diesen Dokumenten erleichtern das Abrufen und Archivieren wichtiger Informationen.

Dieses Deep-Learning-Modell basiert auf dem MMOCR-Modell und verwendet OCR-Technologie (Optical Character Recognition, optische Zeichenerkennung) zum Erkennen von Text in Bildern. Das Modell wurde mit einem großen Dataset mit verschiedenen Textarten und -stilen mit unterschiedlichem Hintergrund und Kontext trainiert, um eine präzise Textextraktion zu ermöglichen. Es kann für verschiedene Aufgaben eingesetzt werden, beispielsweise zum automatischen Erkennen und Lesen von Text auf Reklametafeln, auf Schildern, in gescannten Karten usw. Dabei werden Bilder, die Text enthalten, in verwertbare Daten umgewandelt.

Lizenzanforderungen

Für diesen Workflow gelten die folgenden Lizenzanforderungen:

  • ArcGIS Desktop: ArcGIS Image Analyst-Erweiterung für ArcGIS Pro
  • ArcGIS Enterprise: ArcGIS Image Server mit konfigurierter Raster-Analyse
  • ArcGIS Online: ArcGIS Image for ArcGIS Online

Modelldetails

Dieses Modell hat die folgenden Merkmale:

  • Eingabe: Hochauflösende 3-Band-Bilder auf Straßenniveau mit mittlerem bis großem Text oder ein gescanntes Dokument
  • Ausgabe: Ein Feature-Layer mit Rahmen um den im Eingabebild erkannten Text
  • Berechnung: Dieser Workflow ist rechenintensiv. Empfohlen wird eine GPU mit mindestens CUDA Compute Capability Version 6.0.
  • Architektur: Das Modell basiert auf dem Open-Source-MMOCR-Modell von MMLab. Es verwendet das PSENet-Modell für Textidentifizierung und das ABINet-Modell für Texterkennung.

Zugreifen auf das Modell und Herunterladen des Modells

Laden Sie das vortrainierte Modell Optical Character Recognition aus ArcGIS Living Atlas of the World herunter. Alternativ können Sie direkt über ArcGIS Pro auf das Modell zugreifen oder es in ArcGIS Image for ArcGIS Online verwenden.

Herunterladen des Modells mit ArcGIS Online

Führen Sie die folgenden Schritte aus, um das Modell mit ArcGIS Online herunterzuladen:

  1. Navigieren Sie zum ArcGIS Living Atlas of the World.
  2. Melden Sie sich mit Ihren ArcGIS Online-Anmeldedaten an.
  3. Suchen Sie nach Optical Character Recognition, und öffnen Sie in den Suchergebnissen die entsprechende Elementseite.
  4. Klicken Sie auf die Schaltfläche Herunterladen, um das Modell herunterzuladen.
    Sie können die heruntergeladene .dlpk-Datei direkt in ArcGIS Pro verwenden, oder sie in ArcGIS Enterprise hochladen und dort verwenden.<a

Herunterladen des Modells in ArcGIS Pro

Führen Sie die folgenden Schritte aus, um das Modell in ArcGIS Pro herunterzuladen:

  1. Öffnen Sie ArcGIS Pro.
  2. Klicken Sie auf den Bereich Katalog, und wählen Sie Portal aus.
  3. Klicken Sie auf Living Atlas, und suchen Sie nach Optical Character Recognition.
  4. Klicken Sie mit der rechten Maustaste auf das Modell, und laden Sie die .dlpk-Datei herunter.

Versionshinweise

Es folgen die Versionshinweise:

DatumBeschreibung

Juli 2023

Erste Version von "Optical Character Recognition"