Skip To Content

Einführung in das Modell

Bannerbild für das Modell

Dieses Deep-Learning-Modell wird zum Identifizieren oder Kategorisieren von Entitäten in Text verwendet. Eine Entität kann ein Wort oder eine Wortfolge wie der Name einer Organisation, einer Person oder eines Landes, ein Datum oder eine Uhrzeit im Text sein. Dieses vortrainierte Modell erkennt Entitäten im Text und klassifiziert sie in vordefinierte Kategorien.

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) kann hilfreich sein, wenn Sie sich einen allgemeinen Überblick über große Textmengen verschaffen möchten. NER kann durch Extrahieren der Hauptentitäten aus dem Text entscheidende wichtige Informationen liefern. Die extrahierten Entitäten werden nach den vordefinierten Klassen kategorisiert und können sinnvolle Entscheidungen und Schlussfolgerungen erleichtern.

Es gibt einige öffentliche Datasets für die Erkennung benannter Entitäten, mit denen verschiedene Entitäten aus Text extrahiert werden können. Dieses Deep-Learning-Modell wurde mit dem OntoNotes 5-Dataset trainiert und kann zum Extrahieren 18 verschiedener Entitäten aus englischsprachigem Text verwendet werden.

Lizenzanforderungen

Für diesen Workflow gelten die folgenden Lizenzanforderungen:

  • ArcGIS Pro: Advanced-Lizenz
  • ArcGIS API for Python

Modelldetails

Dieses Modell hat die folgenden Merkmale:

  • Eingabe: Text, für den die Extraktion benannter Entitäten ausgeführt wird
  • Ausgabe: Klassifizierte Token in vordefinierten Entitätsklassen
  • Berechnung: Dieser Workflow ist rechenintensiv. Empfohlen wird eine GPU mit Compute Capability Version 6.0 oder höher.
  • Annotation für Entitätsnamen: Mit diesem Modell können die 18 folgenden Entitäten extrahiert werden:
    • PERSON: Personen, einschließlich fiktiver Personen
    • NORP: Nationalitäten, religiöse oder politische Gruppen
    • FACILITY: Gebäude, Flughäfen, Schnellstraßen, Brücken usw.
    • ORGANIZATION: Unternehmen, Behörden, Institutionen usw.
    • GPE: Länder, Städte, Bundesstaaten
    • LOCATION: Nicht-GPE-Positionen, Gebirge, Gewässer
    • PRODUCT: Fahrzeuge, Waffen, Lebensmittel usw. (keine Services)
    • EVENT: Benannte Hurrikane, Schlachten, Kriege, Sportveranstaltungen usw.
    • WORK OF ART: Titel von Büchern, Liedern usw.
    • LAW: Benannte Dokumente, die zu Gesetzen wurden
    • LANGUAGE: Alle benannten Sprachen
    • DATE: Absolute oder relative Datumsangaben oder Zeiträume
    • TIME: Zeiträume, die kleiner als ein Tag sind
    • PERCENT: Prozentsatz (einschließlich "%")
    • MONEY: Monetäre Werte, einschließlich Einheiten
    • QUANTITY: Messwerte, einschließlich Gewicht oder Entfernung
    • ORDINAL: Ordnungszahlen wie "erstes" und "zweites"
    • CARDINAL: Zahlen, die unter keinen anderen Typ fallen
  • Accuracy-Kennwerte: Das Modell hat eine Accuracy von 91,6 Prozent.

Zugreifen auf das Modell und Herunterladen des Modells

Laden Sie das vortrainierte Modell Named Entity Recognition aus dem ArcGIS Living Atlas of the World herunter.

  1. Navigieren Sie zum ArcGIS Living Atlas of the World.
  2. Melden Sie sich mit Ihren ArcGIS Online-Anmeldedaten an.
  3. Suchen Sie nach Named Entity Recognition, und öffnen Sie in den Suchergebnissen die entsprechende Elementseite.
  4. Klicken Sie auf die Schaltfläche Herunterladen, um das Modell herunterzuladen.

    Sie können die heruntergeladene .dlpk-Datei direkt in ArcGIS Pro verwenden, oder sie in ArcGIS Enterprise hochladen und dort verwenden. Außerdem können Sie das vortrainierte Modell bei Bedarf optimieren.

Versionshinweise

Es folgen die Versionshinweise:

DatumBeschreibung

Mai 2022

  • Erste Version von "Named Entity Recognition"