Beschreibung
Die Dateien im Eingabeverzeichnis müssen einen der folgenden unterstützten Typen aufweisen:
- ner_json
- IOB
- BILOU
Lösung
Geben Sie für den Parameter Eingabeordner einen Pfad zu einem Verzeichnis mit unterstützten Dateien an. Es werden die Dateiformate JSON und CSV unterstützt. Folgende Dataset-Typen werden unterstützt:
- ner_json: Der Ordner muss eine .json-Datei mit Text und die beschrifteten Entitäten enthalten.
- IOB: Dieses Format enthält die folgenden Tags: B – "beginning" (Anfang), I – "inside" (innerhalb), O – "outside" (außerhalb). Der Ordner muss die beiden folgenden .csv-Dateien enthalten:
- token.csv: Enthält Text als Eingabe-Chunks.
- tags.csv: Enthält IOB-Tags für die Text-Chunks.
- BILUO: Dieses Format enthält die folgenden Tags: B – "beginning" (Anfang), I – "inside" (innerhalb), L – "last" (letztes),O – "outside" (außerhalb), U – "unit" (Einheit). Der Ordner muss die beiden folgenden .csv-Dateien enthalten:
- token.csv: Enthält Text als Eingabe-Chunks.
- tags.csv: Enthält IOB-Tags für die Text-Chunks.
Weitere Informationen zu diesen Formaten und zum Beschriften von Daten in diesen Formaten finden Sie in den Anweisungen zum Beschriften von Text mit Doccano.