260014: Le format en entrée n’est pas pris en charge.

Description

Les fichiers dans le répertoire en entrée doivent être de l’un des types pris en charge suivants :

  • ner_json
  • IOB
  • BILOU

Solution

Fournissez le chemin d’accès à un répertoire pour le paramètre Input Folder (Dossier en entrée) contenant les fichiers pris en charge. Les formats de fichiers pris en charge sont JSON ou CSV. Les types de jeux de données pris en charge sont les suivants :

  • ner_json : le dossier doit contenir un fichier .json avec du texte et les entités étiquetées.
  • IOB : ce format contient les balises suivantes : : B - 'beginning', I - 'inside', O - 'outside'. Le dossier doit contenir les deux fichiers .csv suivants :
    • token.csv : contient du texte sous forme de blocs en entrée
    • tags.csv : contient des balises IOB pour les blocs en entrée
  • BILUO : ce format contient les balises suivantes : B - 'beginning', I - 'inside', L - 'last', O - 'outside', U -'unit. Le dossier doit contenir les deux fichiers .csv suivants :
    • token.csv : contient du texte sous forme de blocs en entrée
    • tags.csv : contient des balises IOB pour les blocs en entrée

Pour plus d’informations sur ces formats et sur l’étiquetage des données dans ces formats, reportez-vous au guide sur l’étiquetage de texte avec Doccano.