260014: No se admite el formato de entrada.

Descripción

Los archivos del directorio de entrada deben ser de uno de los siguientes tipos compatibles:

  • ner_json
  • IOB
  • BILOU

Solución

Introduzca una ruta a un directorio para el parámetro Carpeta de entrada que contenga los archivos compatibles. Los formatos de archivo compatibles son JSON o CSV. Estos son los tipos de dataset compatibles:

  • ner_json: la carpeta debe contener un archivo .json con texto y las entidades etiquetadas.
  • IOB: este formato contiene las etiquetas B (principio), I (dentro) y O (fuera). La carpeta debe contener los dos siguientes archivos .csv:
    • token.csv: contiene texto como fragmentos de entrada
    • tags.csv: contiene etiquetas IOB para los fragmentos de texto
  • BILOU: este formato contiene las etiquetas B (principio), I (dentro), L (último), O (fuera) y U (unidad). La carpeta debe contener los dos siguientes archivos .csv:
    • token.csv: contiene texto como fragmentos de entrada
    • tags.csv: contiene etiquetas IOB para los fragmentos de texto

Para obtener más información sobre estos formatos y datos de etiquetado en estos formatos, consulte la guía sobre cómo etiquetar con Doccano.