Descripción
Los archivos del directorio de entrada deben ser de uno de los siguientes tipos compatibles:
- ner_json
- IOB
- BILOU
Solución
Introduzca una ruta a un directorio para el parámetro Carpeta de entrada que contenga los archivos compatibles. Los formatos de archivo compatibles son JSON o CSV. Estos son los tipos de dataset compatibles:
- ner_json: la carpeta debe contener un archivo .json con texto y las entidades etiquetadas.
- IOB: este formato contiene las etiquetas B (principio), I (dentro) y O (fuera). La carpeta debe contener los dos siguientes archivos .csv:
- token.csv: contiene texto como fragmentos de entrada
- tags.csv: contiene etiquetas IOB para los fragmentos de texto
- BILOU: este formato contiene las etiquetas B (principio), I (dentro), L (último), O (fuera) y U (unidad). La carpeta debe contener los dos siguientes archivos .csv:
- token.csv: contiene texto como fragmentos de entrada
- tags.csv: contiene etiquetas IOB para los fragmentos de texto
Para obtener más información sobre estos formatos y datos de etiquetado en estos formatos, consulte la guía sobre cómo etiquetar con Doccano.