説明
入力ディレクトリ内のファイルは、次のサポートされているタイプのいずれかである必要があります。
- ner_json
- IOB
- BILOU
解決策
サポートされているファイルを含む [入力フォルダー] に、ディレクトリへのパスを指定します。 サポートされているファイル形式は JSON または CSV です。 サポートされているデータセット タイプは次のとおりです。
- ner_json - フォルダーには、テキストとラベル付きエントリを含む .json ファイルが存在する必要があります。
- IOB - この形式には次のタグが含まれています: B - 'beginning'、I - 'inside'、O - 'outside'。 フォルダーには、次の 2 つの .csv ファイルが含まれている必要があります。
- token.csv - 入力チャンクとしてテキストが含まれています
- tags.csv - テキスト チャンクの IOB タグが含まれています
- BILUO - この形式には次のタグが含まれています: B - 'beginning'、I - 'inside'、L - 'last'、O - 'outside'、U - 'unit'。 フォルダーには、次の 2 つの .csv ファイルが含まれている必要があります。
- token.csv - 入力チャンクとしてテキストが含まれています
- tags.csv - テキスト チャンクの IOB タグが含まれています
これらの形式と、これらの形式のラベリング データの詳細については、「Doccano を使用したラベリング テキスト ガイド」をご参照ください。