
このディープ ラーニング モデルを使用して、テキストのエンティティを識別または分類します。 エンティティは、テキスト内の組織、個人、国の名前、日付や時間などの単語または一連の単語を示すことができます。 この事前トレーニング済みモデルは、テキストからエンティティを検出して、所定のカテゴリに分類します。
NER (Named Entity Recognition) は、大量のテキストの概要が必要な場合に役立ちます。 NER は、テキストから主要なエンティティを抽出することで、非常に重要な情報を提供できます。 抽出されたエンティティは、所定のクラスに分類され、意味のある決定および結論の導出に役立ちます。
テキストからさまざまなエンティティを抽出できる固有表現認識タスクに使用できる公開データセットはいくつかあります。 このディープ ラーニング モデルは OntoNotes 5 データセットを使用してトレーニングされており、これを使用して、英語のテキストから 18 の異なるエンティティを抽出できます。
ライセンス要件
このワークフローを完了する場合のライセンス要件は次のとおりです。
- ArcGIS Pro - Advanced ライセンス
- ArcGIS API for Python
モデルの詳細
このモデルには以下の特性があります。
- 入力 - 固有表現の抽出が実行されるテキスト。
- 出力 - 事前に定義されたエンティティ クラスに分類されたトークン。
- 計算 - このワークフローは計算負荷が高いため、計算能力が 6.0 以上の GPU が推奨されます。
- エンティティ名のアノテーション - このモデルは、以下の 18 のエンティティの抽出できます。
- PERSON - 架空を含む人物
- NORP - 国籍または宗教/政治団体
- FACILITY - 建物、空港、高速道路、橋など
- ORGANIZATION - 企業、代理店、機関など
- GPE - 国、都市、州
- LOCATION - GPE 以外の場所、山脈、水域
- PRODUCT - 車両、武器、食料など (サービス以外)
- EVENT - ハリケーン、争い、戦争、スポーツイベントなど
- WORK OF ART - 書籍名や曲名など
- LAW - 法律化された固有のドキュメント
- LANGUAGE - 固有言語
- DATE - 絶対的または相対的な日付または期間
- TIME— 1 日より短い時間
- PERCENT - パーセンテージ (「%」を含む)
- MONEY - 単位を含む金額
- QUANTITY - 重量や距離を含む計測値
- ORDINAL - 「1 番目」、「2 番目」などの数字の並び
- CARDINAL - 他のタイプに該当しない数字
- 精度メトリクス - このモデルの精度は 91.6 パーセントです。
モデルへのアクセスとダウンロード
Named Entity Recognition 事前トレーニング済みモデルを ArcGIS Living Atlas of the World からダウンロードします。
- ArcGIS Living Atlas of the World を参照します。
- 自分の ArcGIS Online アカウントの認証情報を使用してサイン インします。
- 「Named Entity Recognition」を検索して、検索結果からアイテム ページを開きます。
- [ダウンロード] ボタンをクリックして、モデルをダウンロードします。
ダウンロードした .dlpk ファイルを ArcGIS Pro で直接使用することも、ArcGIS Enterprise にアップロードして使用することもできます。 さらに、必要に応じて事前トレーニング済みモデルを微調整できます。
リリース ノート
以下はリリースノートです。
日付 | 説明 |
---|---|
2022 年 5 月 |
|