Skip To Content

模型简介

模型通栏图像

此深度学习模型用于从文本中识别或分类实体。 一个实体可能指一个词或一系列词,例如文本中的组织名称、人名或县名,也可能指日期或时间。 此预训练模型可以从文本检测实体,并将其分类至预先确定的类别。

当需要对大量文本进行总体概括时,命名实体识别 (NER) 可能十分有用。 NER 可通过从文本中提取主要实体来为您提供至关重要的信息。 提取的实体将分类至预先确定的类别,它们可以帮助您得到更有意义的决策和结论。

有一些公开数据集适用于命名实体识别任务,可从文本中提取不同的实体。 此深度学习模型使用 OntoNotes 5 数据集训练,可用于从英文文本中提取 18 种不同的实体。

许可要求

要完成此工作流,需满足以下许可要求:

  • ArcGIS Pro - Advanced 许可
  • ArcGIS API for Python

模型详细信息

此模型具有以下特征:

  • 输入 - 将执行命名实体提取的文本。
  • 输出 - 分类至预定义实体类的令牌。
  • 计算 - 此为计算密集型工作流,建议使用计算能力为 6.0 或以上的 GPU。
  • 实体名称注记 - 此模型可以提取以下 18 种实体。
    • 人 - 人,包括虚构人物
    • NORP - 国籍或宗教/政治团体
    • 设施点 - 建筑物、机场、高速公路、桥梁等
    • 组织 - 公司、机构、学院等
    • GPE - 国家、城市、州
    • 位置 - 非 GPE 位置、山脉、水体
    • 产品 - 车辆、武器、食品等(非服务)
    • 事件 - 已命名的飓风、战役、战争、体育赛事等
    • 艺术作品 - 书名、歌曲名等
    • 法律 - 成为法律的已命名文档
    • 语言 - 任何已命名语言
    • 日期 - 绝对或相对日期、时期
    • 时间 - 短于一天的时间
    • 百分比 - 百分比(包括“%”)
    • 货币 - 货币值,包括单位
    • 数量 - 测量值,包括重量或距离
    • 序数 - 有序数字,例如“第一”和“第二”
    • 基数 - 不属于其他类型的数字
  • 准确率指标 - 此模型的准确率为 91.6%。

访问和下载模型

ArcGIS Living Atlas of the World 下载命名实体识别预训练模型。

  1. 浏览至 ArcGIS Living Atlas of the World
  2. 使用您的 ArcGIS Online 凭据进行登录。
  3. 搜索 Named Entity Recognition,然后从搜索结果中打开项目页面
  4. 单击下载按钮以下载模型。

    您可以在 ArcGIS Pro 中直接使用下载的 .dlpk 文件,或者在 ArcGIS Enterprise 中上传并使用文件。 还可以根据需要微调预训练模型。

发布说明

以下为发布说明:

日期描述

2022 年 5 月

  • “命名实体识别”第一版发布