
此深度学习模型用于从文本中识别或分类实体。 一个实体可能指一个词或一系列词,例如文本中的组织名称、人名或县名,也可能指日期或时间。 此预训练模型可以从文本检测实体,并将其分类至预先确定的类别。
当需要对大量文本进行总体概括时,命名实体识别 (NER) 可能十分有用。 NER 可通过从文本中提取主要实体来为您提供至关重要的信息。 提取的实体将分类至预先确定的类别,它们可以帮助您得到更有意义的决策和结论。
有一些公开数据集适用于命名实体识别任务,可从文本中提取不同的实体。 此深度学习模型使用 OntoNotes 5 数据集训练,可用于从英文文本中提取 18 种不同的实体。
许可要求
要完成此工作流,需满足以下许可要求:
- ArcGIS Pro - Advanced 许可
- ArcGIS API for Python
模型详细信息
此模型具有以下特征:
- 输入 - 将执行命名实体提取的文本。
- 输出 - 分类至预定义实体类的令牌。
- 计算 - 此为计算密集型工作流,建议使用计算能力为 6.0 或以上的 GPU。
- 实体名称注记 - 此模型可以提取以下 18 种实体。
- 人 - 人,包括虚构人物
- NORP - 国籍或宗教/政治团体
- 设施点 - 建筑物、机场、高速公路、桥梁等
- 组织 - 公司、机构、学院等
- GPE - 国家、城市、州
- 位置 - 非 GPE 位置、山脉、水体
- 产品 - 车辆、武器、食品等(非服务)
- 事件 - 已命名的飓风、战役、战争、体育赛事等
- 艺术作品 - 书名、歌曲名等
- 法律 - 成为法律的已命名文档
- 语言 - 任何已命名语言
- 日期 - 绝对或相对日期、时期
- 时间 - 短于一天的时间
- 百分比 - 百分比(包括“%”)
- 货币 - 货币值,包括单位
- 数量 - 测量值,包括重量或距离
- 序数 - 有序数字,例如“第一”和“第二”
- 基数 - 不属于其他类型的数字
- 准确率指标 - 此模型的准确率为 91.6%。
访问和下载模型
从 ArcGIS Living Atlas of the World 下载命名实体识别预训练模型。
- 浏览至 ArcGIS Living Atlas of the World。
- 使用您的 ArcGIS Online 凭据进行登录。
- 搜索 Named Entity Recognition,然后从搜索结果中打开项目页面。
- 单击下载按钮以下载模型。
您可以在 ArcGIS Pro 中直接使用下载的 .dlpk 文件,或者在 ArcGIS Enterprise 中上传并使用文件。 还可以根据需要微调预训练模型。
发布说明
以下为发布说明:
日期 | 描述 |
---|---|
2022 年 5 月 |
|