文本以道路标志、广告牌、门牌号和地名的形式广泛存在于我们周围的自然场景中。 文本标注也是地籍图和楼层平面图不可或缺的一部分。 提取此文本可以提供有关文本所描述的位置及其所传达的信息的其他上下文和详细信息。
此深度学习模型基于 PaddleOCR 模型,使用光学字符识别 (OCR) 技术检测影像中的文本。 此模型使用大型数据集进行了训练,数据集中包含具有各种背景和上下文的不同类型和风格的文本,因此模型可实现精确的文本提取。 它可以应用于多种任务,例如从广告牌、标志牌、扫描的地图等位置自动检测和读取文本,由此将影像包含的文本转换为可处理的数据。
许可要求
要完成此工作流,需满足以下许可要求:
- ArcGIS Desktop - ArcGIS Pro 的 ArcGIS Image Analyst 扩展模块
- ArcGIS Enterprise - 已配置栅格分析的 ArcGIS Image Server
- ArcGIS Online - ArcGIS Image for ArcGIS Online
模型详细信息
此模型具有以下特征:
- 输入 - 具有中到大尺寸文本的高分辨率三波段街道级影像或定向影像。
- 输出 - 要素图层,其中包含围绕输入影像中检测到的文本的框。
- 计算 - 该模型仅可在 CPU 上运行。
- 架构 - 此场景文本解析模型是预训练文本识别 PaddleOCR 模型的包装器,该模型基于标题为 PP-OCR: A Practical Ultra Lightweight OCR System 的文章。 在此文章中可以了解有关模型架构和模型所使用的训练数据的详细信息。
访问和下载模型
从 ArcGIS Living Atlas of the World 下载场景文本解析预训练模型。 也可以从 ArcGIS Pro 直接访问模型,或在 ArcGIS Image for ArcGIS Online 中使用模型。
- 浏览至 ArcGIS Living Atlas of the World。
- 使用您的 ArcGIS Online 凭据进行登录。
- 搜索 Scene Text Parsing,然后从搜索结果中打开项目页面。
- 单击下载按钮以下载模型。您可以在 ArcGIS Pro 中直接使用下载的 .dlpk 文件,或者在 ArcGIS Enterprise 中上传并使用文件。
发布说明
以下为发布说明:
日期 | 描述 |
---|---|
2022 年 3 月 |
|