模型简介—ArcGIS 预训练模型

文本标注是地籍图和楼层平面图不可或缺的一部分。文本也会以道路标志、广告牌、门牌号和地名的形式广泛存在于我们周围的自然场景中。提取此文本可以提供有关文本所描述的位置及其所传达的信息的其他上下文和详细信息。文档数字化并从中提取文本有助于检索和归档重要信息。

此深度学习模型基于 MMOCR 模型，使用光学字符识别 (OCR) 技术检测影像中的文本。此模型使用大型数据集进行了训练，数据集中包含具有各种背景和上下文的不同类型和风格的文本，因此模型可实现精确的文本提取。它可以应用于多种任务，例如从广告牌、标志牌、扫描的地图等位置自动检测和读取文本，由此将影像包含的文本转换为可处理的数据。

许可要求

要完成此工作流，需满足以下许可要求：

ArcGIS Desktop - ArcGIS Pro 的 ArcGIS Image Analyst 扩展模块
ArcGIS Enterprise - 已配置栅格分析的 ArcGIS Image Server
ArcGIS Online - ArcGIS Image for ArcGIS Online

模型详细信息

此模型具有以下特征：

输入 - 包含中到大尺寸文本的高分辨率三波段街道级影像或扫描文档。
输出 - 要素图层，其中包含围绕输入影像中检测到的文本的框。
计算 - 此为计算密集型工作流，建议使用 CUDA 计算能力不低于 6.0 的 GPU。
架构 - 此模型基于 MMLab 的开源 MMOCR 模型。它使用 PSENet 模型进行文本检测，使用 ABINet 模型进行文本识别。

访问和下载模型

从 ArcGIS Living Atlas of the World 下载光学字符识别预训练模型。也可以从 ArcGIS Pro 直接访问模型，或在 ArcGIS Image for ArcGIS Online 中使用模型。

使用 ArcGIS Online 下载模型

要使用 ArcGIS Online 下载模型，请完成以下步骤：

浏览至 ArcGIS Living Atlas of the World。
使用您的 ArcGIS Online 凭据进行登录。
搜索 Optical Character Recognition，然后从搜索结果中打开项目页面。
单击下载按钮以下载模型。
您可以在 ArcGIS Pro 中直接使用下载的 .dlpk 文件，或者在 ArcGIS Enterprise 中上传并使用文件。

在 ArcGIS Pro 中下载模型

要在 ArcGIS Pro 中下载模型，请完成以下步骤：

打开 ArcGIS Pro。
单击目录窗格并选择门户。
单击 Living Atlas 并搜索 Optical Character Recognition。
右键单击该模型并下载 .dlpk 文件。

发布说明

以下为发布说明：


日期	描述
2023 年 7 月	“光学字符识别”第一版发布

有关此主题的反馈?