您可以在 ArcGIS Pro 中的 Image Analyst 工具箱提供的使用深度学习检测对象工具中使用此模型。 按照以下步骤使用模型解析影像中的文本。
受支持的影像
此模型可以与包含中到大尺寸文本的高分辨率三波段街道级影像或扫描文档配合使用。
检测并识别文本
完成以下步骤以从影像中读取文本:
- 下载光学字符识别模型,然后在 ArcGIS Pro 中添加包含文本的影像或街道级影像。
- 缩放至感兴趣区域。
- 浏览至分析选项卡上的工具。
- 单击地理处理窗格中的工具箱选项卡,选择影像分析工具,然后浏览至深度学习下的使用深度学习检测对象工具。
- 按照以下说明设置参数选项卡上的变量:
- 输入栅格 - 选择图像。
- 输出检测对象 - 设置输出的已检测对象,其中将包含文本检测和识别结果。
- 模型定义 - 选择预训练模型的 .dlpk 文件。
- 参数 - 根据需要更改参数值。
- threshold - 置信度得分高于此阈值的检测将包含在结果中。 允许的值范围为从 0 到 1.0。
- test_time_augmentation - 在预测期间执行测试时数据增强。 如果值为 true,则输入影像的翻转和旋转变体的预测将合并到最终输出中。
- batch_size - 文本识别模型一次要处理的文本检测数量。
- 非极大值抑制 - 可选,根据需要选中或取消选中复选框。
如果选中了此复选框,请执行以下操作:
- 设置置信度得分字段值。
- 设置类值字段值。
- 设置最大重叠比值。
- 按照以下说明设置环境选项卡上的变量:
- 处理范围 - 从下拉菜单中选择默认或任意其他选项。
- 处理器类型 - 根据需要选择 CPU 或 GPU。
注:
如果 GPU 可用,建议选择 GPU 并设置 GPU ID 以指定要使用的 GPU。
- 单击运行。
输出图层将添加到地图。