使用模型—ArcGIS 预训练模型

您可以在 ArcGIS Pro 中的 Image Analyst 工具箱提供的使用深度学习检测对象工具中使用 GroundingDINO 模型。

要使用 GroundingDINO 预训练模型，请完成以下步骤：

下载模型，然后在 ArcGIS Pro 中添加影像图层。
单击分析选项卡，然后单击工具。
在地理处理窗格中，单击工具箱，展开 Image Analyst 工具，然后选择深度学习下的使用深度学习检测对象工具。
在参数选项卡上，按照以下说明设置参数：
1. 输入栅格 - 选择图像。
2. 输出检测对象 - 提供输出要素类，其中将包含检测到的对象。
3. 模型定义 - 选择预训练模型的 .dlpk 文件。
4. 参数（可选）- 根据需要更改参数值。
  - text_prompt - 描述待检测对象的文本。输入可以是多个由逗号分隔的文本提示，这样可以同时检测多个类。
  - padding - 影像切片边界处的像素数，将根据这些像素为相邻切片混合预测。增加此值以减少边伪影，使输出更加平滑。内边距的最大值可以是切片大小值的一半。
  - batch_size - 模型推断每个步骤中处理的影像切片数。这取决于显卡的内存。
  - box_threshold - 这是一个置信度得分，用于筛选出结果中将要包含的检测对象。允许的值范围为从 0 到 1.0。
  - text_threshold - 这也是一个置信度分数，用于将检测到的对象与输入的文本提示相关联。较高的分数可以确保与文本提示的关联性更强，但可能会导致匹配的对象减少。允许的值范围为从 0 到 1.0。
  - tta_scales - 通过更改影像比例，在预测期间执行测试时数据增强。建议使用 0.5 至 1.5 范围内的值。还可以提供由逗号分隔的多个比例值，例如 0.9, 1, 1.1。
  - nms_overlap - 两个重叠要素的最大重叠比，其定义为交集区域与并集区域之比。默认值为 0.1
  - exclude_pad_detections - 如果值为 true，则过滤影像片内边距区域中的边附近可能被截断的检测结果。
5. 非极大值抑制 - 可以选择性地选中复选框以移除具有较低置信度的重叠要素。
  如果选中了此复选框，请执行以下操作：
  - 置信度得分字段 - 使用默认值。
  - 类值字段 - 使用默认值。
  - 最大重叠比 - 将最大重叠比值设置为 0.1。
在环境选项卡上，按照以下说明设置变量：
1. 处理范围 - 从下拉菜单中选择默认或适当选项。
2. 像元大小 - 设置为适当的值。
  选择以米为单位的像元大小，要确保在选定区域内，可以最大化感兴趣对象的可见性。在检测较大对象时，应考虑使用较大的像元大小；而在检测较小对象时，则应选择较小的像元大小。例如，云检测的像元大小设置为 10 米，而汽车检测的像元大小则设置为 0.30 米（30 厘米）。有关像元大小的其他信息，请参阅栅格数据的像元大小帮助主题。
3. 处理器类型 - 选择 CPU 或 GPU。
  如果可以使用 GPU，建议您选择 GPU 并设置待使用 GPU 的 GPU ID。
单击运行。
处理完成后，输出图层将添加到地图。

有关此主题的反馈?