您可以在 ArcGIS Pro 中的 Image Analyst 工具箱提供的使用深度学习检测对象工具中使用 GroundingDINO 模型。
要使用 GroundingDINO 预训练模型,请完成以下步骤:
- 下载模型,然后在 ArcGIS Pro 中添加影像图层。
- 单击分析选项卡,然后单击工具。
- 在地理处理窗格中,单击工具箱,展开 Image Analyst 工具,然后选择深度学习下的使用深度学习检测对象工具。
- 在参数选项卡上,按照以下说明设置参数:
- 输入栅格 - 选择图像。
- 输出检测对象 - 提供输出要素类,其中将包含检测到的对象。
- 模型定义 - 选择预训练模型的 .dlpk 文件。
- 参数(可选)- 根据需要更改参数值。
- text_prompt - 描述待检测对象的文本。 输入可以是多个由逗号分隔的文本提示,这样可以同时检测多个类。
- padding - 影像切片边界处的像素数,将根据这些像素为相邻切片混合预测。 增加此值以减少边伪影,使输出更加平滑。 内边距的最大值可以是切片大小值的一半。
- batch_size - 模型推断每个步骤中处理的影像切片数。 这取决于显卡的内存。
- box_threshold - 这是一个置信度得分,用于筛选出结果中将要包含的检测对象。 允许的值范围为从 0 到 1.0。
- text_threshold - 这也是一个置信度分数,用于将检测到的对象与输入的文本提示相关联。 较高的分数可以确保与文本提示的关联性更强,但可能会导致匹配的对象减少。 允许的值范围为从 0 到 1.0。
- tta_scales - 通过更改影像比例,在预测期间执行测试时数据增强。 建议使用 0.5 至 1.5 范围内的值。 还可以提供由逗号分隔的多个比例值,例如 0.9, 1, 1.1。
- nms_overlap - 两个重叠要素的最大重叠比,其定义为交集区域与并集区域之比。 默认值为 0.1
- exclude_pad_detections - 如果值为 true,则过滤影像片内边距区域中的边附近可能被截断的检测结果。
- 非极大值抑制 - 可以选择性地选中复选框以移除具有较低置信度的重叠要素。
如果选中了此复选框,请执行以下操作:
- 置信度得分字段 - 使用默认值。
- 类值字段 - 使用默认值。
- 最大重叠比 - 将最大重叠比值设置为 0.1。
- 在环境选项卡上,按照以下说明设置变量:
- 处理范围 - 从下拉菜单中选择默认或适当选项。
- 像元大小 - 设置为适当的值。
选择以米为单位的像元大小,要确保在选定区域内,可以最大化感兴趣对象的可见性。 在检测较大对象时,应考虑使用较大的像元大小;而在检测较小对象时,则应选择较小的像元大小。 例如,云检测的像元大小设置为 10 米,而汽车检测的像元大小则设置为 0.30 米(30 厘米)。 有关像元大小的其他信息,请参阅栅格数据的像元大小帮助主题。
- 处理器类型 - 选择 CPU 或 GPU。
如果可以使用 GPU,建议您选择 GPU 并设置待使用 GPU 的 GPU ID。
- 单击运行。
处理完成后,输出图层将添加到地图。