Skip To Content

使用模型

您可以在 ArcGIS Pro 中的 Image Analyst 工具箱提供的使用深度学习检测对象工具中使用 GroundingDINO 模型。

要使用 GroundingDINO 预训练模型,请完成以下步骤:

  1. 下载模型,然后在 ArcGIS Pro 中添加影像图层。

    ArcGIS Pro 工程中的影像图层

  2. 单击分析选项卡,然后单击工具

    ArcGIS Pro 中“分析”选项卡上的“工具”

  3. 地理处理窗格中,单击工具箱,展开 Image Analyst 工具,然后选择深度学习下的使用深度学习检测对象工具。

    “使用深度学习检测对象”工具

  4. 参数选项卡上,按照以下说明设置参数:
    1. 输入栅格 - 选择图像。
    2. 输出检测对象 - 提供输出要素类,其中将包含检测到的对象。
    3. 模型定义 - 选择预训练模型的 .dlpk 文件。
    4. 参数(可选)- 根据需要更改参数值。
      • text_prompt - 描述待检测对象的文本。 输入可以是多个由逗号分隔的文本提示,这样可以同时检测多个类。
      • padding - 影像切片边界处的像素数,将根据这些像素为相邻切片混合预测。 增加此值以减少边伪影,使输出更加平滑。 内边距的最大值可以是切片大小值的一半。
      • batch_size - 模型推断每个步骤中处理的影像切片数。 这取决于显卡的内存。
      • box_threshold - 这是一个置信度得分,用于筛选出结果中将要包含的检测对象。 允许的值范围为从 0 到 1.0。
      • text_threshold - 这也是一个置信度分数,用于将检测到的对象与输入的文本提示相关联。 较高的分数可以确保与文本提示的关联性更强,但可能会导致匹配的对象减少。 允许的值范围为从 0 到 1.0。
      • tta_scales - 通过更改影像比例,在预测期间执行测试时数据增强。 建议使用 0.5 至 1.5 范围内的值。 还可以提供由逗号分隔的多个比例值,例如 0.9, 1, 1.1。
      • nms_overlap - 两个重叠要素的最大重叠比,其定义为交集区域与并集区域之比。 默认值为 0.1
      • exclude_pad_detections - 如果值为 true,则过滤影像片内边距区域中的边附近可能被截断的检测结果。
    5. 非极大值抑制 - 可以选择性地选中复选框以移除具有较低置信度的重叠要素。

      如果选中了此复选框,请执行以下操作:

      • 置信度得分字段 - 使用默认值。
      • 类值字段 - 使用默认值。
      • 最大重叠比 - 将最大重叠比值设置为 0.1。

    “使用深度学习检测对象”工具参数

  5. 环境选项卡上,按照以下说明设置变量:
    1. 处理范围 - 从下拉菜单中选择默认或适当选项。
    2. 像元大小 - 设置为适当的值。

      选择以米为单位的像元大小,要确保在选定区域内,可以最大化感兴趣对象的可见性。 在检测较大对象时,应考虑使用较大的像元大小;而在检测较小对象时,则应选择较小的像元大小。 例如,云检测的像元大小设置为 10 米,而汽车检测的像元大小则设置为 0.30 米(30 厘米)。 有关像元大小的其他信息,请参阅栅格数据的像元大小帮助主题。

    3. 处理器类型 - 选择 CPUGPU

      如果可以使用 GPU,建议您选择 GPU 并设置待使用 GPU 的 GPU ID

    “使用深度学习检测对象”工具环境

  6. 单击运行

    处理完成后,输出图层将添加到地图。

    检测到的结果