Skip To Content

模型简介

模型通栏图像

ArcGIS Living Atlas of the World 上提供的 CLIP 零样本分类器预训练模型是用于分类图像的深度学习模型。

此深度学习模型由 CLIP(对比语言 - 图像预训练)提供支持,用于将图像分类到用户指定的几个类别之一。 它使用 CLIP 预先训练的图像和文本关系知识,根据您提供的类名对图像进行分类。 该模型在定向影像上的效果良好,并且适用于单个输入图像或装满图像的文件夹。 除了为图像分配类之外,它还为分类提供概率得分。

许可要求

要完成此工作流,需满足以下许可要求:

  • ArcGIS Desktop - ArcGIS ProArcGIS Image Analyst 扩展模块
  • ArcGIS Enterprise - 已配置栅格分析的 ArcGIS Image Server
  • ArcGIS Online - ArcGIS Image for ArcGIS Online

模型概览

此模型具有以下特征:

  • 输入 - 8 位 RGB 定向影像。
  • 输出 - 包含图像分类信息的要素类。
  • 计算 - 此为计算密集型工作流,建议使用 CUDA 计算能力不低于 6.0 的 GPU。
  • 适用地理位置 - 此模型预计适用于全球。
  • 架构 - 该实施基于 OpenAI 的 CLIP,并采用 ViT-B-32 Transformer 架构。
  • 准确率指标 - 参考原始 CLIP 模型卡片

访问和下载模型

ArcGIS Living Atlas of the World 下载 CLIP 零样本分类器预训练模型。 也可以从 ArcGIS Pro 直接访问模型,或在 ArcGIS Image for ArcGIS Online 中使用模型。

  1. 浏览至 ArcGIS Living Atlas of the World
  2. 使用您的 ArcGIS Online 凭据进行登录。
  3. 搜索 CLIP Zero-ShotClassifier 并从搜索结果中打开 item_page
  4. 单击下载按钮以下载模型。

    您可以直接在 ArcGIS Pro 中使用下载的 .dlpk 文件。

发布说明

以下为发布说明:

日期描述

2024 年 6 月

“CLIP 零样本分类器”第一版