Skip To Content

Введение в модель

Изображение баннера для модели, показывающее подсказки и обнаружение

В этом документе объясняется, как использовать предварительно обученную модель Text SAM, доступную в ArcGIS Living Atlas of the World. Модель используется для обнаружения объектов на изображении с помощью подсказки.

Text SAM - это образец модели с открытым исходным кодом, который можно использовать с помощью текстовых подсказок в произвольной форме для извлечения объектов различных типов. Это достигается за счет использования Grounding DINO и Segment Anything Model (SAM). Grounding DINO - это детектор объектов открытого типа, который может находить объекты по текстовой подсказке. Segment Anything Model можно использовать для сегментации любого объекта в области интереса, представленной ограничивающей рамкой или точкой. Обе модели вызываются последовательно в этом пакете глубокого обучения. Ограничивающие рамки, представляющие обнаруженные объекты из Grounding DINO, передаются в модель Segment Anything Model в качестве подсказок для создания масок для объектов. Наконец, маски преобразуются в полигоны и возвращаются как объекты ГИС. Эти объекты, описываемые текстовыми подсказками для входных данных, могут представлять собой любой интересующий объект, например транспортные средства, бассейны, корабли, самолеты, солнечные батареи и т. д.

Для выполнения этого рабочего процесса необходимы следующие лицензионные требования:

  • ArcGIS DesktopArcGIS Image Analyst дополнительный модуль для ArcGIS Pro
  • ArcGIS EnterpriseArcGIS Image Server
  • ArcGIS OnlineArcGIS Image for ArcGIS Online

Описание модели

Данная модель содержит следующие характеристики:

  • Входные данные - 8-разрядные 3-канальные изображения RGB.
  • Выходные данные - класс объектов, содержащий маски разных объектов на изображении.
  • Вычислить — этот рабочий процесс требует интенсивных вычислений, поэтому рекомендуется использовать видеокарту с минимальной вычислительной мощностью CUDA 6.0. Для этой модели требуется графический процессор с объемом памяти не менее 8 ГБ.
  • Подходящие географические регионы — эта модель предположительно должна эффективно работать по всему миру.
  • Архитектура - эта модель основана на базе Grounding DINO с открытым исходным кодом от IDEA-Research (Международная академия цифровой экономики) и модели Segment Anything Model (SAM) от Meta. Вы можете проверить исходный код этого примера пакета глубокого обучения (DLPK) для получения дополнительной информации.

Доступ и загрузка модели

Загрузите предварительно обученную модель Text SAM из ArcGIS Living Atlas of the World. Или получите доступ к модели непосредственно из ArcGIS Pro, либо работайте с ней в ArcGIS Image for ArcGIS Online.

  1. Перейдите к ArcGIS Living Atlas of the World.
  2. Войдите под своими учетными данными ArcGIS Online.
  3. Выполните поиск по запросу Text SAM и откройте страницу элемента в результатах поиска.
  4. Нажмите кнопку Загрузить, чтобы загрузить модель.

    Можно использовать загруженный файл .dlpk напрямую в ArcGIS Pro либо скачать и использовать его в ArcGIS Enterprise. Кроме того, при необходимости можно настроить предварительно обученную модель.

Информация по версии

Ниже приведена информация о версии:

ДатаОписание

Март 2024

Первый выпуск модели Text SAM