Введение в модель—Предварительно обученные модели ArcGIS

Рисунок баннера для модели идентификации знака "Проезд запрещен"

Текстовые надписи являются неотъемлемой частью кадастровых карт и поэтажных планов. Текст также распространен в естественных сценах вокруг нас в виде дорожных знаков, рекламных щитов, номеров домов и названий мест. Извлечение этого текста может предоставить дополнительный контекст и подробные сведения о местах, которые описывает текст, и информации, которую он передает. Оцифровка документов и извлечение из них текста помогает для осуществления поиска и архивирования важной информации.

Эта модель глубокого обучения основана на модели MMOCR и использует технологию оптического распознавания символов (OCR) для обнаружения текста на изображениях. Эта модель была обучена на большом наборе данных различных типов и стилей текста с разнообразным фоном и контекстами, что позволяет точно извлекать текст. Она может применяться для решения различных задач, таких как автоматическое обнаружение и считывание текста с рекламных щитов, вывесок, отсканированных карт и т.д., тем самым позволяя преобразовывать изображения, содержащие текст, в действенные данные.

Лицензионные требования

Для выполнения этого рабочего процесса необходимы следующие лицензионные требования:

ArcGIS Desktop—ArcGIS Image Analyst дополнительный модуль для ArcGIS Pro
ArcGIS Enterprise—ArcGIS Image Server с настроенной аналитикой растра
ArcGIS Online – ArcGIS Image for ArcGIS Online

Описание модели

Данная модель содержит следующие характеристики:

Входные данные — трехканальный снимок на уровне улиц высокого разрешения с текстом среднего или большого размера либо сканированный документ.
Выходные данные — векторный слой с рамками, ограничивающими текст, обнаруженный на входном изображении.
Вычислить — этот рабочий процесс требует интенсивных вычислений, поэтому рекомендуется использовать видеокарту с минимальной вычислительной мощностью CUDA 6.0.
Архитектура — эта модель основана на открытой модели MMOCR от MMLab. Она применяет модель PSENet для определения текста и модель ABINet — для его распознавания.

Доступ и загрузка модели

Загрузите предварительно обученную модель Optical Character Recognition из ArcGIS Living Atlas of the World. В качестве альтернативы, получите доступ к модели непосредственно из ArcGIS Pro или используйте ее в ArcGIS Image for ArcGIS Online.

Загрузка модели с ArcGIS Online

Выполните следующие действия для загрузки модели с ArcGIS Online:

Перейдите к ArcGIS Living Atlas of the World.
Войдите под своими учетными данными ArcGIS Online.
Выполните поиск по запросу Optical Character Recognition и откройте страницу элемента в результатах поиска.
Нажмите кнопку Загрузить, чтобы загрузить модель.
Использовать загруженный файл .dlpk можно напрямую в ArcGIS Pro, либо использовать его в ArcGIS Enterprise.

Загрузка модели в ArcGIS Pro

Выполните следующие действия для загрузки модели в ArcGIS Pro:

Откройте ArcGIS Pro.
Щелкните панель Каталог и выберите Портал.
Щелкните Living Atlas и найдите Optical Character Recognition.
Щелкните правой кнопкой модель и загрузите файл .dlpk.

Информация по версии

Ниже приведена информация о версии:


Дата	Описание
Июль 2023 г.	Первая версия модели Optical Character Recognition

Отзыв по этому разделу?