Skip To Content

Введение в модель

Рисунок баннера для модели идентификации знака "Проезд запрещен"

Текстовые надписи являются неотъемлемой частью кадастровых карт и поэтажных планов. Текст также распространен в естественных сценах вокруг нас в виде дорожных знаков, рекламных щитов, номеров домов и названий мест. Извлечение этого текста может предоставить дополнительный контекст и подробные сведения о местах, которые описывает текст, и информации, которую он передает. Оцифровка документов и извлечение из них текста помогает для осуществления поиска и архивирования важной информации.

Эта модель глубокого обучения основана на модели MMOCR и использует технологию оптического распознавания символов (OCR) для обнаружения текста на изображениях. Эта модель была обучена на большом наборе данных различных типов и стилей текста с разнообразным фоном и контекстами, что позволяет точно извлекать текст. Она может применяться для решения различных задач, таких как автоматическое обнаружение и считывание текста с рекламных щитов, вывесок, отсканированных карт и т.д., тем самым позволяя преобразовывать изображения, содержащие текст, в действенные данные.

Лицензионные требования

Для выполнения этого рабочего процесса необходимы следующие лицензионные требования:

  • ArcGIS DesktopArcGIS Image Analyst дополнительный модуль для ArcGIS Pro
  • ArcGIS EnterpriseArcGIS Image Server с настроенной аналитикой растра
  • ArcGIS OnlineArcGIS Image for ArcGIS Online

Описание модели

Данная модель содержит следующие характеристики:

  • Входные данные — трехканальный снимок на уровне улиц высокого разрешения с текстом среднего или большого размера либо сканированный документ.
  • Выходные данные — векторный слой с рамками, ограничивающими текст, обнаруженный на входном изображении.
  • Вычислить — этот рабочий процесс требует интенсивных вычислений, поэтому рекомендуется использовать видеокарту с минимальной вычислительной мощностью CUDA 6.0.
  • Архитектура — эта модель основана на открытой модели MMOCR от MMLab. Она применяет модель PSENet для определения текста и модель ABINet — для его распознавания.

Доступ и загрузка модели

Загрузите предварительно обученную модель Optical Character Recognition из ArcGIS Living Atlas of the World. В качестве альтернативы, получите доступ к модели непосредственно из ArcGIS Pro или используйте ее в ArcGIS Image for ArcGIS Online.

Загрузка модели с ArcGIS Online

Выполните следующие действия для загрузки модели с ArcGIS Online:

  1. Перейдите к ArcGIS Living Atlas of the World.
  2. Войдите под своими учетными данными ArcGIS Online.
  3. Выполните поиск по запросу Optical Character Recognition и откройте страницу элемента в результатах поиска.
  4. Нажмите кнопку Загрузить, чтобы загрузить модель.
    Использовать загруженный файл .dlpk можно напрямую в ArcGIS Pro, либо использовать его в ArcGIS Enterprise.

Загрузка модели в ArcGIS Pro

Выполните следующие действия для загрузки модели в ArcGIS Pro:

  1. Откройте ArcGIS Pro.
  2. Щелкните панель Каталог и выберите Портал.
  3. Щелкните Living Atlas и найдите Optical Character Recognition.
  4. Щелкните правой кнопкой модель и загрузите файл .dlpk.

Информация по версии

Ниже приведена информация о версии:

ДатаОписание

Июль 2023 г.

Первая версия модели Optical Character Recognition