
Текстовые надписи являются неотъемлемой частью кадастровых карт и поэтажных планов. Текст также распространен в естественных сценах вокруг нас в виде дорожных знаков, рекламных щитов, номеров домов и названий мест. Извлечение этого текста может предоставить дополнительный контекст и подробные сведения о местах, которые описывает текст, и информации, которую он передает. Оцифровка документов и извлечение из них текста помогает для осуществления поиска и архивирования важной информации.
Эта модель глубокого обучения основана на модели MMOCR и использует технологию оптического распознавания символов (OCR) для обнаружения текста на изображениях. Эта модель была обучена на большом наборе данных различных типов и стилей текста с разнообразным фоном и контекстами, что позволяет точно извлекать текст. Она может применяться для решения различных задач, таких как автоматическое обнаружение и считывание текста с рекламных щитов, вывесок, отсканированных карт и т.д., тем самым позволяя преобразовывать изображения, содержащие текст, в действенные данные.
Лицензионные требования
Для выполнения этого рабочего процесса необходимы следующие лицензионные требования:
- ArcGIS Desktop—ArcGIS Image Analyst дополнительный модуль для ArcGIS Pro
- ArcGIS Enterprise—ArcGIS Image Server с настроенной аналитикой растра
- ArcGIS Online – ArcGIS Image for ArcGIS Online
Описание модели
Данная модель содержит следующие характеристики:
- Входные данные — трехканальный снимок на уровне улиц высокого разрешения с текстом среднего или большого размера либо сканированный документ.
- Выходные данные — векторный слой с рамками, ограничивающими текст, обнаруженный на входном изображении.
- Вычислить — этот рабочий процесс требует интенсивных вычислений, поэтому рекомендуется использовать видеокарту с минимальной вычислительной мощностью CUDA 6.0.
- Архитектура — эта модель основана на открытой модели MMOCR от MMLab. Она применяет модель PSENet для определения текста и модель ABINet — для его распознавания.
Доступ и загрузка модели
Загрузите предварительно обученную модель Optical Character Recognition из ArcGIS Living Atlas of the World. В качестве альтернативы, получите доступ к модели непосредственно из ArcGIS Pro или используйте ее в ArcGIS Image for ArcGIS Online.
Загрузка модели с ArcGIS Online
Выполните следующие действия для загрузки модели с ArcGIS Online:
- Перейдите к ArcGIS Living Atlas of the World.
- Войдите под своими учетными данными ArcGIS Online.
- Выполните поиск по запросу Optical Character Recognition и откройте страницу элемента в результатах поиска.
- Нажмите кнопку Загрузить, чтобы загрузить модель.Использовать загруженный файл .dlpk можно напрямую в ArcGIS Pro, либо использовать его в ArcGIS Enterprise.
Загрузка модели в ArcGIS Pro
Выполните следующие действия для загрузки модели в ArcGIS Pro:
- Откройте ArcGIS Pro.
- Щелкните панель Каталог и выберите Портал.
- Щелкните Living Atlas и найдите Optical Character Recognition.
- Щелкните правой кнопкой модель и загрузите файл .dlpk.
Информация по версии
Ниже приведена информация о версии:
| Дата | Описание |
|---|---|
| Июль 2023 г. | Первая версия модели Optical Character Recognition |