
Las etiquetas de texto forman parte de los mapas catastrales y los planos. En las escenas naturales de nuestro alrededor también es habitual encontrar texto en forma de señales de tráfico, carteles, números de casas y nombres de lugares. La extracción de este texto puede proporcionar contexto adicional y detalles sobre los lugares que describe el texto y la información que proporciona. La digitalización de los documentos y la extracción de texto de estos ayuda a recuperar y archivar la información importante.
Este modelo de aprendizaje profundo se basa en el modelo MMOCR y utiliza la tecnología de reconocimiento óptico de caracteres (OCR) para detectar texto en imágenes. Este modelo se entrenó con un dataset grande de distintos tipos y estilos de texto con diversos fondos y contextos, lo que permite una extracción precisa de texto. Se puede aplicar a varias tareas como la detección y la lectura automáticas de textos de carteles, paneles publicitarios, mapas escaneados, etc., de modo que las imágenes que contienen texto se convierten en datos ejecutables.
Requisitos de licencia
Para completar este flujo de trabajo, los requisitos de licencia son los siguientes:
- ArcGIS Desktop: extensión ArcGIS Image Analyst para ArcGIS Pro
- ArcGIS Enterprise: ArcGIS Image Server con análisis de ráster configurados
- ArcGIS Online: ArcGIS Image for ArcGIS Online
Detalles del modelo
Este modelo tiene las siguientes características:
- Entrada: imágenes a nivel de calle de alta resolución y de 3 bandas con texto de tamaño medio a grande en ellas o un documento escaneado.
- Salida: capa de entidades con cuadros que delimitan el texto de la imagen de entrada.
- Calcular: este flujo de trabajo requiere potencia de cálculo y se recomienda una GPU con una capacidad de cálculo CUDA mínima de 6.0.
- Arquitectura: este modelo se basa en el modelo MMOCR de código abierto de MMLab. Emplea el modelo PSENet para la detección de texto y el modelo ABINet para el reconocimiento de texto.
Acceder al modelo y descargarlo
Descargue el modelo preentrenado Reconocimiento óptico de caracteres desde ArcGIS Living Atlas of the World. También puede acceder al modelo directamente desde ArcGIS Pro o usarlo en ArcGIS Image for ArcGIS Online.
Descargar el modelo con ArcGIS Online
Siga estos pasos para descargar el modelo con ArcGIS Online:
- Vaya a ArcGIS Living Atlas of the World.
- Inicie sesión con sus credenciales de ArcGIS Online.
- Busque Reconocimiento óptico de caracteres y abra la página de elemento desde los resultados de búsqueda.
- Haga clic en el botón Descargar para descargar el modelo.Puede usar el archivo .dlpk descargado directamente en ArcGIS Pro o cargarlo y utilizarlo en ArcGIS Enterprise.
Descargar el modelo en ArcGIS Pro
Siga estos pasos para descargar el modelo en ArcGIS Pro:
- Abra ArcGIS Pro.
- Haga clic en el panel Catálogo y seleccione Portal.
- Haga clic en Living Atlas y busque Reconocimiento óptico de caracteres.
- Haga clic con el botón derecho en el modelo y descargue el archivo .dlpk.
Notas sobre la versión
Las notas de la versión son las siguientes:
Fecha | Descripción |
---|---|
Julio de 2023 | Primera versión de Reconocimiento óptico de caracteres |