Utilizar el modelo—Modelos preentrenados de ArcGIS

Puede utilizar este modelo en la herramienta Detectar objetos con aprendizaje profundo disponible en la caja de herramientas de Image Analyst de ArcGIS Pro.

Siga estos pasos para detectar elefantes a partir de las imágenes de drones:

Asegúrese de haber descargado el modelo preentrenado Detección de elefantes y de haber agregado la capa de imágenes en ArcGIS Pro.
Acerque la visualización a un área de interés o utilice todas las imágenes aéreas.
Vaya a Herramientas en la pestaña Análisis.
Haga clic en la pestaña Cajas de herramientas del panel Geoprocesamiento, seleccione Herramientas de Image Analyst y vaya a la herramienta Detectar objetos con aprendizaje profundo en Aprendizaje profundo.
Establezca las variables de la pestaña Parámetros de la siguiente manera:
1. Ráster de entrada: seleccione las imágenes.
2. Objetos de salida detectados: establezca la clase de entidad de salida que contendrá los objetos detectados.
3. Definición de modelo: seleccione el archivo .dlpk del modelo preentrenado o ajustado.
4. Argumentos de modelo: cambie los valores de los argumentos si es necesario.
  - padding: número de píxeles en el borde de las teselas de imágenes desde los cuales se combinarán las predicciones de las teselas adyacentes. Aumente el valor para suavizar la salida y reducir los artefactos de los bordes. El valor máximo del relleno puede ser la mitad del valor del tamaño de tesela.
  - threshold: las detecciones con una puntuación de confianza superior a este umbral se incluyen en el resultado. Los valores permitidos son entre 0 y 1,0.
  - nms_overlap: la ratio de superposición máxima para dos entidades superpuestas, definida como la relación del área de intersección con respecto al área de combinación. El valor predeterminado es 0,1.
  - batch_size: número de teselas de imágenes procesadas en cada paso de la inferencia del modelo. Esto depende de la memoria de la tarjeta gráfica.
  - Exclude_pad_detections:: si se establece en True, filtra detecciones potencialmente truncadas cerca de los bordes que están en la región rellena de chips de imagen.
  - test_time_augmentation: aplica un aumento del tiempo de prueba durante la predicción. Es una técnica utilizada para mejorar la solidez y precisión de las predicciones del modelo. Conlleva aplicar técnicas de aumento de datos durante la inferencia, lo que significa generar varias versiones ligeramente modificadas de los datos de prueba y agregar las predicciones. Si se establece en True, las predicciones de orientaciones rotadas y volteadas de la imagen de entrada se fusionarán en la salida final y sus valores de confidencia se promedian. Esto puede hacer que la confianza caiga por debajo del umbral en el caso de los objetos que solo se detectan en unas cuantas orientaciones de la imagen.
5. Supresión no máxima: opcionalmente, active la casilla de verificación para eliminar las entidades superpuestas con la confianza más baja.
  Si está activada, haga lo siguiente:
  - Establezca Campo de puntuación de confianza.
  - Establezca Campo de valor de clase (opcional).
  - Establezca Máx. ratio de superposición (opcional).
Establezca las variables de la pestaña Entornos seleccionando Tipo de procesador como CPU o GPU.
Se recomienda seleccionar GPU, si está disponible, y establecer Id. de GPU en la GPU que se va a utilizar.
Haga clic en Ejecutar.
La capa de salida se agrega al mapa.

¿Algún comentario sobre este tema?

En este tema