Transformar texto con aprendizaje profundo (GeoAI)

Resumen

Ejecuta un modelo entrenado de secuencia a secuencia en un campo de texto de una tabla o clase de entidad y lo actualiza con un nuevo campo con el texto convertido, transformado o traducido.

Más información sobre cómo funciona la herramienta de transformación de texto

Uso

  • Esta herramienta requiere instalar marcos de aprendizaje profundo. Para configurar su equipo para usar marcos de aprendizaje profundo en ArcGIS AllSource, consulte Instalar marcos de aprendizaje profundo para ArcGIS.

  • Esta herramienta requiere un archivo de definición de modelo que contenga información del modelo entrenado. El modelo se puede entrenar mediante la herramienta Entrenar modelo de clasificación de texto. El valor del parámetro Archivo de definición de modelo de entrada puede ser un archivo JSON de definición de modelos Esri (.emd) o un paquete de modelo de aprendizaje profundo (.dlpk). Los archivos del modelo deben almacenarse localmente.

  • Esta herramienta puede ejecutarse en CPU o GPU. Sin embargo, el aprendizaje profundo consume muchos recursos del sistema, por lo que se recomienda utilizar una GPU. Para ejecutar esta herramienta utilizando la GPU, establezca el entorno Tipo de procesador en GPU. Si tiene más de una GPU, especifique el entorno de Id. de GPU en su lugar.

  • Para obtener información sobre los requisitos para ejecutar esta herramienta y los problemas que pueden presentarse, consulte Preguntas frecuentes sobre el aprendizaje profundo.

Parámetros

EtiquetaExplicaciónTipo de datos
Tabla de entrada

Tabla o clase de entidad de polígono, punto o línea de entrada que contiene el texto que se va a transformar.

Feature Layer; Table View
Campo de texto

Campo de texto de la tabla o clase de entidad de entrada que contiene el texto que se va a transformar.

Field
Archivo de definición de modelo de entrada

Modelo entrenado que se utilizará para la clasificación. El archivo de definición de modelo puede ser un archivo JSON de definición de modelos Esri (.emd) o un paquete de modelos de aprendizaje profundo (.dlpk) almacenado localmente.

File
Campo de resultados
(Opcional)

Nombre del campo que contendrá el texto transformado en la tabla o clase de entidad de salida. El nombre de campo predeterminado es Result.

String
Argumentos de modelo
(Opcional)

Argumentos adicionales, como un umbral de confianza, que se utilizarán para ajustar la sensibilidad del modelo.

La herramienta rellenará los nombres de los argumentos.

Value Table
Tamaño de lote
(Opcional)

Número de muestras de entrenamiento que se procesarán a la vez. El valor predeterminado es 4.

El rendimiento de la herramienta puede mejorarse aumentando el tamaño del lote; sin embargo, conforme aumenta el tamaño del lote se utiliza más memoria. Si se produce un error de memoria insuficiente, utilice un tamaño de lote más pequeño.

Double
Longitud mínima de secuencia
(Opcional)

Número mínimo de caracteres de la cadena de texto de salida. El valor predeterminado es 20.

Double
Longitud máxima de secuencia
(Opcional)

Número máximo de caracteres de la cadena de texto de salida. El valor predeterminado es 50.

Double

Salida derivada

EtiquetaExplicaciónTipo de datos
Tabla actualizada

Tabla o clase de entidad de polígono, punto o línea de salida que contiene el texto transformado derivado de los datos de entrada.

Table View; Feature Layer

arcpy.geoai.TransformTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {result_field}, {model_arguments}, {batch_size}, {minimum_sequence_length}, {maximum_sequence_length})
NombreExplicaciónTipo de datos
in_table

Tabla o clase de entidad de polígono, punto o línea de entrada que contiene el texto que se va a transformar.

Feature Layer; Table View
text_field

Campo de texto de la tabla o clase de entidad de entrada que contiene el texto que se va a transformar.

Field
in_model_definition_file

Modelo entrenado que se utilizará para la clasificación. El archivo de definición de modelo puede ser un archivo JSON de definición de modelos Esri (.emd) o un paquete de modelos de aprendizaje profundo (.dlpk) almacenado localmente.

File
result_field
(Opcional)

Nombre del campo que contendrá el texto transformado en la tabla o clase de entidad de salida. El nombre de campo predeterminado es Result.

String
model_arguments
[model_arguments,...]
(Opcional)

Argumentos adicionales, como un umbral de confianza, que se utilizarán para ajustar la sensibilidad del modelo.

La herramienta rellenará los nombres de los argumentos.

Value Table
batch_size
(Opcional)

Número de muestras de entrenamiento que se procesarán a la vez. El valor predeterminado es 4.

El rendimiento de la herramienta puede mejorarse aumentando el tamaño del lote; sin embargo, conforme aumenta el tamaño del lote se utiliza más memoria. Si se produce un error de memoria insuficiente, utilice un tamaño de lote más pequeño.

Double
minimum_sequence_length
(Opcional)

Número mínimo de caracteres de la cadena de texto de salida. El valor predeterminado es 20.

Double
maximum_sequence_length
(Opcional)

Número máximo de caracteres de la cadena de texto de salida. El valor predeterminado es 50.

Double

Salida derivada

NombreExplicaciónTipo de datos
updated_table

Tabla o clase de entidad de polígono, punto o línea de salida que contiene el texto transformado derivado de los datos de entrada.

Table View; Feature Layer

Muestra de código

TransformTextUsingDeepLearning (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función TransformTextUsingDeepLearning.

# Name: TransformText.py
# Description: Translate text from English to German
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = os.path.join("translationdata")
pretrained_model_path_emd = "c:\\translatedata\\Seq2Seq.emd"

# Run Transform Text Using Deep Learning
arcpy.geoai.TransformTextUsingDeepLearning(in_table, "EnglishText", pretrained_model_path_emd)