Transformer du texte à l’aide du Deep Learning (GeoAI)

Synthèse

Exécute un modèle séquence-à-séquence entraîné sur un champ de texte dans une table ou une classe d’entités et le met à jour avec un nouveau champ contenant le texte converti, transformé ou traduit.

En savoir plus sur le fonctionnement de l’outil Transformation de texte

Utilisation

  • Cet outil requiert l’installation des frameworks de Deep Learning. Pour configurer votre machine afin d’utiliser des frameworks de Deep Learning dans AllSource, consultez la rubrique Installer les frameworks de Deep Learning pour ArcGIS.

  • Cet outil nécessite un fichier de définition de modèle contenant des informations de modèle entraîné. Le modèle peut être entraîné avec l’outil Entraîner le modèle de classification de texte. Le paramètre Fichier de définition du modèle en entrée peut être un fichier JSON de définition de modèle Esri (.emd) ou un paquetage de modèle de Deep Learning (.dlpk). Les fichiers de modèle doivent être stockés localement.

  • Cet outil peut s’exécuter sur une unité centrale (UC) ou une unité de traitement graphique (GPU). Toutefois, le Deep Learning sollicite d’importantes ressources de calcul et un GPU est recommandé. Pour exécuter cet outil avec l’unité de traitement graphique, définissez le paramètre d’environnement Type de processeur sur GPU. Si vous avez plusieurs unités de traitement graphique, spécifiez plutôt le paramètre d’environnement ID de GPU

  • Pour en savoir plus sur les exigences relatives à l’exécution de cet outil ainsi que sur les problèmes que vous pouvez rencontrer, consultez la FAQ sur le Deep Learning.

Paramètres

ÉtiquetteExplicationType de données
Table en entrée

Table ou classe d’entités ponctuelles, linéaires ou surfaciques en entrée qui contient le texte à transformer.

Feature Layer; Table View
Champ de texte

Champ de texte dans la table ou la classe d’entités en entrée qui contient le texte à transformer.

Field
Fichier de définition du modèle en entrée

Modèle entraîné qui sera utilisé pour la classification. Le fichier de définition du modèle peut être un fichier JSON de définition de modèle Esri (.emd) ou un paquetage de modèle de Deep Learning (.dlpk) stocké localement.

File
Champ de résultat
(Facultatif)

Nom du champ qui contiendra le texte transformé dans la table ou la classe d’entités en sortie. Le nom de champ par défaut est Result.

String
Arguments du modèle
(Facultatif)

Arguments supplémentaires, tels qu’un seuil de confiance, qui seront utilisés pour ajuster la sensibilité du modèle.

Les noms des arguments sont renseignés par l’outil.

Value Table
Taille de lot
(Facultatif)

Nombre d’échantillons d’entraînement qui seront traités en une fois. La valeur par défaut est 4.

Il est possible d’augmenter la taille de lot pour améliorer les performances de l’outil. Il convient toutefois de noter que le volume de mémoire utilisé est proportionnel à la taille de lot. Si un message d’erreur s’affiche pour mémoire insuffisante, utilisez une taille de lot plus petite.

Double
Longueur de séquence minimale
(Facultatif)

Nombre minimal de caractères de la chaîne de texte en sortie. La valeur par défaut est 20.

Double
Longueur de séquence maximale
(Facultatif)

Nombre maximal de caractères de la chaîne de texte en sortie. La valeur par défaut est 50.

Double

Sortie obtenue

ÉtiquetteExplicationType de données
Table mise à jour

Table ou classe d’entités ponctuelles, linéaires ou surfaciques en sortie qui contient le texte transformé obtenu à partir des données en entrée.

Table View; Feature Layer

arcpy.geoai.TransformTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {result_field}, {model_arguments}, {batch_size}, {minimum_sequence_length}, {maximum_sequence_length})
NomExplicationType de données
in_table

Table ou classe d’entités ponctuelles, linéaires ou surfaciques en entrée qui contient le texte à transformer.

Feature Layer; Table View
text_field

Champ de texte dans la table ou la classe d’entités en entrée qui contient le texte à transformer.

Field
in_model_definition_file

Modèle entraîné qui sera utilisé pour la classification. Le fichier de définition du modèle peut être un fichier JSON de définition de modèle Esri (.emd) ou un paquetage de modèle de Deep Learning (.dlpk) stocké localement.

File
result_field
(Facultatif)

Nom du champ qui contiendra le texte transformé dans la table ou la classe d’entités en sortie. Le nom de champ par défaut est Result.

String
model_arguments
[model_arguments,...]
(Facultatif)

Arguments supplémentaires, tels qu’un seuil de confiance, qui seront utilisés pour ajuster la sensibilité du modèle.

Les noms des arguments sont renseignés par l’outil.

Value Table
batch_size
(Facultatif)

Nombre d’échantillons d’entraînement qui seront traités en une fois. La valeur par défaut est 4.

Il est possible d’augmenter la taille de lot pour améliorer les performances de l’outil. Il convient toutefois de noter que le volume de mémoire utilisé est proportionnel à la taille de lot. Si un message d’erreur s’affiche pour mémoire insuffisante, utilisez une taille de lot plus petite.

Double
minimum_sequence_length
(Facultatif)

Nombre minimal de caractères de la chaîne de texte en sortie. La valeur par défaut est 20.

Double
maximum_sequence_length
(Facultatif)

Nombre maximal de caractères de la chaîne de texte en sortie. La valeur par défaut est 50.

Double

Sortie obtenue

NomExplicationType de données
updated_table

Table ou classe d’entités ponctuelles, linéaires ou surfaciques en sortie qui contient le texte transformé obtenu à partir des données en entrée.

Table View; Feature Layer

Exemple de code

TransformTextUsingDeepLearning (fenêtre Python)

Le script suivant pour la fenêtre Python illustre l’utilisation de la fonction TransformTextUsingDeepLearning.

# Name: TransformText.py
# Description: Translate text from English to German
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = os.path.join("translationdata")
pretrained_model_path_emd = "c:\\translatedata\\Seq2Seq.emd"

# Run Transform Text Using Deep Learning
arcpy.geoai.TransformTextUsingDeepLearning(in_table, "EnglishText", pretrained_model_path_emd)