Преобразовать текст при помощи глубокого обучения (GeoAI)

Краткая информация

Запускает обученную модель от последовательности к последовательности для текстового поля класса объектов или таблицы и обновляет их новым полем, которое содержит конвертированный, преобразованный или переведенный текст.

Более подробно о том, как работает инструмент Преобразовать текст

Использование

  • Для этого инструмента требуются установленные системы глубокого изучения. Чтобы настроить компьютер на работу в среде глубокого обучения в AllSource, см. раздел Установка сред глубокого обучения для ArcGIS.

  • Для этого инструмента требуется файл определения модели, содержащий обученную информацию о модели. Модель можно обучить при помощи инструмента Обучение модели классификации текста. Значением параметра Входной файл определения модели может быть файл JSON определения модели Esri (.emd) или пакет модели глубокого обучения (.dlpk). Файлы модели должны быть сохранены локально.

  • Этот инструмент можно запускать на центральном или графическом процессоре. Однако глубокое обучение является интенсивным вычислительным процессом, поэтом рекомендуется использовать именно графический процессор. Чтобы запустить этот инструмент с помощью графического процессора, установите для параметра Тип процессора значение GPU. Если у вас более одного графического процессора, вместо этого задайте параметр среды GPU ID.

  • Информацию о требованиях к запуску этого инструмента и проблемах, с которыми вы можете столкнуться, см. в разделе Часто задаваемые вопросы по глубокому обучению.

Параметры

ПодписьОписаниеТип данных
Входная таблица

Входной класс точечных, линейных, полигональных объектов или таблица, содержащие текст, который будет преобразован.

Feature Layer; Table View
Поле текста

Текстовое поле во входном классе объектов или таблице, которое содержит текст для преобразования.

Field
Входной файл определения модели

Обученная модель, которая будет использоваться для классификации. Файлом определения модели может быть файл JSON определения модели Esri (.emd) или пакет модели глубокого обучения (.dlpk), который хранится локально.

File
Поле результата
(Дополнительный)

Имя поля, которое будет содержать преобразованный текст в выходном классе объектов или таблице. По умолчанию поле называется Result.

String
Аргументы модели
(Дополнительный)

Дополнительные аргументы, такие как порог достоверности, которые будут использоваться для настройки чувствительности модели.

Названия аргументов будут заполнены инструментом.

Value Table
Размер пакета
(Дополнительный)

Количество обучающих выборок, которые будут обрабатываться за один раз. Значение, предлагаемое по умолчанию, равно 4.

Увеличение размера пакета может улучшить производительность инструмента, но при этом увеличение размера пакета приводит к расходованию большего объема памяти. Если возникает ошибка нехватки памяти, используйте меньший размер пакета.

Double
Минимальная длина последовательности
(Дополнительный)

Минимальное число символов для выходной текстовой строки. Значение по умолчанию равно 20.

Double
Максимальная длина последовательности
(Дополнительный)

Максимальное число символов для выходной текстовой строки. Значение, предлагаемое по умолчанию, равно 50.

Double

Производные выходные данные

ПодписьОписаниеТип данных
Обновленная таблица

Выходной класс точечных, линейных, полигональных объектов или таблица, содержащие преобразованный текст, полученный из входных данных.

Table View; Feature Layer

arcpy.geoai.TransformTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {result_field}, {model_arguments}, {batch_size}, {minimum_sequence_length}, {maximum_sequence_length})
ИмяОписаниеТип данных
in_table

Входной класс точечных, линейных, полигональных объектов или таблица, содержащие текст, который будет преобразован.

Feature Layer; Table View
text_field

Текстовое поле во входном классе объектов или таблице, которое содержит текст для преобразования.

Field
in_model_definition_file

Обученная модель, которая будет использоваться для классификации. Файлом определения модели может быть файл JSON определения модели Esri (.emd) или пакет модели глубокого обучения (.dlpk), который хранится локально.

File
result_field
(Дополнительный)

Имя поля, которое будет содержать преобразованный текст в выходном классе объектов или таблице. По умолчанию поле называется Result.

String
model_arguments
[model_arguments,...]
(Дополнительный)

Дополнительные аргументы, такие как порог достоверности, которые будут использоваться для настройки чувствительности модели.

Названия аргументов будут заполнены инструментом.

Value Table
batch_size
(Дополнительный)

Количество обучающих выборок, которые будут обрабатываться за один раз. Значение, предлагаемое по умолчанию, равно 4.

Увеличение размера пакета может улучшить производительность инструмента, но при этом увеличение размера пакета приводит к расходованию большего объема памяти. Если возникает ошибка нехватки памяти, используйте меньший размер пакета.

Double
minimum_sequence_length
(Дополнительный)

Минимальное число символов для выходной текстовой строки. Значение по умолчанию равно 20.

Double
maximum_sequence_length
(Дополнительный)

Максимальное число символов для выходной текстовой строки. Значение, предлагаемое по умолчанию, равно 50.

Double

Производные выходные данные

ИмяОписаниеТип данных
updated_table

Выходной класс точечных, линейных, полигональных объектов или таблица, содержащие преобразованный текст, полученный из входных данных.

Table View; Feature Layer

Пример кода

TransformTextUsingDeepLearning (окно Python)

Пример скрипта в окне Python для использования функции TransformTextUsingDeepLearning.

# Name: TransformText.py
# Description: Translate text from English to German
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = os.path.join("translationdata")
pretrained_model_path_emd = "c:\\translatedata\\Seq2Seq.emd"

# Run Transform Text Using Deep Learning
arcpy.geoai.TransformTextUsingDeepLearning(in_table, "EnglishText", pretrained_model_path_emd)

Параметры среды