Преобразование текста при помощи глубокого обучения (GeoAI)

Краткая информация

Запускает обученную модель последовательность-в-последовательность на текстовом поле в классе пространственных объектов или таблице и обновляет его с добавлением нового поля, содержащего конвертированный, преобразованный или переведенный текст.

Подробнее об инструменте Преобразование текста

Использование

  • Для этого инструмента требуются установленные системы глубокого изучения. Чтобы настроить компьютер на работу в среде глубокого обучения в ArcGIS AllSource, см. раздел Установка сред глубокого обучения для ArcGIS.

  • Для этого инструмента требуется файл определения модели, содержащий обученную информацию о модели. Модель может быть обучена с помощью инструмента Обучить модель классификации текста. Значением параметра Входной файл определения модели может быть JSON-файл определения модели Esri (.emd) или пакет модели глубокого обучения (.dlpk). Файл модели должен быть сохранен локально.

  • Этот инструмент можно запустить на CPU или GPU. Однако глубокое обучение требует больших вычислительных затрат, и рекомендуется использовать графический процессор (GPU). Чтобы запустить этот инструмент с использованием графического процессора, установите для параметра среды Тип процессора значение GPU. Если у вас более одного графического процессора, вместо этого задайте для параметра среды значение GPU ID.

  • Информацию о требованиях к запуску этого инструмента и проблемах, с которыми вы можете столкнуться, см. в разделе Часто задаваемые вопросы по глубокому обучению.

Параметры

ПодписьОписаниеТип данных
Входная таблица

Входной класс точечных, линейных или полигональных объектов, или таблица, содержащая текст, подлежащий преобразованию.

Feature Layer; Table View
Текстовое поле

Текстовое поле в классе входных объектов или таблицы, содержащее текст, подлежащий преобразованию.

Field
Входной файл определения модели

Обученная модель, которая будет использоваться для классификации. Файлом определения модели может быть файл JSON определения модели Esri (.emd) или пакет модели глубокого обучения (.dlpk), хранящийся локально.

File
Итоговое поле
(Дополнительный)

Имя поля, которое будет содержать преобразованный текст в выходном классе объектов или таблице. По умолчанию поле имеет имя Result

String
Аргументы модели
(Дополнительный)

Дополнительные аргументы, такие как порог достоверности, которые будут использоваться для настройки чувствительности модели.

Названия аргументов будут заполнены инструментом.

Value Table
Размер пакета
(Дополнительный)

Число обучающих примеров, которые обрабатываются одновременно. Значение по умолчанию равно 4.

Увеличение размера пакета может повысить производительность инструмента, но по мере его увеличения используется все больше памяти. При появлении ошибки переполнения памяти задайте меньший размер пакета.

Double
Минимальная длина последовательности
(Дополнительный)

Минимальное количество символов для выходной текстовой строки. Значение по умолчанию равно 20.

Double
Максимальная длина последовательности
(Дополнительный)

Максимальное количество символов для выходной текстовой строки. Значение, предлагаемое по умолчанию, равно 50.

Double

Производные выходные данные

ПодписьОписаниеТип данных
Обновленная таблица

Выходной класс точечных, линейных или полигональных объектов или таблица, содержащие преобразованный текст, полученный из входных данных.

Table View; Feature Layer

arcpy.geoai.TransformTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {result_field}, {model_arguments}, {batch_size}, {minimum_sequence_length}, {maximum_sequence_length})
ИмяОписаниеТип данных
in_table

Входной класс точечных, линейных или полигональных объектов, или таблица, содержащая текст, подлежащий преобразованию.

Feature Layer; Table View
text_field

Текстовое поле в классе входных объектов или таблицы, содержащее текст, подлежащий преобразованию.

Field
in_model_definition_file

Обученная модель, которая будет использоваться для классификации. Файлом определения модели может быть файл JSON определения модели Esri (.emd) или пакет модели глубокого обучения (.dlpk), хранящийся локально.

File
result_field
(Дополнительный)

Имя поля, которое будет содержать преобразованный текст в выходном классе объектов или таблице. По умолчанию поле имеет имя Result

String
model_arguments
[model_arguments,...]
(Дополнительный)

Дополнительные аргументы, такие как порог достоверности, которые будут использоваться для настройки чувствительности модели.

Названия аргументов будут заполнены инструментом.

Value Table
batch_size
(Дополнительный)

Число обучающих примеров, которые обрабатываются одновременно. Значение по умолчанию равно 4.

Увеличение размера пакета может повысить производительность инструмента, но по мере его увеличения используется все больше памяти. При появлении ошибки переполнения памяти задайте меньший размер пакета.

Double
minimum_sequence_length
(Дополнительный)

Минимальное количество символов для выходной текстовой строки. Значение по умолчанию равно 20.

Double
maximum_sequence_length
(Дополнительный)

Максимальное количество символов для выходной текстовой строки. Значение, предлагаемое по умолчанию, равно 50.

Double

Производные выходные данные

ИмяОписаниеТип данных
updated_table

Выходной класс точечных, линейных или полигональных объектов или таблица, содержащие преобразованный текст, полученный из входных данных.

Table View; Feature Layer

Пример кода

TransformTextUsingDeepLearning (окно Python)

Следующий скрипт окна Python демонстрирует использование функции TransformTextUsingDeepLearning.

# Name: TransformText.py
# Description: Translate text from English to German
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = os.path.join("translationdata")
pretrained_model_path_emd = "c:\\translatedata\\Seq2Seq.emd"

# Run Transform Text Using Deep Learning
arcpy.geoai.TransformTextUsingDeepLearning(in_table, "EnglishText", pretrained_model_path_emd)

Параметры среды