ディープラーニングを使用したテキスト変換 (Transform Text Using Deep Learning) (GeoAI)—ArcGIS AllSource

サマリー

トレーニング済みのシーケンス間モデルを、フィーチャクラスまたはテーブル内のテキストフィールドで実行し、変更、変換、翻訳されたテキストを含む新しいフィールドを使用して更新します。

使用法

このツールを使用するには、ディープラーニングフレームワークがインストールされている必要があります。 ArcGIS AllSource のディープラーニングフレームワークを使用するようにコンピューターを設定するには、「ArcGIS 用のディープラーニングフレームワークのインストール」をご参照ください。
このツールは、トレーニング済みのモデル情報を含んでいるモデル定義ファイルを必要とします。モデルは [テキスト分類モデルのトレーニング (Train Text Classification Model)] ツールを使用してトレーニングできます。 [入力モデル定義] パラメーター値には、Esri モデル定義の JSON ファイル (.emd) またはディープラーニングモデルパッケージ (.dlpk) を指定することができます。モデルファイルはローカルに格納する必要があります。
このツールは CPU または GPU で実行できます。ただし、ディープラーニングは計算上の負荷が大きいため GPU が推奨されます。 GPU を使用してこのツールを実行するには、プロセッサタイプ環境を GPU に設定します。複数の GPU が存在する場合は、代わりに GPU ID 環境を指定します。
このツールの実行要件および発生する可能性のある問題の詳細については、「ディープラーニングに関するよくある質問」をご参照ください。

パラメーター

ラベル	説明	データタイプ
入力テーブル	変換されるテキストを含む、入力ポイント、ライン、ポリゴンフィーチャクラス、またはテーブル。	Feature Layer; Table View
テキストフィールド	変換テキストを含む、入力フィーチャクラスまたはテーブル内のテキストフィールド。	Field
入力モデル定義ファイル	分類に使用されるトレーニング済みモデル。モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd) またはディープラーニングモデルパッケージ (.dlpk) を指定できます。	File
結果フィールド (オプション)	変換されたテキストを含む、出力フィーチャクラスまたはテーブルのフィールドの名前。デフォルトのフィールド名は Result です。	String
モデル引数 (オプション)	モデルの感度を調整するために使用される追加の引数 (信頼性の閾値など)。引数の名前は、ツールによって入力されます。	Value Table
バッチサイズ (オプション)	1 回に処理されるトレーニングサンプルの数。デフォルト値は 4 です。バッチサイズを増やすと、ツールのパフォーマンスが向上します。ただし、バッチサイズの増加に伴って、使用されるメモリ量も多くなります。メモリ不足エラーが発生した場合は、より小さいバッチサイズを使用します。	Double
最小シーケンス長 (オプション)	出力されるテキスト文字列の最小文字数。デフォルト値は 20 です。	Double
最大シーケンス長 (オプション)	出力されるテキスト文字列の最大文字数。デフォルト値は 50 です。	Double

派生した出力

ラベル	説明	データタイプ
更新されるテーブル	入力データから派生した変換されるテキストを含む、出力ポイント、ライン、ポリゴンフィーチャクラス、またはテーブル。	Table View; Feature Layer

arcpy.geoai.TransformTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {result_field}, {model_arguments}, {batch_size}, {minimum_sequence_length}, {maximum_sequence_length})

名前	説明	データタイプ
in_table	変換されるテキストを含む、入力ポイント、ライン、ポリゴンフィーチャクラス、またはテーブル。	Feature Layer; Table View
text_field	変換テキストを含む、入力フィーチャクラスまたはテーブル内のテキストフィールド。	Field
in_model_definition_file	分類に使用されるトレーニング済みモデル。モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd) またはローカルに保存されたディープラーニングモデルパッケージ (.dlpk) を指定できます。	File
result_field (オプション)	変換されたテキストを含む、出力フィーチャクラスまたはテーブルのフィールドの名前。デフォルトのフィールド名は Result です。	String
model_arguments [model_arguments,...] (オプション)	モデルの感度を調整するために使用される追加の引数 (信頼性の閾値など)。引数の名前は、ツールによって入力されます。	Value Table
batch_size (オプション)	1 回に処理されるトレーニングサンプルの数。デフォルト値は 4 です。バッチサイズを増やすと、ツールのパフォーマンスが向上します。ただし、バッチサイズの増加に伴って、使用されるメモリ量も多くなります。メモリ不足エラーが発生した場合は、より小さいバッチサイズを使用します。	Double
minimum_sequence_length (オプション)	出力されるテキスト文字列の最小文字数。デフォルト値は 20 です。	Double
maximum_sequence_length (オプション)	出力されるテキスト文字列の最大文字数。デフォルト値は 50 です。	Double

派生した出力

名前	説明	データタイプ
updated_table	入力データから派生した変換されるテキストを含む、出力ポイント、ライン、ポリゴンフィーチャクラス、またはテーブル。	Table View; Feature Layer

コードのサンプル

TransformTextUsingDeepLearning (Python ウィンドウ)

次の Python ウィンドウスクリプトは、TransformTextUsingDeepLearning 関数の使用方法を示しています。

# Name: TransformText.py
# Description: Translate text from English to German
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = os.path.join("translationdata")
pretrained_model_path_emd = "c:\\translatedata\\Seq2Seq.emd"

# Run Transform Text Using Deep Learning
arcpy.geoai.TransformTextUsingDeepLearning(in_table, "EnglishText", pretrained_model_path_emd)

環境

プロセッサタイプ, GPU ID

このトピックへのフィードバック

サマリー

使用法

パラメーター

派生した出力

派生した出力

コードのサンプル

環境

このトピックの内容