ディープ ラーニングを使用したテキスト変換 (Transform Text Using Deep Learning) (GeoAI)

サマリー

トレーニング済みのシーケンス間モデルを、フィーチャクラスまたはテーブル内のテキスト フィールドで実行し、変更、変換、翻訳されたテキストを含む新しいフィールドを使用して更新します。

テキスト変換の仕組みの詳細

使用法

  • このツールを使用するには、ディープ ラーニング フレームワークがインストールされている必要があります。 ArcGIS AllSource のディープ ラーニング フレームワークを使用するようにコンピューターを設定するには、「ArcGIS 用のディープ ラーニング フレームワークのインストール」をご参照ください。

  • このツールは、トレーニング済みのモデル情報を含んでいるモデル定義ファイルを必要とします。 モデルは [テキスト分類モデルのトレーニング (Train Text Classification Model)] ツールを使用してトレーニングできます。 [入力モデル定義] パラメーター値には、Esri モデル定義の JSON ファイル (.emd) またはディープ ラーニング モデル パッケージ (.dlpk) を指定することができます。 モデル ファイルはローカルに格納する必要があります。

  • このツールは CPU または GPU で実行できます。 ただし、ディープ ラーニングは計算上の負荷が大きいため GPU が推奨されます。 GPU を使用してこのツールを実行するには、プロセッサ タイプ環境を GPU に設定します。 複数の GPU が存在する場合は、代わりに GPU ID 環境を指定します。

  • このツールの実行要件および発生する可能性のある問題の詳細については、「ディープ ラーニングに関するよくある質問」をご参照ください。

パラメーター

ラベル説明データ タイプ
入力テーブル

変換されるテキストを含む、入力ポイント、ライン、ポリゴン フィーチャクラス、またはテーブル。

Feature Layer; Table View
テキスト フィールド

変換テキストを含む、入力フィーチャクラスまたはテーブル内のテキスト フィールド。

Field
入力モデル定義ファイル

分類に使用されるトレーニング済みモデル。 モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd) またはディープ ラーニング モデル パッケージ (.dlpk) を指定できます。

File
結果フィールド
(オプション)

変換されたテキストを含む、出力フィーチャクラスまたはテーブルのフィールドの名前。 デフォルトのフィールド名は Result です。

String
モデル引数
(オプション)

モデルの感度を調整するために使用される追加の引数 (信頼性の閾値など)。

引数の名前は、ツールによって入力されます。

Value Table
バッチ サイズ
(オプション)

1 回に処理されるトレーニング サンプルの数。 デフォルト値は 4 です。

バッチ サイズを増やすと、ツールのパフォーマンスが向上します。ただし、バッチ サイズの増加に伴って、使用されるメモリ量も多くなります。 メモリ不足エラーが発生した場合は、より小さいバッチ サイズを使用します。

Double
最小シーケンス長
(オプション)

出力されるテキスト文字列の最小文字数。 デフォルト値は 20 です。

Double
最大シーケンス長
(オプション)

出力されるテキスト文字列の最大文字数。 デフォルト値は 50 です。

Double

派生した出力

ラベル説明データ タイプ
更新されるテーブル

入力データから派生した変換されるテキストを含む、出力ポイント、ライン、ポリゴン フィーチャクラス、またはテーブル。

Table View; Feature Layer

arcpy.geoai.TransformTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {result_field}, {model_arguments}, {batch_size}, {minimum_sequence_length}, {maximum_sequence_length})
名前説明データ タイプ
in_table

変換されるテキストを含む、入力ポイント、ライン、ポリゴン フィーチャクラス、またはテーブル。

Feature Layer; Table View
text_field

変換テキストを含む、入力フィーチャクラスまたはテーブル内のテキスト フィールド。

Field
in_model_definition_file

分類に使用されるトレーニング済みモデル。 モデル定義ファイルには、Esri モデル定義 JSON ファイル (.emd) またはローカルに保存されたディープ ラーニング モデル パッケージ (.dlpk) を指定できます。

File
result_field
(オプション)

変換されたテキストを含む、出力フィーチャクラスまたはテーブルのフィールドの名前。 デフォルトのフィールド名は Result です。

String
model_arguments
[model_arguments,...]
(オプション)

モデルの感度を調整するために使用される追加の引数 (信頼性の閾値など)。

引数の名前は、ツールによって入力されます。

Value Table
batch_size
(オプション)

1 回に処理されるトレーニング サンプルの数。 デフォルト値は 4 です。

バッチ サイズを増やすと、ツールのパフォーマンスが向上します。ただし、バッチ サイズの増加に伴って、使用されるメモリ量も多くなります。 メモリ不足エラーが発生した場合は、より小さいバッチ サイズを使用します。

Double
minimum_sequence_length
(オプション)

出力されるテキスト文字列の最小文字数。 デフォルト値は 20 です。

Double
maximum_sequence_length
(オプション)

出力されるテキスト文字列の最大文字数。 デフォルト値は 50 です。

Double

派生した出力

名前説明データ タイプ
updated_table

入力データから派生した変換されるテキストを含む、出力ポイント、ライン、ポリゴン フィーチャクラス、またはテーブル。

Table View; Feature Layer

コードのサンプル

TransformTextUsingDeepLearning (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、TransformTextUsingDeepLearning 関数の使用方法を示しています。

# Name: TransformText.py
# Description: Translate text from English to German
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = os.path.join("translationdata")
pretrained_model_path_emd = "c:\\translatedata\\Seq2Seq.emd"

# Run Transform Text Using Deep Learning
arcpy.geoai.TransformTextUsingDeepLearning(in_table, "EnglishText", pretrained_model_path_emd)