ディープ ラーニングを使用したテキスト変換 (Transform Text Using Deep Learning) (GeoAI)

サマリー

トレーニングされたシーケンス間モデルをフィーチャクラスまたはテーブルのテキスト フィールドで実行し、変更、変換、翻訳されたテキストを含む新しいフィールドを使用して更新します。

テキスト変換の仕組みの詳細

使用法

  • このツールを使用するには、ディープ ラーニング フレームワークがインストールされている必要があります。 AllSource のディープ ラーニング フレームワークを使用するようにコンピューターを設定するには、「ArcGIS 用のディープ ラーニング フレームワークのインストール」をご参照ください。

  • このツールは、トレーニング済みのモデル情報を含んでいるモデル定義ファイルを必要とします。 モデルは、[テキスト分類モデルのトレーニング (Train Text Classification Model)] ツールを使用してトレーニングできます。 [入力モデル定義ファイル] パラメーター値には、Esri モデル定義 JSON ファイル (*.emd) またはディープ ラーニング モデル パッケージ (*.dlpk) を指定することができます。 モデル ファイルはローカルに格納する必要があります。

  • このツールは、CPU または GPU 上で実行できます。 ただし、ディープ ラーニングは計算負荷が高いので、GPU を使用することをお勧めします。 GPU を使用してこのツールを実行するには、プロセッサ タイプ環境を GPU に設定します。 複数の GPU がある場合は、代わりに GPU ID 環境を指定します。

  • このツールの実行要件および発生する可能性のある問題の詳細については、「ディープ ラーニングに関するよくあるご質問 (FAQ)」をご参照ください。

パラメーター

ラベル説明データ タイプ
入力テーブル

変換するテキストを含む、入力ポイント/ライン/ポリゴン フィーチャクラスまたはテーブル。

Feature Layer; Table View
テキスト フィールド

変換するテキストを含む、入力フィーチャクラスまたはテーブルのテキスト フィールド。

Field
入力モデル定義ファイル

分類に使用されるトレーニング済みモデル。 モデル定義ファイルには、Esri モデル定義 JSON ファイル (*.emd) またはローカルで保存されたディープ ラーニング モデル パッケージ (*.dlpk) を指定することができます。

File
結果フィールド
(オプション)

出力フィーチャクラスまたはテーブル内の変換後のテキストが含まれるフィールドの名前。 デフォルトのフィールド名は Result です。

String
モデル引数
(オプション)

モデルの感度を調整するために使用される追加の引数 (信頼性の閾値など)。

引数の名前は、ツールによって入力されます。

Value Table
バッチ サイズ
(オプション)

1 回に処理されるトレーニング サンプルの数。 デフォルト値は 4 です。

バッチ サイズを大きくすると、ツールのパフォーマンスが向上しますが、バッチ サイズが増加するにつれて、使用されるメモリ量が増加します。 メモリ不足エラーが発生した場合は、より小さなバッチ サイズを使用してください。

Double
最小シーケンス長
(オプション)

出力テキスト文字列の最小文字数。 デフォルト値は 20 です。

Double
最大シーケンス長
(オプション)

出力テキスト文字列の最大文字数。 デフォルト値は 50 です。

Double

派生した出力

ラベル説明データ タイプ
更新されたテーブル

入力データから生成された変換済みテキストを含む、出力ポイント/ライン/ポリゴン フィーチャクラスまたはテーブル。

Table View; Feature Layer

arcpy.geoai.TransformTextUsingDeepLearning(in_table, text_field, in_model_definition_file, {result_field}, {model_arguments}, {batch_size}, {minimum_sequence_length}, {maximum_sequence_length})
名前説明データ タイプ
in_table

変換するテキストを含む、入力ポイント/ライン/ポリゴン フィーチャクラスまたはテーブル。

Feature Layer; Table View
text_field

変換するテキストを含む、入力フィーチャクラスまたはテーブルのテキスト フィールド。

Field
in_model_definition_file

分類に使用されるトレーニング済みモデル。 モデル定義ファイルには、Esri モデル定義 JSON ファイル (*.emd) またはローカルで保存されたディープ ラーニング モデル パッケージ (*.dlpk) を指定することができます。

File
result_field
(オプション)

出力フィーチャクラスまたはテーブル内の変換後のテキストが含まれるフィールドの名前。 デフォルトのフィールド名は Result です。

String
model_arguments
[model_arguments,...]
(オプション)

モデルの感度を調整するために使用される追加の引数 (信頼性の閾値など)。

引数の名前は、ツールによって入力されます。

Value Table
batch_size
(オプション)

1 回に処理されるトレーニング サンプルの数。 デフォルト値は 4 です。

バッチ サイズを大きくすると、ツールのパフォーマンスが向上しますが、バッチ サイズが増加するにつれて、使用されるメモリ量が増加します。 メモリ不足エラーが発生した場合は、より小さなバッチ サイズを使用してください。

Double
minimum_sequence_length
(オプション)

出力テキスト文字列の最小文字数。 デフォルト値は 20 です。

Double
maximum_sequence_length
(オプション)

出力テキスト文字列の最大文字数。 デフォルト値は 50 です。

Double

派生した出力

名前説明データ タイプ
updated_table

入力データから生成された変換済みテキストを含む、出力ポイント/ライン/ポリゴン フィーチャクラスまたはテーブル。

Table View; Feature Layer

コードのサンプル

TransformTextUsingDeepLearning (Python ウィンドウ)

次の Python ウィンドウ スクリプトは、TransformTextUsingDeepLearning 関数の使用方法を示しています。

# Name: TransformText.py
# Description: Translate text from English to German
#
# Requirements: ArcGIS Pro Advanced license

# Import system modules
import arcpy
import os

arcpy.env.workspace = "C:/textanalysisexamples/data"

# Set local variables
in_table = os.path.join("translationdata")
pretrained_model_path_emd = "c:\\translatedata\\Seq2Seq.emd"

# Run Transform Text Using Deep Learning
arcpy.geoai.TransformTextUsingDeepLearning(in_table, "EnglishText", pretrained_model_path_emd)