AutoDL を使用したトレーニング (Train Using AutoDL) (GeoAI)—ArcGIS AllSource

Image Analyst ライセンスで利用できます。

サマリー

トレーニングパイプラインを構築し、トレーニングプロセスの多くを自動化することで、ディープラーニングモデルをトレーニングします。これには、データ拡大、モデルの選択、ハイパーパラメーターの調整、およびバッチサイズ推論が含まれます。出力には、トレーニングデータのベストモデルのパフォーマンスメトリクスや、新しい画像を予測するための AI モデルを使用したフィーチャの抽出ツールの入力として使用できるトレーニングしたディープラーニングモデルパッケージ (.dlpk ファイル) が含まれます。

AutoDL の仕組みの詳細

使用法

ArcGIS AllSource に Python の適切なディープラーニングフレームワークパッケージをインストールする必要があります。
ArcGIS 用のディープラーニングフレームワークのインストール方法の詳細
非接続環境でモデルをトレーニングする場合は、詳細について「非接続環境での追加インストール」をご参照ください。
ツールがトレーニング済のモデルを作成するためにかかる時間は、以下に応じて異なります。
- トレーニング中に入力されるデータの量
- [AutoDL モード] パラメーター値
- [合計制限時間 (時間)] パラメーター値
デフォルトで、すべてのモードのタイマーは 2 時間に設定されています。 [基本] モードは、指定された時間内にデフォルトのバックボーンで、選択されたネットワークをトレーニングします。 [高度設定] モードでは合計時間が 2 分割され、前半でモデル評価を実行して、後半に他のバックボーンを評価するための上位 2 つの実行モデルを決定します。トレーニングされるデータの量が多いと、選択したすべてのモデルを 2 時間以内に評価できない場合があります。そのような場合、2 時間以内に特定された最高パフォーマンスのモデルが、最適なモデルと見なされます。続いて、このモデルを使用するか、[合計制限時間 (時間)] パラメーターの値を大きくしてツールを再実行できます。
このツールは、既存のトレーニング済みモデルの微調整にも使用できます。たとえば、車に関してトレーニングされた既存のモデルを微調整して、トラックを識別するモデルをトレーニングすることができます。
このツールを実行するには、GPU を装備したコンピューターが必要です。複数の GPU がある場合は、GPU ID 環境を使用します。
このツールの入力トレーニングデータには、[ディープラーニング用のトレーニングデータをエクスポート (Export Training Data For Deep Learning)] ツールから生成された画像フォルダーとラベルフォルダーを含める必要があります。
このツールの考えられる使用例には、建物フットプリント、プール、ソーラーパネル、土地被覆分類などのフィーチャを抽出するためのオブジェクト検出モデルおよびピクセル分類モデルのトレーニングがあります。
このツールの実行要件および発生する可能性のある問題の詳細については、「ディープラーニングに関するよくある質問」をご参照ください。

パラメーター

ラベル	説明	データタイプ
入力トレーニングデータ	モデルのトレーニングに必要な画像チップ、ラベル、統計情報を含むフォルダー。 [ディープラーニング用のトレーニングデータをエクスポート (Export Training Data For Deep Learning)] ツールからの出力です。エクスポートされるデータのメタデータ形式は、Classified_Tiles、PASCAL_VOC_rectangles、または KITTI_rectangles のいずれかである必要があります。	Folder
出力モデル	ディープラーニングパッケージとして保存される出力トレーニング済みモデル (.dlpk ファイル)。	File
事前トレーニング済みモデル (オプション)	新しいモデルの微調整に使用される事前トレーニング済みモデル。入力は、Esri モデル定義ファイル (.emd) またはディープラーニングパッケージファイル (.dlpk) です。類似したクラスを持つ事前トレーニング済みモデルは、新しいモデルに合わせて微調整することができます。事前トレーニング済みモデルは、新しいモデルのトレーニングに使用される同じモデルタイプおよびバックボーンモデルでトレーニングされている必要があります。	File
合計制限時間 (時間) (オプション)	AutoDL モデルトレーニングに使用する合計時間の制限を時間で示した値。デフォルトは 2 時間です。	Double
AutoDL モード (オプション)	使用される AutoDL モードおよび AutoDL の検索がどの程度徹底的に行われるかを指定します。基本—基本モードが使用されます。このモードは、ハイパーパラメーターの調整なしで選択したすべてのネットワークをトレーニングするために使用されます。高度な設定—高度な設定モードが使用されます。このモードは、上位 2 つの最善モデルでハイパーパラメーターの調整を実行するために使用されます。	String
ニューラルネットワーク (オプション)	モデルのトレーニングに使用するアーキテクチャを指定します。デフォルトでは、すべてのネットワークが使用されます。 SingleShotDetector—SingleShotDetector アーキテクチャがモデルのトレーニングに使用されます。 SingleShotDetector の使用目的はオブジェクト検出です。 RetinaNet—RetinaNet アーキテクチャがモデルのトレーニングに使用されます。 RetinaNet の使用目的はオブジェクト検出です。 FasterRCNN—FasterRCNN アーキテクチャがモデルのトレーニングに使用されます。 FasterRCNN の使用目的はオブジェクト検出です。 YOLOv3—YOLOv3 アーキテクチャがモデルのトレーニングに使用されます。 YOLOv3 の使用目的はオブジェクト検出です。 HRNet—HRNet アーキテクチャがモデルのトレーニングに使用されます。 HRNet の使用目的はピクセル分類です。 ATSS—ATSS アーキテクチャがモデルのトレーニングに使用されます。 ATSS の使用目的はオブジェクト検出です。 CARAFE—CARAFE アーキテクチャがモデルのトレーニングに使用されます。 CARAFE の使用目的はオブジェクト検出です。 CascadeRCNN—CascadeRCNN アーキテクチャがモデルのトレーニングに使用されます。 CascadeRCNN の使用目的はオブジェクト検出です。 CascadeRPN—CascadeRPN アーキテクチャがモデルのトレーニングに使用されます。 CascadeRPN の使用目的はオブジェクト検出です。 DCN—DCN アーキテクチャがモデルのトレーニングに使用されます。 DCN の使用目的はオブジェクト検出です。 DeepLab—DeepLab アーキテクチャがモデルのトレーニングに使用されます。 DeepLab の使用目的はピクセル分類です。 UnetClassifier—UnetClassifier アーキテクチャがモデルのトレーニングに使用されます。 UnetClassifier の使用目的はピクセル分類です。 DeepLabV3Plus—DeepLabV3Plus アーキテクチャがモデルのトレーニングに使用されます。 DeepLabV3Plus の使用目的はピクセル分類です。 PSPNetClassifier—PSPNetClassifier アーキテクチャがモデルのトレーニングに使用されます。 PSPNetClassifier の使用目的はピクセル分類です。 ANN—ANN アーキテクチャがモデルのトレーニングに使用されます。 ANN の使用目的はピクセル分類です。 APCNet—APCNet アーキテクチャがモデルのトレーニングに使用されます。 APCNet の使用目的はピクセル分類です。 CCNet—CCNet アーキテクチャがモデルのトレーニングに使用されます。 CCNet の使用目的はピクセル分類です。 CGNet—CGNet アーキテクチャがモデルのトレーニングに使用されます。 CGNet の使用目的はピクセル分類です。 DETReg—DETReg アーキテクチャがモデルのトレーニングに使用されます。 DETReg はオブジェクト検出に使用されます。 DynamicRCNN—DynamicRCNN アーキテクチャがモデルのトレーニングに使用されます。 DynamicRCNN の使用目的はオブジェクト検出です。 EmpiricalAttention—EmpiricalAttention アーキテクチャがモデルのトレーニングに使用されます。 EmpiricalAttention の使用目的はオブジェクト検出です。 FCOS—FCOS アーキテクチャがモデルのトレーニングに使用されます。 FCOS の使用目的はオブジェクト検出です。 FoveaBox—FoveaBox アーキテクチャがモデルのトレーニングに使用されます。 FoveaBox の使用目的はオブジェクト検出です。 FSAF—FSAF アーキテクチャがモデルのトレーニングに使用されます。 FSAF の使用目的はオブジェクト検出です。 GHM—GHM アーキテクチャがモデルのトレーニングに使用されます。 GHM の使用目的はオブジェクト検出です。 LibraRCNN—LibraRCNN アーキテクチャがモデルのトレーニングに使用されます。 LibraRCNN の使用目的はオブジェクト検出です。 PaFPN—PaFPN アーキテクチャがモデルのトレーニングに使用されます。 PaFPN の使用目的はオブジェクト検出です。 Res2Net—Res2Net アーキテクチャがモデルのトレーニングに使用されます。 Res2Net の使用目的はオブジェクト検出です。 SABL—SABL アーキテクチャがモデルのトレーニングに使用されます。 SABL の使用目的はオブジェクト検出です。 VFNet—VFNet アーキテクチャがモデルのトレーニングに使用されます。 VFNet の使用目的はオブジェクト検出です。 DMNet—DMNet アーキテクチャがモデルのトレーニングに使用されます。 DMNet の使用目的はピクセル分類です。 DNLNet—DNLNet アーキテクチャがモデルのトレーニングに使用されます。 DNLNet の使用目的はピクセル分類です。 FastSCNN—FastSCNN アーキテクチャがモデルのトレーニングに使用されます。 FastSCNN の使用目的はピクセル分類です。 FCN—FCN アーキテクチャがモデルのトレーニングに使用されます。 FCN の使用目的はピクセル分類です。 GCNet—GCNet アーキテクチャがモデルのトレーニングに使用されます。 GCNet の使用目的はピクセル分類です。 MobileNetV2—MobileNetV2 アーキテクチャがモデルのトレーニングに使用されます。 MobileNetV2 の使用目的はピクセル分類です。 NonLocalNet—NonLocalNet アーキテクチャがモデルのトレーニングに使用されます。 NonLocalNet の使用目的はピクセル分類です。 OCRNet—Mask2Former アーキテクチャがモデルのトレーニングに使用されます。 Mask2Former の使用目的はピクセル分類です。 PSANet—PSANet アーキテクチャがモデルのトレーニングに使用されます。 PSANet の使用目的はピクセル分類です。 SemFPN—SemFPN アーキテクチャがモデルのトレーニングに使用されます。 SemFPN の使用目的はピクセル分類です。 UperNet—UperNet アーキテクチャがモデルのトレーニングに使用されます。 UperNet の使用目的はピクセル分類です。 MaskRCNN—MaskRCNN アーキテクチャがモデルのトレーニングに使用されます。 MaskRCNN の使用目的はオブジェクト検出です。 SamLoRA—SamLoRA アーキテクチャがモデルのトレーニングに使用されます。 SamLoRA の使用目的はピクセル分類です。 RTDetrV2—RTDetrV2 アーキテクチャがモデルのトレーニングに使用されます。 RTDetrV2 の使用目的はオブジェクト検出です。	String
評価済みモデルの保存 (オプション)	すべての評価済みモデルを保存するかどうかを指定します。オン - すべての評価済みモデルを保存します。オフ - 最善モデルのみを保存します。これがデフォルトです。	Boolean

派生した出力

ラベル	説明	データタイプ
出力モデルファイル	出力モデルファイル。	File

arcpy.geoai.TrainUsingAutoDL(in_data, out_model, {pretrained_model}, {total_time_limit}, {autodl_mode}, {networks}, {save_evaluated_models})

名前	説明	データタイプ
in_data	モデルのトレーニングに必要な画像チップ、ラベル、統計情報を含むフォルダー。 [ディープラーニング用のトレーニングデータをエクスポート (Export Training Data For Deep Learning)] ツールからの出力です。エクスポートされるデータのメタデータ形式は、Classified_Tiles、PASCAL_VOC_rectangles、または KITTI_rectangles のいずれかである必要があります。	Folder
out_model	ディープラーニングパッケージとして保存される出力トレーニング済みモデル (.dlpk ファイル)。	File
pretrained_model (オプション)	新しいモデルの微調整に使用される事前トレーニング済みモデル。入力は、Esri モデル定義ファイル (.emd) またはディープラーニングパッケージファイル (.dlpk) です。類似したクラスを持つ事前トレーニング済みモデルは、新しいモデルに合わせて微調整することができます。事前トレーニング済みモデルは、新しいモデルのトレーニングに使用される同じモデルタイプおよびバックボーンモデルでトレーニングされている必要があります。	File
total_time_limit (オプション)	AutoDL モデルトレーニングに使用する合計時間の制限を時間で示した値。デフォルトは 2 時間です。	Double
autodl_mode (オプション)	使用される AutoDL モードおよび AutoDL の検索がどの程度徹底的に行われるかを指定します。 BASIC—基本モードが使用されます。このモードは、ハイパーパラメーターの調整なしで選択したすべてのネットワークをトレーニングするために使用されます。 ADVANCED—高度な設定モードが使用されます。このモードは、上位 2 つの最善モデルでハイパーパラメーターの調整を実行するために使用されます。	String
networks [networks,...] (オプション)	モデルのトレーニングに使用するアーキテクチャを指定します。 SingleShotDetector—SingleShotDetector アーキテクチャがモデルのトレーニングに使用されます。 SingleShotDetector の使用目的はオブジェクト検出です。 RetinaNet—RetinaNet アーキテクチャがモデルのトレーニングに使用されます。 RetinaNet の使用目的はオブジェクト検出です。 FasterRCNN—FasterRCNN アーキテクチャがモデルのトレーニングに使用されます。 FasterRCNN の使用目的はオブジェクト検出です。 YOLOv3—YOLOv3 アーキテクチャがモデルのトレーニングに使用されます。 YOLOv3 の使用目的はオブジェクト検出です。 HRNet—HRNet アーキテクチャがモデルのトレーニングに使用されます。 HRNet の使用目的はピクセル分類です。 ATSS—ATSS アーキテクチャがモデルのトレーニングに使用されます。 ATSS の使用目的はオブジェクト検出です。 CARAFE—CARAFE アーキテクチャがモデルのトレーニングに使用されます。 CARAFE の使用目的はオブジェクト検出です。 CascadeRCNN—CascadeRCNN アーキテクチャがモデルのトレーニングに使用されます。 CascadeRCNN の使用目的はオブジェクト検出です。 CascadeRPN—CascadeRPN アーキテクチャがモデルのトレーニングに使用されます。 CascadeRPN の使用目的はオブジェクト検出です。 DCN—DCN アーキテクチャがモデルのトレーニングに使用されます。 DCN の使用目的はオブジェクト検出です。 DeepLab—DeepLab アーキテクチャがモデルのトレーニングに使用されます。 DeepLab の使用目的はピクセル分類です。 UnetClassifier—UnetClassifier アーキテクチャがモデルのトレーニングに使用されます。 UnetClassifier の使用目的はピクセル分類です。 DeepLabV3Plus—DeepLabV3Plus アーキテクチャがモデルのトレーニングに使用されます。 DeepLabV3Plus の使用目的はピクセル分類です。 PSPNetClassifier—PSPNetClassifier アーキテクチャがモデルのトレーニングに使用されます。 PSPNetClassifier の使用目的はピクセル分類です。 ANN—ANN アーキテクチャがモデルのトレーニングに使用されます。 ANN の使用目的はピクセル分類です。 APCNet—APCNet アーキテクチャがモデルのトレーニングに使用されます。 APCNet の使用目的はピクセル分類です。 CCNet—CCNet アーキテクチャがモデルのトレーニングに使用されます。 CCNet の使用目的はピクセル分類です。 CGNet—CGNet アーキテクチャがモデルのトレーニングに使用されます。 CGNet の使用目的はピクセル分類です。 DETReg—DETReg アーキテクチャがモデルのトレーニングに使用されます。 DETReg はオブジェクト検出に使用されます。 DynamicRCNN—DynamicRCNN アーキテクチャがモデルのトレーニングに使用されます。 DynamicRCNN の使用目的はオブジェクト検出です。 EmpiricalAttention—EmpiricalAttention アーキテクチャがモデルのトレーニングに使用されます。 EmpiricalAttention の使用目的はオブジェクト検出です。 FCOS—FCOS アーキテクチャがモデルのトレーニングに使用されます。 FCOS の使用目的はオブジェクト検出です。 FoveaBox—FoveaBox アーキテクチャがモデルのトレーニングに使用されます。 FoveaBox の使用目的はオブジェクト検出です。 FSAF—FSAF アーキテクチャがモデルのトレーニングに使用されます。 FSAF の使用目的はオブジェクト検出です。 GHM—GHM アーキテクチャがモデルのトレーニングに使用されます。 GHM の使用目的はオブジェクト検出です。 LibraRCNN—LibraRCNN アーキテクチャがモデルのトレーニングに使用されます。 LibraRCNN の使用目的はオブジェクト検出です。 PaFPN—PaFPN アーキテクチャがモデルのトレーニングに使用されます。 PaFPN の使用目的はオブジェクト検出です。 Res2Net—Res2Net アーキテクチャがモデルのトレーニングに使用されます。 Res2Net の使用目的はオブジェクト検出です。 SABL—SABL アーキテクチャがモデルのトレーニングに使用されます。 SABL の使用目的はオブジェクト検出です。 VFNet—VFNet アーキテクチャがモデルのトレーニングに使用されます。 VFNet の使用目的はオブジェクト検出です。 DMNet—DMNet アーキテクチャがモデルのトレーニングに使用されます。 DMNet の使用目的はピクセル分類です。 DNLNet—DNLNet アーキテクチャがモデルのトレーニングに使用されます。 DNLNet の使用目的はピクセル分類です。 FastSCNN—FastSCNN アーキテクチャがモデルのトレーニングに使用されます。 FastSCNN の使用目的はピクセル分類です。 FCN—FCN アーキテクチャがモデルのトレーニングに使用されます。 FCN の使用目的はピクセル分類です。 GCNet—GCNet アーキテクチャがモデルのトレーニングに使用されます。 GCNet の使用目的はピクセル分類です。 MobileNetV2—MobileNetV2 アーキテクチャがモデルのトレーニングに使用されます。 MobileNetV2 の使用目的はピクセル分類です。 NonLocalNet—NonLocalNet アーキテクチャがモデルのトレーニングに使用されます。 NonLocalNet の使用目的はピクセル分類です。 Mask2Former—Mask2Former アーキテクチャがモデルのトレーニングに使用されます。 Mask2Former の使用目的はピクセル分類です。 PSANet—PSANet アーキテクチャがモデルのトレーニングに使用されます。 PSANet の使用目的はピクセル分類です。 SemFPN—SemFPN アーキテクチャがモデルのトレーニングに使用されます。 SemFPN の使用目的はピクセル分類です。 UperNet—UperNet アーキテクチャがモデルのトレーニングに使用されます。 UperNet の使用目的はピクセル分類です。 MaskRCNN—MaskRCNN アーキテクチャがモデルのトレーニングに使用されます。 MaskRCNN の使用目的はオブジェクト検出です。 SamLoRA—SamLoRA アーキテクチャがモデルのトレーニングに使用されます。 SamLoRA の使用目的はピクセル分類です。 RTDetrV2—RTDetrV2 アーキテクチャがモデルのトレーニングに使用されます。 RTDetrV2 の使用目的はオブジェクト検出です。デフォルトでは、すべてのネットワークが使用されます。	String
save_evaluated_models (オプション)	すべての評価済みモデルを保存するかどうかを指定します。 SAVE_ALL_MODELS—すべての評価済みモデルを保存します。 SAVE_BEST_MODEL—最善モデルのみを保存します。これがデフォルトです。	Boolean

派生した出力

名前	説明	データタイプ
output_model_file	出力モデルファイル。	File

コードのサンプル

TrainUsingAutoDL (Python ウィンドウ)

この例では、TrainUsingAutoDL 関数を使用する方法を示します。

# Name: TrainUsingAutoDL.py
# Description: Train a deep learning model on imagery data with
# automatic hyperparameter selection.
  
# Import system modules
import arcpy
import os

# Set local variables

datapath = "path_to_training_data" 
out_path = "path_to_trained_model"

out_model = os.path.join(out_path, "mymodel")

# Run Train Using AutoDL Model
arcpy.geoai.TrainUsingAutoDL(
    datapath, out_model, None, 2, "BASIC", 
    ["ATSS", "DCN", "FasterRCNN", "RetinaNet", "SingleShotDetector", "YOLOv3"], 
    "SAVE_BEST_MODEL")

環境

GPU ID

このトピックへのフィードバック

サマリー

使用法

パラメーター

派生した出力

派生した出力

コードのサンプル

環境

このトピックの内容