Skip To Content

モデルの使用

GroundingDINO モデルは、ArcGIS Pro の Image Analyst ツールボックスからアクセスできる [ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールで使用することができます。

GroundingDINO 事前トレーニング済みモデルを使用するには、次の手順を実行します。

  1. モデルをダウンロードして、ArcGIS Pro にイメージ レイヤーを追加します。

    ArcGIS Pro プロジェクトのイメージ レイヤー

  2. [解析] タブをクリックして [ツール] をクリックします。

    ArcGIS Pro の解析タブのツール

  3. [ジオプロセシング] ウィンドウの [ツールボックス] タブをクリックして [Image Analyst ツール] を展開し、[ディープ ラーニング][ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning)] ツールを選択します。

    ディープ ラーニングを使用したオブジェクトの検出 (Detect Objects Using Deep Learning) ツール

  4. [パラメーター] タブで、次のようにパラメーターを設定します。
    1. [入力ラスター] - 画像を選択します。
    2. [出力検出オブジェクト] - 検出されたオブジェクトを含む出力フィーチャクラスを指定します。
    3. [モデル定義] - 事前トレーニング済みモデルの .dlpk ファイルを選択します。
    4. [引数] (オプション) - 必要に応じて引数の値を変更します。
      • [text_prompt] - 検出するオブジェクトを説明するテキスト。 カンマ区切りの複数のテキスト プロンプトを入力でき、これによって複数のクラスを検出することが可能になります。
      • [padding] - 隣接するタイルの予測がブレンドされる画像タイルの境界のピクセル数。 値を大きくすると、エッジ アーティファクトが減少し、出力が滑らかになります。 パディングの最大値には、タイル サイズの値の半分を設定できます。
      • [batch_size] - モデル推論の各ステップで処理された画像タイルの数。 これは、お使いのグラフィックス カードのメモリに応じて異なります。
      • [box_threshold] - 結果に追加される検出の選択に使用される信頼度スコア。 可能な値の範囲は 0 ~ 1.0 です。
      • [text_threshold] - 検出されたオブジェクトを指定されたテキスト プロンプトに関連付けるために使用される信頼度スコア。 この値を高くすると関連が強くなりますが、関連が少なくなる可能性があります。 可能な値の範囲は 0 ~ 1.0 です。
      • [tta_scales] - 画像の縮尺を変更することで、予測中にテスト時間を延長します。 推奨値は 0.5 ~ 1.5 です。 複数の縮尺は、カンマで区切っても入力できます (0.9, 1, 1.1 など)。
      • [nms_overlap] - 2 つの重複したフィーチャの最大オーバーラップ率。全領域に対する交差領域の比率として定義されます。 デフォルトは 0.1 です。
      • [exclude_pad_detections] - true の場合、画像チップのパディングされた領域にあるエッジ付近で切り捨てられる可能性のある検出をフィルター処理します。
    5. [Non Maximum Suppression] - 必要に応じてチェックボックスをオンにして、信頼度の低いオーバーラップ フィーチャを削除します。

      オンにした場合は、次の設定を行います。

      • [信頼度スコア フィールド] - デフォルトを使用します。
      • [クラス値フィールド] - デフォルトを使用します。
      • [最大オーバーラップ率] - 最大オーバーラップ率の値を「0.1」に設定します。

    ディープ ラーニングを使用したオブジェクトの検出ツールのパラメーター

  5. [環境] タブで、次のように変数を設定します。
    1. [処理範囲] - ドロップダウン メニューから [デフォルト] または適切な選択肢を選択します。
    2. [セル サイズ] - 値を適宜設定します。

      選択した範囲全体で、対象オブジェクトの可視領域が最大になるよう、セル サイズをメートル単位で選択します。 大きいオブジェクトを検出するには大きいセル サイズ、小さいオブジェクトを検出するには小さいセル サイズを検討します。 たとえば、雲を検出する場合はセル サイズを 10 メートルに設定し、車を検出する場合はセル サイズを 0.30 メートル (30 センチメートル) に設定します。 セル サイズの詳細については、「ラスター データのセル サイズ」ヘルプ トピックをご参照ください。

    3. [プロセッサー タイプ] - [CPU] または [GPU] を選択します。

      GPU が使用可能であれば [GPU] を選択し、[GPU ID] を、使用する GPU に設定することをお勧めします。

    ディープ ラーニングを使用したオブジェクトの検出ツールの環境

  6. [実行] をクリックします。

    処理が完了すると、出力レイヤーがマップに追加されます。

    検出された結果