Skip To Content

モデルの概要

検出を示すモデルのバナー画像

このトピックは、ArcGIS Living Atlas of the World で入手可能な GroundingDINO 事前トレーニング済みモデルの使用方法について説明しています。 このモデルは、プロンプトを使って画像内のオブジェクトを検出するために使用されます。

GroundingDINO は、オープンソースのサンプル モデルで、自由形式のテキスト プロンプトを使用してプロンプトを表示し、さまざまな種類のフィーチャを抽出します。 これは、テキスト プロンプトを使用してオブジェクトを見つけられる、オープンセットのオブジェクト検出器です。 モデルはバウンディング ボックスを出力します。これはポリゴンに変換され、GIS フィーチャとして返されます。 入力テキスト プロンプトで記述されるこれらのフィーチャには、車両、プール、船舶、航空機、ソーラー パネルなど、さまざまな対象オブジェクトを使用できます。

以下は、このワークフローを実行するためのライセンス要件です。

  • ArcGIS Desktop - ArcGIS ProArcGIS Image Analyst エクステンション
  • ArcGIS EnterpriseArcGIS Image Server
  • ArcGIS OnlineArcGIS Image for ArcGIS Online

モデルの詳細

このモデルには以下の特性があります。

  • 入力 - モデルには 8 ビット、3 バンドの RGB 画像があります。
  • 出力 - フィーチャクラスには、画像内の各種オブジェクトのマスクが含まれます。
  • 計算 - このワークフローは計算負荷が高いため、CUDA の最小計算能力が 6.0 の GPU が推奨されます。 このモデルには 8 GB 以上の GPU メモリが搭載された GPU が必要です。
  • 適用できる地域 - このモデルは全世界で機能します。
  • アーキテクチャ - このモデルは、IDEA-Research (The International Digital Economy Academy) によるオープンソースの Grounding DINO に基づいています。 追加情報については、このサンプルのディープ ラーニング パッケージのソース コードをご確認ください。

モデルへのアクセスとダウンロード

GroundingDINO 事前トレーニング済みモデルを ArcGIS Living Atlas of the World からダウンロードします。 または、ArcGIS Pro からモデルに直接アクセスするか、ArcGIS Image for ArcGIS Online でモデルを使用します。

  1. ArcGIS Living Atlas of the World を参照します。
  2. 自分の ArcGIS Online アカウントの認証情報を使用してサイン インします。
  3. GroundingDINO」を検索して、検索結果からアイテム ページを開きます。
  4. [ダウンロード] ボタンをクリックして、モデルをダウンロードします。

    ダウンロードした .dlpk ファイルを ArcGIS Pro で直接使用することも、ArcGIS Enterprise にアップロードして使用することもできます。 さらに、必要に応じて事前トレーニング済みモデルを微調整できます。

リリース ノート

以下はリリースノートです。

Date説明

2024 年 8 月

GroundingDINO の初回リリース