Einführung in das Modell—Vortrainierte ArcGIS-Modelle

Das im ArcGIS Living Atlas of the World verfügbare vortrainierte Modell Vision Language Context-Based Classification ist ein Deep-Learning-Modell, das zur Klassifizierung von Bildern verwendet wird.

Dieses Deep-Learning-Paket (DLPK) dient als Verbindung zwischen ArcGIS Pro und Vision-Language-Modellen, die GPT-4 und GPT-4o von OpenAI sowie Llama-Modelle unterstützen. OpenAI- und Llama Vision-Modelle sind bekannt für ihre erweiterten Funktionen im Hinblick auf die Verarbeitung und das Verständnis natürlicher Sprache sowie die Interpretation und Generierung menschenähnlicher Texte. Die Integration dieser Modelle in ein DLPK erweitert deren Nutzen, da sie die Verarbeitung von Bildern und die Zero-Shot-Klassifizierung von Objekten in Bilddaten ermöglicht.

Verwenden Sie dieses DLPK, um mit umfassenden Vision-Language-Modellen von OpenAI sowie Llama Vision-Modellen eine Objektklassifizierung für Bilder und Raster in ArcGIS Pro durchzuführen. Dieses DLPK ermöglicht Flexibilität bei der Klassifizierung von Objekten, da es nicht auf vordefinierte Klassen beschränkt ist; Benutzer können zur Laufzeit des Werkzeugs benutzerdefinierte Klassenbeschriftungen festlegen. Diese Analyse und Interpretation räumlicher Daten ermöglicht Experten aus Bereichen wie Umweltwissenschaften, Stadtplanung und Fernerkundung das Extrahieren aussagekräftiger Erkenntnisse aus ihren visuellen Datasets.

Lizenzanforderungen

Für diesen Workflow gelten die folgenden Lizenzanforderungen:

ArcGIS Desktop: ArcGIS Image Analyst-Erweiterung für ArcGIS Pro
ArcGIS Enterprise: ArcGIS Image Server mit konfigurierter Raster-Analyse
ArcGIS Online: Benutzertyp ArcGIS Pro oder Professional Plus

Modelldetails

Dieses Modell hat die folgenden Merkmale:

Eingabe: 8-Bit-RGB-Bilddaten
Ausgabe: Feature-Class mit Informationen zur Klassifizierung des Bildes.
Berechnung: Dieser Workflow kann auf einer CPU oder GPU ausgeführt werden.
Eignung für Geographien: Das Modell eignet sich gut weltweit.
Architektur: Für die Implementierung werden entweder die Vision-Language-Modelle von OpenAI oder Llama Vision-Modelle verwendet.

Zugreifen auf das Modell und Herunterladen des Modells

Laden Sie das vortrainierte Modell Vision Language Context-Based Classification aus dem ArcGIS Living Atlas of the World herunter. Alternativ können Sie direkt über ArcGIS Pro auf das Modell zugreifen oder es in ArcGIS Image for ArcGIS Online verwenden.

Führen Sie zum Herunterladen des Modells die folgenden Schritte aus:

Navigieren Sie zum ArcGIS Living Atlas of the World.
Melden Sie sich mit Ihren ArcGIS Online-Anmeldedaten an.
Suchen Sie nach Vision Language Context-Based Classification, und öffnen Sie in den Suchergebnissen die entsprechende Elementseite.
Klicken Sie auf die Schaltfläche Herunterladen, um das Modell herunterzuladen.
Sie können die heruntergeladene .dlpk-Datei direkt in ArcGIS Pro verwenden.

Versionshinweise

Es folgen die Versionshinweise:


Datum	Beschreibung
März 2025 Dezember 2024	Zweite Version von "Vision Language Context-Based Classification" Erste Version von "Vision Language Context-Based Classification"

Feedback zu diesem Thema?

Lizenzanforderungen

Modelldetails

Zugreifen auf das Modell und Herunterladen des Modells

Versionshinweise

In diesem Thema