
Ce document décrit le mode d’utilisation du modèle pré-entraîné SAM texte disponible dans ArcGIS Living Atlas of the World. Ce modèle permet de détecter des objets dans une image à l’aide d’une invite.
SAM texte est un exemple de modèle Open Source qui peut être appelé en utilisant des invites en texte libre pour extraire des entités de types divers. Pour cela, les modèles Grounding DINO et SAM (Segment Anything Model) sont utilisés. Grounding DINO est un détecteur d’objets sur ensemble ouvert qui peut trouver des objets avec une invite de texte. Le modèle Segment Anything Model peut être utilisé pour segmenter tout objet dans une région d’intérêt représentée par un cadre ou un point. Ces deux modèles sont appelés séquentiellement dans ce paquetage de Deep Learning. Les cadres représentant les objets détectés par Grounding DINO alimentent le modèle SAM sous forme d’invites qui génèrent des masques pour les objets. Enfin, les masques sont convertis en polygones et renvoyés sous forme d’entités SIG. Ces entités, qui sont décrites par les invites de texte en entrée, peuvent être tout objet d’intérêt, par exemple des véhicules, des piscines, des bateaux, des avions, des panneaux solaires, etc.
Pour réaliser ce processus, les licences suivantes sont nécessaires :
- ArcGIS Desktop : extension ArcGIS Image Analyst pour ArcGIS Pro
- ArcGIS Enterprise : ArcGIS Image Server
- ArcGIS Online : ArcGIS Image for ArcGIS Online
Détails du modèle
Ce modèle présente les caractéristiques suivantes :
- Entrée - Images RVB 3 bandes, 8 bits.
- Sortie - Classe d’entités contenant les masques de divers objets dans l’image.
- Calcul - Ce processus sollicite beaucoup de ressources de calcul, il est donc recommandé de s’équiper d’un processeur graphique avec des capacités de calcul CUDA 6.0 au minimum. Ce modèle requiert un GPU avec au moins 8 Go de mémoire.
- Géographies concernées - Ce modèle est prévu pour fonctionner parfaitement dans le monde entier.
- Architecture - Ce modèle est basé sur le modèle Open Source Grounding DINO d’IDEA-Research (The International Digital Economy Academy) et sur le modèle Segment Anything Model (SAM) de Meta. Pour plus d’informations, vous pouvez consulter le code source de cet exemple de paquetage de Deep Learning.
Accéder et télécharger le modèle
Téléchargez le modèle pré-entraîné Texte SAM à partir de ArcGIS Living Atlas of the World. Vous pouvez également accéder au modèle directement dans ArcGIS Pro ou l’utiliser dans ArcGIS Image for ArcGIS Online.
- Accédez à ArcGIS Living Atlas of the World.
- Connectez-vous à l'aide de vos identifiants de connexion ArcGIS Online.
- Recherchez SAM texte et ouvrez la page de l’élément à partir des résultats de recherche.
- Cliquez sur le bouton Download (Télécharger) pour procéder au téléchargement du modèle.
Vous pouvez utiliser le fichier .dlpk téléchargé directement dans ArcGIS Pro ou le charger et l’utiliser dans ArcGIS Enterprise. Il est également possible d’optimiser le modèle pré-entraîné, si nécessaire.
Notes de version
Voici les notes de version :
Date | Description |
---|---|
Mars 2024 |
Première version du modèle SAM texte |
Vous avez un commentaire à formuler concernant cette rubrique ?