Présentation de la segmentation et de la classification

Disponible avec une licence Spatial Analyst.

Disponible avec une licence Image Analyst.

Les outils de segmentation et de classification proposent des méthodes d'extraction d'entités à partir d'images, basées sur des objets. Ces objets sont créés via un processus de segmentation d'images par lequel des pixels adjacents et qui présentent des caractéristiques spectrales similaires sont regroupés dans un segment. Les segments qui présentent certaines formes et caractéristiques spectrales et spatiales peuvent être à leur tour groupés sous forme d’objets. Les objets peuvent être groupés en classes représentant des entités du monde réel au sol. Vous pouvez également procéder à la classification d'images de pixels, à savoir des images traditionnelles non segmentées, par exemple.

Le processus d’extraction d’entité orienté objet est un workflow pris en charge par des outils adaptés à trois principaux domaines fonctionnels : segmentation d’images, dérivation d’informations analytiques sur les segments et classification. Les données en sortie d’un outil constituent les données en entrée utilisées par d’autres outils, l’objectif étant de produire une carte de classes d’entités orientées objet qui présente un intérêt. Le processus orienté objet est semblable au processus de classification d’images traditionnelles basé sur des pixels qui utilise des techniques de classification assistées et non assistées. Plutôt que de classer des pixels, le processus classe des segments qui peuvent être perçus comme des super pixels. Chaque segment, ou super pixel, est représenté par un ensemble d'attributs que les outils du classificateur utilisent pour produire l'image classée.

Le modèle de géotraitement représenté ci-dessous illustre le workflow d'extraction d'entités orienté objet.

Workflow d'extraction d'entité orienté objet

Segmentation d'image

La segmentation d'images est basée sur l'approche Décalage moyen. La technique utilise une fenêtre en mouvement qui calcule une valeur moyenne de pixel pour déterminer quels pixels doivent être inclus dans chaque segment. Au fur et à mesure que la fenêtre se déplace sur l’image, elle recalcule la valeur de manière itérative pour s’assurer que chaque segment est adapté. Il en résulte un regroupement de pixels d'images sous la forme d'un segment caractérisé par une couleur moyenne.

L’outil Segment Mean Shift (Décalage moyen de segment) accepte tous les rasters pris en charge par Esri et produit une image couleur 8 bits, 3 canaux, segmentée dont la propriété clé est définie sur Segmented (Segmenté). Les caractéristiques des segments d’images dépendent de trois paramètres : détail spectral, détail spatial et taille minimale de segment. Vous pouvez modifier la quantité de détails caractérisant une entité qui vous intéresse. Par exemple, si vous êtes davantage intéressé par des entités imperméables que par des bâtiments individuels, attribuez une valeur faible au paramètre concernant les détails spatiaux pour obtenir un résultat plus lisse et moins détaillé.

L'image ci-dessous est une scène WorldView-2 segmentée, fournie par DigitalGlobe, en couleur infrarouge. L’image segmentée affiche des surfaces semblables regroupées en objets, sans granularité. Elle généralise la surface pour conserver les entités sous la forme d'une surface continue plus étendue.

Scène WorldView-2 en couleur infrarouge
Scène WorldView-2 en couleur infrarouge, fournie par DigitalGlobe.
Image segmentée
Image segmentée basée sur la scène WorldView-2.

Bibliographie :

  • D. Comanicu, P. Meer : Mean shift: A robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 5, May 2002.
  • P. Meer, B. Georgescu : Edge detection with embedded confidence. IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 23, no. 12, December 2001.
  • C. Christoudias, B. Georgescu, P. Meer : Synergism in low level vision. 16th International Conference of Pattern Recognition, Track 1 - Computer Vision and Robotics, Quebec City, Canada, August 2001.

Données d'échantillons d'apprentissage

La collecte de données d’échantillons d’apprentissage revient à délimiter un groupe de pixels représentant des entités spécifiques, délimitées de l’image. Tous les pixels de l’image sont ensuite statistiquement comparés à la définition de classe que vous avez spécifiée et affectés à une classe d’entité spécifique. Les échantillons d'apprentissage ne doivent pas contenir de pixels indésirables n'appartenant pas à la classe qui vous intéresse. Lorsque vous choisissez les pixels appropriés pour chaque classe, les résultats sont souvent caractérisés par une distribution normale en forme de cloche. Veillez à ce que votre polygone d'échantillon d'apprentissage contienne un nombre significatif de pixels, surtout lorsque vous utilisez un classificateur de vraisemblance maximale. Par exemple, un bloc de 10 x 10 pixels équivaut à 100 pixels. C'est une taille raisonnable pour un polygone d'apprentissage, laquelle est également statistiquement significative.

Un jeu de données raster segmenté diffère d’une image de pixels, car chaque segment (souvent appelé un super pixel) est représenté par une valeur définie. Alors qu’on peut obtenir facilement un polygone d’échantillon d’apprentissage contenant 100 pixels à partir d’une image, il est plus fastidieux d’obtenir 100 segments à partir d’un jeu de données raster segmenté.

Les classificateurs paramétriques, tel que le classificateur de vraisemblance maximale, requièrent un nombre statistiquement significatif d’échantillons pour produire une densité de probabilité pertinente. Pour produire des échantillons statistiquement significatifs, vous devez disposer d’au moins 20 échantillons par classe. Cela signifie que pour chaque classe, à savoir un sol nu, des arbres à feuilles caduques ou de l’asphalte, 20 segments au moins doivent être collectés pour définir chaque classe d’entités.

Le lissage affecte la taille et l'homogénéité d'un segment. Un raster segmenté utilisant un facteur de lissage élevé sera plus susceptible de contenir des segments importants et plusieurs types d'entités visibles dans l'image source. En raison de l’effet de lissage, nous recommandons la collecte d’échantillons d’apprentissage sur le jeu de données raster segmenté. Cela garantit ainsi la collecte d'échantillons d'apprentissage à partir de segments discrets distincts.

Informations analytiques

Les informations analytiques associées à la couche segmentée sont calculées par l'outil d'apprentissage du classificateur et dépendent du type de classificateur spécifié. Utilisez l'outil d'apprentissage adapté pour classer vos données :

ClassificateurDescription
Préparer le classificateur d'agrégats ISO

Génère un fichier de définition de classificateur Esri (.ecd) à l’aide de la définition de classification des agrégats ISO.

Entraîner le classificateur K voisins les plus proches

Génère un fichier de définition de classificateur Esri (.ecd) à l’aide de la méthode de classification K voisins les plus proches.

Préparer le classificateur de vraisemblance maximale

Génère un fichier de définition de classificateur Esri (.ecd) à l’aide de la définition de classification du classificateur de vraisemblance maximale (MLC).

Le classificateur de vraisemblance maximale est basé sur le théorème de Bayes. Il suppose que les échantillons de chaque classe suivent la distribution normale et calcule les probabilités de toutes les classes pour chaque échantillon, puis il attribue la classe présentant la probabilité la plus élevée à cet échantillon.

Préparer le classificateur d'arbres aléatoires

Génère un fichier de définition de classificateur Esri (.ecd) à l’aide de la méthode de classification Arbres aléatoires.

Le classificateur aléatoire d'arbres représente l'ensemble de classificateurs d'arbres décisionnels qui corrige la tendance au sur-ajustement des arbres décisionnels. Tout comme le classificateur de machines à vecteurs de support, le classificateur d'arbres décisionnels n'exige pas un nombre important d'échantillons d'apprentissage et ne suppose pas une distribution normale. Cette méthode de classification relativement nouvelle est couramment utilisée par les chercheurs.

Préparer le classificateur de machines à vecteurs de support

Génère un fichier de définition de classificateur Esri (.ecd) à l’aide de la définition de classification des machines à vecteurs de support (SVM).

Le classificateur de machines à vecteurs de support essaie de trouver les vecteurs de support et l'hyperplan séparateur pour chaque paire de classes afin d'optimiser la marge entre les classes. Il propose une méthode de classification assistée moderne et puissante qui exige bien moins d'échantillons que le classificateur de vraisemblance maximale et ne suppose pas qu'ils suivent une distribution normale. C'est souvent le cas dans la classification basée sur les segments du raster en entrée ou une image standard. Le classificateur de machines à vecteurs de support est très souvent utilisé par les chercheurs.

Les outils d'apprentissage intègrent l'image à classer, une couche segmentée facultative et les données surfaciques du site d'apprentissage pour générer le fichier de définition de classificateur approprié. Le fichier standard d'échantillons d'apprentissage est utilisé dans les classificateurs assistés.

Comme le fichier de définition de classificateur .ecd repose sur le classificateur spécifié et des attributs pertinents, il est unique pour chaque classificateur, les entrées raster et les attributs. Il peut être assimilé à un fichier de signature de classification, mais il est plus général, car il prend en charge tout classificateur. Ainsi, le fichier de définition de classificateur généré est adapté à une combinaison spécifique de données source et de classificateur.

Le fichier de définition de classificateur peut être basé sur tout raster et pas uniquement les rasters segmentés. Par exemple, un raster segmenté provient de données multispectrales IKONOS et il est possible de générer des statistiques et des données attributaires analytiques à partir d'une image WorldView-2 améliorée 6 canaux, QuickBird, GeoEye, Pleiades, RapidEye ou Landsat 8. Cette flexibilité vous permet de dériver le raster segmenté une seule fois et de générer des fichiers de définition de classificateur et les cartes d'entités classées résultantes à l'aide de plusieurs sources d'images, selon votre application.

Calculer les attributs de segments

Les outils susmentionnés sont ceux qui sont le plus souvent utilisés dans le workflow orienté objet. L’outil supplémentaire Compute Segment Attributes (Calculer les attributs de segments) permet d’intégrer et d’exporter des rasters segmentés à partir d’applications tierces et à destination de ces dernières. Cet outil accepte en entrée une image segmentée et un raster supplémentaire pour calculer les attributs de chaque segment et produit en sortie, à partir de ces informations, un fichier raster d'index auquel une table attributaire est associée.

Cet outil permet d'effectuer des analyses supplémentaires du raster segmenté. Les attributs peuvent être analysés dans une application graphique ou de statistiques tierce, ou utilisés en entrée dans des classificateurs supplémentaires non pris en charge par Esri. Cet outil prend également en charge l'intégration d'un raster segmenté à partir d'un package tiers et étend les fonctionnalités d'Esri en autorisant l'utilisation de données et de paquetages d'applications tiers.

Classification

L’outil Classify Raster (Classer le raster) procède à la classification d’images conformément au fichier de définition de classificateur d’Esri. Les données qui servent d’entrée à l’outil sont l’image à classer, le deuxième raster facultatif (raster segmenté ou une autre couche raster, comme un MNA) et un fichier de définition de classificateur pour générer le jeu de données raster classé. L'outil Classer le raster attend les même données en entrée que l'outil d'apprentissage. L’outil Classer le raster contient tous les classificateurs pris en charge. Le classificateur utilisé varie en fonction des propriétés et des informations figurant dans le fichier de définition de classificateur. Ainsi, le fichier de définition de classificateur généré par l’outil Préparer le classificateur d’agrégats ISO, Préparer le classificateur de vraisemblance maximale, Préparer le classificateur de machines à vecteurs de support ou Préparer le classificateur d’arbres aléatoires doit activer le classificateur correspondant lorsque vous exécutez l’outil Classer le raster.

La sortie est un jeu de données raster classé thématique, avec les classes identifiées dans la table attributaire associée, dont les couleurs correspondent à la combinaison développée pendant l'apprentissage.

Evaluation de la précision

L’évaluation de la précision constitue une part importante des projets de classification. Elle compare l’image classée à une autre source de données considérée comme exacte ou à des données de référence. Vous pouvez collecter des données de référence sur le terrain (appelées données de réalité de terrain), mais cette procédure est longue et onéreuse. Les données de référence peuvent également être déduites de l'interprétation de l'imagerie haute résolution, de l'imagerie classée existante ou de couches de données SIG.

Le mode d'évaluation le plus répandu de la précision d'une carte classée consiste à créer un jeu de points aléatoires à partir de données de référence et à le comparer aux données classées dans une matrice de confusion. Même si cette procédure comporte deux étapes, vous pouvez être amené à comparer les résultats de différentes méthodes de classification ou sites d’apprentissage. Vous pouvez également ne pas disposer des données de référence et vous baser sur l’imagerie utilisée pour créer la classification. Pour s’adapter à ces autres workflows, la procédure en deux étapes d’évaluation de la précision applique les outils suivants : Create Accuracy Assessment Points (Création de points d’évaluation de la précision), Update Accuracy Assessment Points (Mettre à jour les points d’évaluation de la précision) et Compute Confusion Matrix (Calculer la matrice de confusion).

Assistant de classification

Le processus de classification comporte généralement plusieurs étapes : prétraitement de l’image, attribution des catégories de classes et création des données d’apprentissage pertinentes, exécution de la classification, évaluation et affinement de la précision des résultats. Le Classification Wizard (Assistant de classification) disponible dans ArcGIS AllSource guide l’analyste tout au long du processus de classification et permet de garantir des résultats acceptables.

Assistant de classification

Rubriques connexes