Fonctionnement de l'outil Localiser les régions—ArcGIS AllSource

L’outil Localiser les régions identifie les meilleures régions du raster en entrée, qui répondent à des exigences de taille et à des contraintes spatiales spécifiées. Les régions sont des groupes de cellules contiguës de même valeur. Les exigences et contraintes suivantes peuvent être définies dans cet outil : surface totale à sélectionner, nombre de régions sur lesquelles la surface totale est répartie, forme des régions souhaitées et distances minimale et maximale entre les régions.

L’outil Localiser les régions est souvent utilisé avec l’outil Connexions optimales des régions pour sélectionner, puis joindre les meilleures régions disponibles de la façon la plus efficace. Pour effectuer cette analyse, vous avez besoin d'une surface d'aptitude, que vous pouvez créer à l'aide d'autres outils de ce jeu d'outils. Utilisez ensuite l'outil Localiser les régions pour identifier les meilleures régions disponibles. Utilisez enfin l’outil Connexions optimales des régions pour déterminer le réseau de chemins de moindre coût entre les régions. Pour plus d'informations sur la création d'un modèle d'aptitude, reportez-vous à la rubrique Présentation de l'analyse de superposition.

Exemple de problèmes résolus par l'outil Localiser les régions

A l'aide d'une surface créée à partir d'un modèle d'aptitude, vous pouvez identifier les meilleures régions pour les éléments suivants :

L’habitat préféré des cerfs à préserver. Huit parcelles d'habitat (régions) sont nécessaires pour conserver une population viable et chaque région doit être constituée d'environ 50 acres contigus. Pour soutenir la reproduction au sein de la harde, les régions doivent être suffisamment proches les unes des autres pour pouvoir être facilement reliées par des couloirs de circulation pour la faune sauvage.
Les meilleurs emplacements d'exploitation forestière pour une opération d'abattage. Pour être financièrement viables, les surfaces (régions) concernées doivent être constituées d'au moins 250 acres contigus et chaque région doit se trouver à 1 mile maximum des autres.
La localisation idéale d’un nouveau centre commercial. Le centre commercial nécessite les 60 acres les mieux adaptés. Cependant, pour la construction, les surfaces doivent être contiguës et la forme du site de construction (région) doit être la plus compacte possible.

Regroupement de cellules en régions

Il existe six façons principales de créer des régions à partir des cellules individuelles du raster d’adéquation.

Les cellules sont regroupées en une seule région.
Les cellules sont regroupées en un nombre défini de régions de même surface.
Les cellules sont regroupées en un nombre défini de régions de même surface dans le respect des contraintes de distance spécifiées entre les régions.
Les cellules sont regroupées en un nombre défini de régions de taille variable, contrôlée par les exigences de surface minimale et maximale spécifiées pour les régions.
Les cellules sont regroupées en un nombre défini de régions de taille variable, contrôlée par les exigences de surface minimale et maximale spécifiées pour les régions, et de telle façon que deux régions ne peuvent pas se trouver à moins de la distance minimale identifiée ou à plus de la distance maximale.
Identique à l'option précédente, mais les régions préexistantes déjà affectées à la zone d'étude doivent être prises en compte dans le processus de sélection.

Algorithme général de l'outil Localiser les régions

L'outil Localiser les régions utilise en entrée un raster dans lequel les valeurs les plus élevées représentent le niveau d'utilité le plus élevé. A partir de ce raster, l'outil sélectionne les meilleures régions répondant aux exigences de région et aux contraintes spatiales spécifiques.

Le processus de localisation des régions avec cet outil comprend quatre étapes. Les quatre étapes générales sont indiquées ci-dessous, avec des descriptions détaillées :

Elimination des emplacements considérés comme inadaptés pour le processus de sélection. Des exemples d'emplacements de ce type sont ceux au sein de plans d'eau, des bâtiments existants ou des zones trop escarpées. Il s'agit d'une étape de prétraitement.
Définition des caractéristiques de la ou des régions souhaitées. Des exemples de ces caractéristiques sont la taille, la forme et l'orientation. Cette étape nécessite la configuration de paramètres dans l'outil.
Identification de toutes les régions candidates du raster en entrée en fonction du compromis établi par l'utilisateur entre la conservation de la forme de la région et l'optimisation de son utilité. Cette étape implique l'algorithme de croissance de régions implémenté par l'outil.
Sélection de la ou des meilleures régions à partir des régions candidates à l'aide d'un critère d'évaluation défini par l'utilisateur. Par exemple, sélection des seules régions possédant la valeur moyenne la plus élevée. Cette étape se produit au sein de l’outil. Un algorithme de sélection est appliqué avec la méthode d’évaluation spécifiée.

Le principal algorithme d'identification des régions candidates utilise une technique de croissance de région paramétrée (PRG) qui traite chaque cellule identifiée comme une valeur initiale potentielle à partir de laquelle une région va grandir. Le choix des cellules contiguës à ajouter à une région repose sur un compromis entre la contribution de la cellule à la conservation de la forme souhaitée de la région et l'utilité (aptitude) de la valeur attributaire de la cellule. Plus la valeur attributaire est élevée, plus grande est l'utilité. Les régions candidates potentielles continuent de grandir jusqu'à ce que les exigences de surface spécifiées de la région soient satisfaites. Ce processus de croissance se produit pour chaque valeur initiale. Chaque région obtenue est considérée comme une région candidate. A cette étape, il existe de nombreuses régions candidates superposées. Aucune cellule n'est attribuée à cette étape. Une cellule peut appartenir à plusieurs régions candidates.

Pour sélectionner la ou les meilleures régions, un algorithme de sélection évalue toutes les régions candidates identifiées par la technique PRG pour trouver la configuration idéale en fonction des préférences suivantes :

Le critère Méthode d'évaluation spécifié, tel que la valeur moyenne la plus élevée, la somme la plus élevée ou la plus grande quantité de limites.
Le critère d’évaluation interrégion, tel qu’il est défini par les paramètres Distance maximale et Distance minimale.

Lorsque vous avez besoin de plusieurs régions, la méthode de sélection vous permet de mieux contrôler la façon dont les meilleures régions sont sélectionnées. Il s’agit de COMBINATORIAL et de SEQUENTIAL.

Si la méthode COMBINATORIAL est sélectionnée, toutes les combinaisons possibles du nombre de régions souhaitées sont évaluées. Par exemple, avec cette méthode, si le nombre de régions est défini sur huit et que le nombre potentiel de régions créées à partir de la technique PRG est de 150 000, toutes les combinaisons des huit régions disponibles dans les 150 000 régions candidates sont testées pour identifier les huit meilleures régions en fonction de la méthode d'évaluation et des contraintes spatiales. Il est possible que la meilleure région individuelle ne soit pas sélectionnée si elle n'appartient pas à la combinaison optimale des huit régions.
Si la méthode SEQUENTIAL est sélectionnée, la première région choisie est la meilleure région en fonction de la Méthode d’évaluation et celle qui répond aux contraintes spatiales. La deuxième région sélectionnée est la meilleure région suivante en fonction de la méthode d'évaluation et qui répond aux contraintes spatiales liées à la première région sélectionnée. Ce processus se poursuit jusqu'à ce que le nombre de régions soit atteint.

Les régions candidates peuvent se superposer, mais chaque cellule ne peut être attribuée qu'à une seule région. Une fois une région sélectionnée, les autres régions candidates contenant une cellule attribuée ne sont plus prises en compte dans le processus de sélection des régions suivantes. Les autres cellules de ces régions candidates sont toujours prises en compte pour les autres régions candidates.

Distribution des valeurs initiales

Pour limiter le temps de traitement, au lieu de faire grandir des régions à partir de chaque localisation de cellule disponible du raster en entrée, les régions candidates peuvent se développer à partir de localisations de cellules identifiées spécifiques appelés valeurs initiales. Le nombre de valeurs initiales à partir desquelles les régions peuvent se développer peut être contrôlé par le paramètre Nombre à partir duquel augmenter les valeurs initiales.

Le nombre spécifié de valeurs initiales est réparti dans tout le raster en fonction de la distribution spatiale des valeurs d'utilité au sein du raster en entrée. Cela signifie que les valeurs initiales sont plus nombreuses dans les zones du raster en entrée où les valeurs d'utilité sont les plus élevées. On suppose ici qu'il est probable que les meilleures régions se trouvent dans les zones du raster en entrée où les valeurs d'utilité sont les plus élevées.

Pour identifier les emplacements spécifiques des valeurs initiales, une distribution est créée à partir de toutes les cellules du raster en entrée et de leurs valeurs d'utilité. Les cellules à la valeur d'utilité la plus élevée constituent une plus grande proportion de la distribution. Une valeur est sélectionnée de manière aléatoire à partir de cette distribution afin d'identifier l'emplacement de cellule où une valeur initiale doit être située. Etant donné que les cellules possédant les valeurs d'utilité les plus élevées représentent une plus grande proportion de la distribution, il est probable que ces emplacements sont sélectionnés.

Un autre ajustement est effectué dans le but de s’assurer que les valeurs initiales ne sont pas trop proches les unes des autres. Le fait que la distribution des valeurs initiales d’une zone donnée est proportionnelle à l’utilité totale des cellules de cette zone.

Exemple de distribution de valeurs initiales

Pour un exemple simple, nous présentons un raster à quatre cellules possédant les valeurs d’utilité 1, 2, 3 et 4. Une distribution est créée à partir de ces quatre valeurs. La somme des valeurs des cellules est de 10. Les valeurs sont ensuite ajustées selon une échelle de 0 à 1. La cellule qui possède la valeur d’utilité 1 contribue à 10 % de la distribution (0 à 0,1 de la distribution), la cellule qui possède la valeur 2 contribue à 20 % (0,1 à 0,3 de la distribution), la cellule qui possède la valeur 3 contribue à 30 % (0,3 à 0,6 de la distribution) et la cellule qui possède la valeur 4 contribue à 40 % (0,6 à 1 de la distribution). Une valeur aléatoire comprise entre 0 et 1 est sélectionnée. Il y a 40 % de chances que cette valeur aléatoire tombe dans la plage 0,6 à 1 de la distribution, ce qui impliquerait de placer une valeur initiale à l'emplacement de cellule ayant la valeur 4, celle à l'utilité la plus élevée.

Ajustement de la résolution de croissance des régions en fonction de la taille des régions souhaitées

En plus d’utiliser le paramètre Nombre à partir duquel augmenter les valeurs initiales pour limiter le temps de traitement, vous pouvez également améliorer les performances grâce au paramètre Résolution de la croissance. Le paramètre Résolution de la croissance permet de demander à l’algorithme PRG de fonctionner dans une version intermédiaire plus grossière du raster en entrée. Dans ce cas, une fois sélectionnées à partir des régions candidates dans le raster intermédiaire, les régions souhaitées sont rééchantillonnées selon la taille de cellule pour produire le raster en sortie final. La résolution du raster intermédiaire est déterminée par le nombre de cellules associées à la résolution de la croissance spécifiée.

Pour garantir le fait que les régions obtenues contiennent suffisamment de cellules et pour limiter les traitements inutiles, un deuxième ajustement peut être effectué sur la résolution et le nombre total de cellules identifiées par chaque Résolution de la croissance cible du raster intermédiaire. En fonction de la résolution déterminée à partir de la résolution de la croissance spécifiée, le nombre de cellules dans la taille de région moyenne est identifié. La taille de région moyenne se calcule en divisant la surface totale souhaitée par le nombre spécifié de régions. Pour s'assurer que chaque région sélectionnée contient suffisamment de cellules, si la taille de région moyenne ne contient pas assez de cellules, la résolution du raster intermédiaire est affinée (la taille de cellule est réduite et donc le nombre de cellules augmente). Pour limiter les traitements inutiles, si la taille de région moyenne contient trop de cellules, la résolution du raster intermédiaire est diminuée.

Les seuils de détermination du nombre de cellules dans la taille de région moyenne reposent sur la résolution de la croissance sélectionnée. Par exemple, si l’option de résolution LOW est sélectionnée et que le nombre de cellules dans la taille de région moyenne est trop faible pour des résultats satisfaisants (pour cette sélection, moins de 1 800 cellules), la résolution du raster intermédiaire est affinée afin que la taille de région moyenne contienne au moins 1 800 cellules. On s'assure ainsi d'un nombre suffisant de cellules pour produire une région satisfaisante. Inversement, pour limiter les traitements inutiles, si la taille de région moyenne comporte plus de 5 400 cellules, la résolution du raster intermédiaire pour la résolution LOW est diminuée jusqu’à ce que la taille de région moyenne compte 5 400 cellules.

Ces mêmes ajustements ont lieu pour les sélections MEDIUM et HIGH de Résolution de la croissance, mais les seuils varient. Pour la résolution MEDIUM, le seuil inférieur de la taille de région moyenne est de 3 200 cellules et la limite supérieure est de 9 600 cellules. Pour la résolution HIGH, le seuil inférieur de la taille de région moyenne est de 7 200 cellules et la limite supérieure est de 21 600 cellules.

Suite à ce deuxième ajustement, le nombre total de cellules du raster rééchantillonné intermédiaire sur lequel le traitement PRG est effectué pour chaque Résolution de la croissance spécifiée peut être inférieur ou supérieur au nombre cible de cellules.

Détermination des régions lorsqu'une surface minimale et une surface maximale sont spécifiées

Lorsque les valeurs Zone minimale de la région et Zone maximale de la région sont spécifiées, il existe un trop grand nombre de combinaisons de régions à comparer si chaque taille de région possible entre la taille minimale et la taille maximale spécifiées est prise en compte à partir de chaque valeur initiale. Par conséquent, à partir de chaque valeur initiale, l’algorithme définit le nombre de régions dont la taille est comprise entre les valeurs minimale et maximale créées par le processus PRG et prises en compte dans le processus de sélection COMBINATORIAL et SEQUENTIAL pour identifier les meilleures régions.

Toutes les tailles de région sont générées à partir des tailles de région minimale, maximale et moyenne. Pour déterminer la taille de région moyenne, l’algorithme divise la surface totale par le nombre de régions spécifiées. La taille de région moyenne est la première taille de région générée à partir de chaque valeur initiale. Généralement, la taille de région moyenne est plus proche de l'une ou l'autre des tailles de zone minimale ou maximale spécifiées. Il s'agit de la plus grande distance entre l'Abs(maximale - moyenne) et l'Abs(minimale - moyenne). Cette valeur est appelée LargerDist.

Pour calculer l'intervalle de définition des tailles de région comprises entre la taille de région moyenne et la plus grande distance, on utilise la formule suivante :

StepInterval = LargerDist/(N - 1)

où N est le nombre de régions spécifiées.

En commençant à la taille de région moyenne, l’élément StepInterval est ajouté ou soustrait de manière séquentielle jusqu’à ce que la valeur de plus grande distance soit atteinte. Le même élément StepInterval est ajouté ou soustrait de manière séquentielle dans le sens opposé jusqu’à ce que la valeur de la plus petite distance soit atteinte.

Lors de cette étape de traitement, si le nombre de tailles de régions est inférieur à 4, deux tailles supplémentaires sont ajoutées entre chacune des valeurs existantes. Si le nombre de tailles est inférieur à 7, mais supérieur à 3, une taille supplémentaire est ajoutée entre chacune des valeurs existantes. Par conséquent, le nombre minimal de tailles de régions créées à partir de chaque valeur initiale est de 7 et, en fonction du nombre de régions spécifiées, le nombre maximal de tailles de régions est de 15.

Des exemples illustrant l'interaction de ces paramètres sont disponibles plus loin dans cette section.

Lorsque les valeurs Zone minimale de la région et Zone maximale de la région sont spécifiées, que le processus de sélection soit COMBINATORIAL ou SEQUENTIAL, chaque taille de région est prise en compte pour chaque valeur initiale en tant que région candidate et testée dans le processus de sélection pour l’identification des meilleures régions.

Si seule la valeur Zone minimale de la région est définie, et pas Zone maximale de la région, la zone maximale est déterminée à partir de la taille de zone minimale, de la zone totale et du nombre de régions spécifiées. Par exemple, la valeur Zone minimale de la région est définie sur 5 miles carrés, la zone totale sur 50 miles carrés et le nombre de régions sur 5. Pour déterminer la zone maximale possible, on suppose que 4 des régions sont de la taille de la zone minimale, dans notre exemple, 5 miles carrés, ce qui donne un total de 20 miles carrés. Ils restent 30 miles carrés, qui constituent la zone maximale la plus grande possible. Cette valeur est donc assignée. Une logique similaire s'applique lorsque seule la valeur Zone maximale de la région est spécifiée, mais la zone minimale doit être supérieure à 0.

Exemple 1

Dans cet exemple, les paramètres suivants sont définis :

Surface totale est défini sur 300 miles carrés
Nombre de régions est défini sur 6
Zone minimale de la région est défini sur 40 miles carrés
Zone maximale de la région est défini sur 100 miles carrés

La première taille de région créée par l’algorithme PRG est la taille de région moyenne. Pour cela, la surface totale est divisée par le nombre de régions, ici 50 miles carrés (300/6). LargerDist a pour valeur 50 (LargerDist = Abs(100 - 50)). StepInterval a pour valeur 10 (StepInterval = 50/(6 - 1)).

Pour identifier la deuxième taille de région créée à partir de chaque valeur initiale, on ajoute la valeur StepInterval à la taille de région moyenne (10 + 50), soit 60 miles carrés. On continue à ajouter la valeur StepInterval de 10 à la taille de région moyenne jusqu’à ce que la valeur de plus grande distance soit atteinte. On identifie ainsi les troisième, quatrième, cinquième et sixième tailles de régions, qui sont de 70, 80, 90 et 100 miles carrés. Pour finir, on soustrait de manière itérative la valeur StepInterval de la taille de région moyenne jusqu’à atteindre la valeur de plus petite distance, ce qui identifie la septième taille de région à créer, ici 40 miles carrés. Dans cet exemple, le nombre de régions créées à partir de chaque valeur initiale est de 7. Elles mesurent 40, 50, 60, 70, 80, 90 et 100 miles carrés.

Exemple 2

Dans cet exemple, les paramètres suivants sont définis :

Surface totale est défini sur 100 miles carrés
Nombre de régions est défini sur 4
Zone minimale de la région est défini sur 10 miles carrés
Zone maximale de la région est défini sur 60 miles carrés

La première taille de région créée par l’algorithme PRG est la taille de région moyenne. Pour cela, la surface totale est divisée par le nombre de régions, ici 25 miles carrés.

LargerDist a pour valeur 35 miles carrés (Abs(60 - 25)). StepInterval a pour valeur 11,6667 (35/(4 - 1)). Continuer à ajouter de manière itérative 11,6667 à la taille de région moyenne jusqu'à atteindre la valeur de plus grande distance génère les valeurs 36,6667, 48,3334 et 60. Soustraire la valeur StepInterval de la taille de région moyenne jusqu’à ce que la différence soit égale ou inférieure à la valeur minimale aboutit à 13,3333. Pour le moment, le nombre de régions est de 5. Elles mesurent 13,3333, 25, 36,6667, 48,3334 et 60. Notez que la valeur minimale ou maximale ayant créé la plus petite distance n'est pas assurée d'être incluse dans les tailles de région (dans cet exemple, 13,3333 - 11,6667 = 1,6666, qui est inférieur à 10). A nouveau, le nombre minimal de tailles de régions créées à partir de chaque valeur initiale est de 7 et le nombre maximal de tailles de régions est de 15. Etant donné que 5 est une valeur inférieure à la valeur minimale requise de 7, d'autres tailles de régions sont ajoutées entre chacune des 5 tailles de région. Dans cet exemple, le nombre de régions créées à partir de chaque valeur initiale est de 9. Elles mesurent 13,3333, 19,1667, 25, 30,8334, 36,6667, 42,5001, 48,3334, 54,1667 et 60 miles carrés.

Bibliographie

Brooks, Christopher J. 1997. A parameterized region growing programme for site allocation on raster suitability maps. International Journal of Geographic Information Science, 11:4, 375-396.

Brooks, Christopher J. 1997. A genetic algorithm for location optimal sites on raster suitability maps. Transactions in GIS, Vol. 2, No. 3, p 201-212.

Brooks, Christopher J. 1998. A genetic algorithm for designing optimal region configurations in GIS. Thèse préparée pour le diplôme de docteur en philosophie, à l'université de Londres.

Brooks, Christopher J. 2001. A genetic algorithm for designing optimal patch configurations in GIS. International Journal of Geographic Information Science, Vol. 15, No. 6, 539-559.

Li, Xia et Anthony Gar-On Yeh, 2005. Integration of genetic algorithms and GIS for optimal location search, International Journal of Geographic Information Science, Vol. 19, No. 5, 581-601.

Rubriques connexes

Vous avez un commentaire à formuler concernant cette rubrique ?