Funzionamento di Individua regioni

Lo strumento Individua regioni identifica nel raster di input le regioni migliori che soddisfano i requisiti dimensionali e i vincoli spaziali specificati. Le regioni sono gruppi di celle contigue dello stesso valore. Alcuni requisiti e vincoli che possono essere definiti in questo strumenti sono: l'area totale da selezionare, il numero di regioni tra cui occorre distribuire l'area totale, la forma delle regioni desiderate e le distanze minima e massima tra le regioni.

Individua regioni viene spesso utilizzato in combinazione con lo strumento Connessioni ottimali tra regioni per selezionare e poi unire le migliori regioni disponibili nel modo più efficiente. Per eseguire quest'analisi, è innanzitutto necessaria una superficie di idoneità, che è possibile creare utilizzando altri strumenti dell'insieme di strumenti. Utilizzare quindi Individua regioni per identificare le migliori regioni disponibili. Infine, utilizza Connessioni ottimali tra regioni per determinare la rete di percorsi a costo minimo tra le regioni. Per ulteriori informazioni sulla creazione di un modello di idoneità, vedere Analisi di overlay.

Problemi di esempio risolti con Individua regioni

Utilizzando una superficie creata da un modello di idoneità è possibile identificare le regioni migliori per i seguenti scopi:

  • L'habitat dei cervi preferito da conservare. Per mantenere una popolazione vitale sono necessarie otto aree di habitat (regioni) e ogni regione deve essere pari a circa 50 acri contigui. Per sostenere le opportunità di riproduzione all'interno della mandria, le regioni dovrebbero trovarsi ad una distanza sufficientemente ravvicinata l'una dall'altra, in modo da poter essere collegate in modo fattibile attraverso corridoi per la fauna selvatica.
  • Le posizioni migliori per estrarre il legname per un'operazione di taglio. Per essere finanziariamente sostenibili, le aree (regioni) da disboscare devono essere pari ad almeno 250 acri contigui e ogni regione deve trovarsi a un miglio di distanza l'una dall'altra.
  • La posizione ideale per un nuovo centro commerciale. Il centro commerciale richiede i migliori 60 acri, tuttavia, ai fini della costruzione, l'area deve essere contigua e la forma del cantiere (regione) deve risultare il più compatta possibile.

Raggruppamento di celle in regioni

Esistono sei modi principali tramite cui creare regioni da singole celle nel raster di idoneità.

  • Le celle vengono raggruppate in una singola regione.
  • Le celle vengono raggruppate in un numero specificato di regioni di uguale area.
  • Le celle vengono raggruppate in un numero specificato di regioni di uguale area rispettando vincoli di distanza specificati tra le regioni.
  • Le celle vengono raggruppate in un numero specificato di regioni di dimensione variabile, controllate da requisiti di area minima e massima per le regioni.
  • Le celle vengono raggruppate in un numero specificato di regioni di dimensioni variabili, controllate da requisiti di area minima e massima per le regioni e in modo che due regioni non possano trovarsi entro una distanza minima o oltre una distanza massima identificate.
  • Uguale all'opzione precedente, ma le regioni preesistenti già allocate nell'area di studio devono essere considerate nel processo di selezione.

Algoritmo generale per Individua regioni

Lo strumento Individua regioni prende come input un raster in cui i valori più alti rappresentano un grado maggiore di utilità. Da tale raster, lo strumento seleziona le migliori regioni che soddisfano i requisiti di regione e i vincoli spaziali specificati.

L'individuazione delle regioni con questo strumento è un processo in quattro fasi. Le quattro fasi generali sono indicate e descritte di seguito:

  1. Eliminare le posizioni considerate non idonee per il processo di selezione. Esempi di questo tipo di posizioni sono specchi d'acqua, edifici esistenti e aree troppo ripide. Questa è una fase di pre-elaborazione.
  2. Definire le caratteristiche della regione o regioni desiderate. Esempi di caratteristiche sono forma, dimensioni e orientamento. Questa fase viene eseguita impostando parametri nello strumento.
  3. Identificare tutte le regione candidate dal raster di input in base al compromesso definito dall'utente tra il mantenimento della forma di una regione e la massima utilità. Questa fase viene completata tramite l'algoritmo di crescita della regione implementato dallo strumento.
  4. Selezionare la regione o le regioni migliori tra le regioni candidate utilizzando un criterio di valutazione definito dall'utente. Ad esempio, selezionare solo le regioni con il valore medio più alto. Questa fase viene svolta nello strumento applicando un algoritmo di selezione tramite un metodo di valutazione specificato.

L'algoritmo principale per l'identificazione delle regioni candidate utilizza una tecnica di crescita della regione basata su parametri (PRG) che tratta ogni cella identificata come seme potenziale da cui crescerà una regione. La selezione delle celle contigue da aggiungere a una regione si basa sulla valutazione del compromesso tra il contributo delle celle al mantenimento della forma desiderata della regione e l'utilità (idoneità) del valore dell'attributo delle celle. Più alto è il valore dell'attributo, maggiore è l'utilità. Le regioni candidate potenziali continueranno a crescere finché non vengono soddisfatti i requisiti di area specificati per la regione. Questo processo di crescita è preformato per ogni seme. Ogni regione risultante è considerata un'opzione di candidato e in questa fase esisteranno molte regioni candidate sovrapposte. Nessuna cella viene allocata in questa fase e una cella può essere membro di più regioni candidate.

Per selezionare la regione o le regioni migliori, un algoritmo di selezione valuta ogni regione candidata identificata dalla tecnica PRG per la configurazione migliore in base alle seguenti preferenze:

  • Il criterio Metodo di valutazione specificato, ad esempio il valore medio più alto, la somma maggiore o la maggiore quantità di bordi.
  • Il criterio di valutazione tra regioni, definito con i parametri Distanza massima e Distanza minima.

Quando si desiderano più regioni, il Metodo di selezione fornisce ulteriore controllo sulla modalità di selezione delle regioni migliori. I metodi sono COMBINATORIAL e SEQUENTIAL.

  • Se si seleziona il metodo COMBINATORIAL, vengono valutate tutte le combinazioni possibili del numero desiderato di regioni. Ad esempio, con questo metodo, se il Numero di regioni è impostato su otto e il numero potenziale di regioni create dal processo PRG è 150.000, vengono testate tutte le combinazioni di otto regioni disponibili nelle 150.000 regioni candidate per identificare le otto regioni ottimali in base al Metodo di valutazione e ai vincoli spaziali. È possibile che la singola regione migliore non venga selezionata se non fa parte della combinazione ottimale di otto regioni.
  • Se viene selezionato il metodo SEQUENTIAL, la prima regione selezionata sarà la regione migliore in base al Metodo di valutazione che soddisfa i vincoli spaziali. La seconda regione selezionata sarà la regione migliore successiva in base al metodo di valutazione che soddisfa i vincoli spaziali rispetto alla prima regione selezionata. Questo processo continua fino al raggiungimento del Numero di regioni.

Le regioni candidate possono sovrapporsi, ma una cella può essere allocata a una sola regione. Una volta selezionata una regione, tutte le regioni candidate rimanenti che includono una cella allocala non saranno più considerate nel processo di selezione delle regioni successive. Le altre celle entro le regioni candidate saranno ancora considerate per altre regioni candidate.

Distribuzione dei semi

Per ridurre il tempo di elaborazione, anziché allargare le regioni da ogni posizione di cella disponibile nel raster di input, le regioni candidate possono ingrandirsi da determinate posizioni di celle identificate note come semi. Il numero di semi da cui ingrandire le regioni può essere controllato dal parametro Numero di semi da cui crescere.

Il numero di semi specificato viene distribuito nel raster in base alla distribuzione spaziale e ai valori di utilità nel raster di input. In altre parole, i semi sono più numerosi nelle aree del raster di input in cui i valori di utilità sono più alti. Si presume che è più probabile che le regioni migliori siano situate in aree in cui i valori di utilità del raster di input sono più alti.

Per identificare le specifiche posizioni dei semi, viene creata una distribuzione da tutte le celle del raster di input e relativi valori di utilità. Le celle con un valore di utilità elevato, comprenderanno una parte maggiore della distribuzione. Un valore selezionato in modo casuale da questa distribuzione per identificare la posizione della cella in cui deve essere situato un seme. Poiché le celle con valori di utilità più alti rappresentano una parte maggiore della distribuzione, è più probabile che vengano selezionate queste posizioni.

Un'ulteriore regolazione viene effettuata per garantire che i semi non siano troppo vicini e accertarsi che la distribuzione del numero di semi in una data area sia proporzionale all'utilità totale delle celle in tale area.

Esempio di distribuzione dei semi

Per un esempio semplificato, si consideri un raster a quattro celle con valori di utilità 1, 2, 3 e 4. Viene creata una distribuzione dai quattro valori. La somma di valori delle celle è 10. I valori vengono quindi regolati su una scala da 0 a 1. La cella con valore di utilità 1 contribuisce per il 10% alla distribuzione (da 0 a 0,1 della distribuzione), la cella con valore 2 contribuisce per il 20% (da 0,1 a 0,3 della distribuzione), la cella con valore 3 contribuisce per il 30% (da 0,3 a 0,6 della distribuzione) e la cella con valore 4 contribuisce per il 40% (da 0,6 a 1 della distribuzione). Viene selezionato un valore casuale compreso tra 0 e 1. Esiste una possibilità del 40% che il valore casuale ricada nell'intervallo 0,6-1 della distribuzione, che comporterebbe la collocazione di un seme nella posizione della cella con il valore 4 assegnato, la cella con l'utilità maggiore.

Regolazione della risoluzione di crescita della regione in base alle dimensioni delle regioni desiderate

Oltre a utilizzare il parametro Numero di semi da cui crescere per ridurre il tempo di elaborazione, è anche possibile migliorare le prestazioni utilizzando il parametro Risoluzione della crescita . È possibile utilizzare il parametro Risoluzione della crescita per indicare all'algoritmo PRG di determinare la crescita in base a una versione intermedia più grossolana del raster di input. In questo caso, una volta selezionate le regioni desiderate dalle regioni candidate utilizzando il raster intermedio, le regioni risultanti vengono ricampionate in base alla Dimensione cella per produrre il raster di output finale. La risoluzione del raster intermedio è determinata dal numero di celle associate alla Risoluzione della crescita specificata.

Per garantire che saranno presenti celle sufficienti in ciascuna delle regioni risultanti e per ridurre l'elaborazione superflua, potrebbe verificarsi una seconda regolazione della risoluzione e del numero totale di celle identificate da ogni Risoluzione della crescita target per il raster intermedio. A seconda della risoluzione determinata dalla Risoluzione della crescita specificata, viene identificato il numero di celle nella dimensione della regione media. La dimensione della regione media viene calcolata dividendo l'area totale desiderata per il numero specificato di regioni. Per garantire che siano presenti celle sufficienti in ciascuna regione selezionata, se le celle sono troppo poche nella dimensione della regione media, la risoluzione del raster intermedio viene resa più fine (la dimensione cella viene ridotta in modo che il numero di celle aumenti). Per ridurre l'elaborazione insufficiente, se sono presenti troppe celle nella dimensione della regione media, la risoluzione del raster medio viene resa più grossolana.

Le soglie per determinare se il numero di celle nella dimensione della regione media è troppo esiguo o troppo grande si basano sulla Risoluzione della crescita selezionata. Ad esempio, se si seleziona l'opzione di risoluzione LOW e il numero di celle nella dimensione della regione media è troppo esiguo ottenere risultati accettabili, per questa selezione meno di 1.800 celle, la risoluzione del raster intermedio diventerà più fine in modo che la dimensione della regione media contenga almeno 1.800 celle. In tal modo si garantisce la presenza di un numero di celle sufficiente a produrre una regione soddisfacente. Al contrario, per ridurre l'elaborazione superflue, se sono presenti più di 5.400 celle nella dimensione della regione media, la risoluzione del raster intermedio per la risoluzione LOW diventerà più grossolana fino a ottenere 5.400 celle nella dimensione della regione media.

Queste stesse regolazioni si verificano per le selezioni MEDIUM e HIGH di Risoluzione della crescita, ma le soglie variano. Per la risoluzione MEDIUM la soglia più bassa per la dimensione della regione media è 3.200 celle e quella più alta è 9.600 celle. Per la risoluzione HIGH la soglia più bassa per la dimensione della regione media è 7.200 celle e il limite massimo è 21.600 celle.

In conseguenza della seconda regolazione, il totale delle celle per il raster intermedio ricampionato su cui sarà eseguita la tecnica PRG per ogni Risoluzione della crescita specificata può essere inferiore o superiore al numero di celle target.

Determinazione delle regioni quando sono specificate un'area minima e un'area massima

Quando Area minima regione e Area massima regione sono specificate, sono presenti troppe combinazioni di regioni da confrontare se viene considerata ogni possibile dimensione di regione tra la dimensione minima e quella massima da ogni seme. Di conseguenza, da ogni seme, l'algoritmo definisce il numero di regioni dimensionate tra il limite minimo e il limite massimo create dal processo PRG e considerate dal processo di selezione COMBINATORIAL e SEQUENTIAL per identificare le regioni migliori.

Tutte le dimensioni di regione vengono generate dalle dimensioni minima, massima e media. Per stabilire la dimensione della regione media, l'algoritmo divide l'area totale per il numero di regioni specificato. La dimensione della regione media è la prima ad essere generata da ogni seme. In generale, la dimensione della regione media è più vicina alla dimensione dell'area minima o quella massima specificata. In altre parole, è la distanza maggiore tra Abs(maximum - average) o Abs(minimum - average). Questo valore viene indicato comeLargerDist.

Per calcolare l'intervallo di fasi per definire le dimensioni delle regioni tra la dimensione della regione media e la distanza massima, viene utilizzata la seguente formula:

StepInterval = LargerDist/(N - 1)
  • dove N è il numero di regioni specificate.

A partire dalla dimensione della regione media, StepInterval viene aggiunto o sottratto in sequenza finché non viene raggiunto il valore della distanza maggiore. Lo stesso StepInterval viene aggiunto o sottratto in sequenza nella direzione opposta finché non viene raggiunto il valore della distanza minore.

In questa fase di elaborazione, se il numero delle dimensioni di regione è inferiore a 4, due ulteriori dimensioni vengono aggiunte tra tutti i valori esistenti. Se il numero di dimensioni è inferiore a 7 ma maggiore di 3, un'ulteriore dimensione viene aggiunta tra i valori esistenti. Di conseguenza, il numero minimo di dimensioni di regione che saranno create per ogni seme è 7 e, a seconda del numero di regioni specificato, il numero massimo di dimensioni di regioni è 15.

Alcuni esempi che mostrano l'interazione di questi parametri sono disponibili più avanti in questa sezione.

Quando Area minima regione e Area massima regione sono specificate, durante il processo di selezione COMBINATORIAL o SEQUENTIAL, ciascuna delle dimensioni di regione viene considerata per ogni seme come regione candidata e testata nel processo di selezione per identificare le regioni migliori.

Se è stata specificata solo una Area minima regione ma nessuna Area massima regione, l'area massima è determinata dalla dimensione dell'area minima, dall'area totale e dal numero di regioni specificato. Ad esempio, l'Area minima regione è impostata su 5 miglia quadrate, l'area totale su 50 miglia quadrate e il numero di regioni su 5. L'area massima possibile viene determinata presumendo che 4 regioni siano della dimensione dell'area minima, nel nostro esempio 5 miglia quadrate per un totale di 20 miglia. Restano 30 miglia quadrate, che è l'area massima maggiore possibile, che quindi viene assegnata. Una logica simile viene applicata quando è specificata solo una Area massima regione, ma l'area minima deve essere maggiore di 0.

Esempio 1

In questo esempio vengono impostati i seguenti parametri:

  • Area totale: 300 miglia quadrate
  • Numero di regioni: 6
  • Aera minima regione: 40 miglia quadrate
  • Area massima regione: 100 miglia quadrate

La prima dimensione di regione che sarà creata dal processo PRG è la dimensione della regione media, che viene determinata dividendo l'area totale per il numero di regioni, quindi 50 miglia quadrate (300/6). LargerDist è 50 (LargerDist = Abs(100 - 50)). StepInterval è 10 (StepInterval = 50/(6 - 1)).

Per identificare la seconda dimensione di regione da creare da ogni seme, si aggiunge StepInterval alla dimensione della regione media (10 + 50), quindi 60 miglia quadrate. Si continua ad aggiungere StepInterval di 10 alla dimensione della regione media fino a raggiungere il valore della distanza maggiore. In tal modo si identificano la terza, la quarta, la quinta e la sesta dimensione di regione: 70, 80, 90 e 100 miglia quadrate. Infine, sottraendo iterativamente StepInterval dalla dimensione della regione media fino a raggiungere il valore della distanza più piccola si identifica la settima dimensione di regione da creare, in questo caso 40 miglia quadrate. In questo esempio, il numero di regioni da creare da ogni seme è 7 con dimensioni di 40, 50, 60, 70, 80, 90 e 100 miglia quadrate.

Esempio 2

In questo esempio vengono impostati i seguenti parametri:

  • Area totale: 100 miglia quadrate
  • Numero di regioni: 4
  • Aera minima regione: 10 miglia quadrate
  • Area massima regione: 60 miglia quadrate

La prima dimensione di regione che sarà creata dal processo PRG è la dimensione della regione media, che viene determinata dividendo l'area totale per il numero di regioni, quindi 25 miglia quadrate.

LargerDist è 35 miglia quadrate (Abs(60 - 25)). StepInterval è 11,6667 (35/(4 - 1)). Aggiungendo iterativamente 11,6667 alla dimensione della regione media fino a raggiungere il valore della distanza maggiore si ottengono i valori 36,6667, 48.3334 e 60. Sottraendo StepInterval dalla dimensione della regione media finché la differenza è uguale o inferiore al minimo, si ottiene 13,3333. Finora, il numero di dimensioni di regione è 5: 13,3333, 25, 36,6667, 48,3334 e 60. Tenere presente che non è garantita l'inclusione del valore minimo o massimo che ha creato la distanza più piccola nelle dimensione di regione (in questo esempio, 13.3333 - 11.6667 = 1.6666, cioè meno di 10). Di nuovo, il numero di dimensioni di regione che sarà creato da ogni seme è 7 e il numero massimo di dimensioni di regione è 15. Poiché 5 è inferiore al minimo richiesto di 7, ulteriori dimensioni di regioni vengono aggiunte tra le 5 dimensioni di regione. In questo esempio, il numero di regioni da creare da ogni seme è 9 con dimensioni di 13,3333, 19,1667, 25, 30,8334, 36,6667, 42,5001, 48,3334, 54,1667 e 60 miglia quadrate.

Riferimenti

Brooks, Christopher J. 1997. A parameterized region growing programme for site allocation on raster suitability maps. International Journal of Geographic Information Science, 11:4, 375-396.

Brooks, Christopher J. 1997. A genetic algorithm for location optimal sites on raster suitability maps. Transactions in GIS, Vol. 2, No. 3, p 201-212.

Brooks, Christopher J. 1998. A genetic algorithm for designing optimal region configurations in GIS. A thesis submitted for the degree of Doctor of Philosophy, University College, University of London, London.

Brooks, Christopher J. 2001. A genetic algorithm for designing optimal patch configurations in GIS. International Journal of Geographic Information Science, Vol. 15, No. 6, 539-559.

Li, Xia and Anthony Gar-On Yeh, 2005. Integration of genetic algorithms and GIS for optimal location search, International Journal of Geographic Information Science, Vol. 19, No. 5, 581-601.