Como funciona a ferramenta Localizar Regiões

A ferramenta Localizar Regiões identifica as melhores regiões no raster de entrada que atendem aos requisitos de tamanho e restrições espaciais especificados. Regiões são grupos de células contíguas do mesmo valor. Alguns dos requisitos e restrições que podem ser definidos nesta ferramenta incluem: a área total a selecionar, o número de regiões entre as quais a área total deve ser distribuída, a forma das regiões desejadas e as distâncias mínima e máxima entre as regiões.

Localizar Regiões é frequentemente usado em conjunto com a ferramenta Conexões de Região Ideais para selecionar e depois juntar as melhores regiões disponíveis da forma mais eficiente. Para fazer esta análise, primeiro você precisa de uma superfície de adequação, que pode ser criada empregando outras ferramentas deste conjunto de ferramentas. A seguir, use Localizar Regiões para identificar as melhores regiões disponíveis. Finalmente, use Conexões de Região Ideais para determinar a rede de caminhos de menor custo entre as regiões. Para obter mais informações sobre como criar um modelo de adequação, consulte Compreendendo a análise de sobreposição.

Exemplos de problemas resolvidos por Localizar Regiões

Usando uma superfície criada a partir de um modelo de adequação, você pode identificar as melhores regiões para o seguinte:

  • O habitat de cervos mais preferido para conservar. Oito manchas de habitat (regiões) são necessárias para manter uma população viável e cada região deve ter aproximadamente 50 acres contíguos. Para apoiar as oportunidades de reprodução dentro do rebanho, as regiões devem estar suficientemente próximas umas das outras para que possam ser ligadas de forma viável através de corredores de vida selvagem.
  • Os melhores locais para extrair madeira para uma operação madeireira. Para serem financeiramente viáveis, as áreas (regiões) a serem exploradas devem ter pelo menos 250 acres contíguos e cada região deve estar a uma milha uma da outra.
  • A localização ideal para um novo centro comercial. O shopping center exige os melhores 60 hectares, porém, para fins de construção, a área precisa ser contígua e o formato do canteiro (região) deve ser o mais compacto possível.

Agrupando células em regiões

Existem seis maneiras principais de criar regiões a partir de células individuais no raster de adequação.

  • As células serão agrupadas em uma única região.
  • As células serão agrupadas em um número especificado de regiões de área igual.
  • As células serão agrupadas em um número especificado de regiões de área igual, respeitando as restrições de distância especificadas entre as regiões.
  • As células serão agrupadas em um número especificado de regiões de área igual, respeitando as restrições de distância especificadas entre as regiões.
  • As células serão agrupadas em um número específico de regiões de tamanhos variados, controladas pelos requisitos de área mínimo e máximo definidos para as regiões, e de modo que duas regiões não possam estar dentro de uma distância mínima identificada ou mais distante que uma distância máxima.
  • Igual à opção anterior, porém as regiões pré-existentes que já foram alocadas na área de estudo deverão ser consideradas no processo de seleção.

Algoritmo geral para localizar regiões

A ferramenta Localizar Regiões toma como entrada um raster em que os valores mais altos representam um maior grau de utilidade. A partir desse raster, a ferramenta seleciona as melhores regiões que atendem aos requisitos da região e às restrições espaciais especificadas.

Localizar regiões com esta ferramenta é um processo de quatro etapas. As quatro etapas gerais estão listadas abaixo com descrições detalhadas a seguir:

  1. Eliminar locais considerados inadequados para o processo seletivo. Exemplos de locais normalmente incluem aqueles dentro de corpos d'água, edifícios existentes e áreas muito íngremes. Esta é uma etapa de pré-processamento.
  2. Defina as características da região ou regiões desejadas. Exemplos dessas características incluem tamanho, forma e orientação. Esta etapa é alcançada definindo parâmetros na ferramenta.
  3. Identifique todas as regiões candidatas do raster de entrada com base na compensação definida pelo usuário entre manter o formato de uma região e maximizar a utilidade. Esta etapa é realizada através do algoritmo de crescimento de região implementado pela ferramenta.
  4. Selecione a melhor região ou regiões das regiões candidatas usando um critério de avaliação definido pelo usuário. Por exemplo, selecione apenas as regiões com o valor médio mais alto. Esta etapa é realizada dentro da ferramenta aplicando um algoritmo de seleção usando o método de avaliação especificado.

O algoritmo primário para identificar as regiões candidatas utiliza uma técnica de crescimento de região parametrizada (PRG) que trata cada célula identificada como uma semente potencial a partir da qual uma região crescerá. A seleção de quais células contíguas serão adicionadas a uma região é baseada na avaliação do compromisso entre a contribuição das células para manter a forma desejada da região em relação à utilidade (adequação) do valor do atributo das células. Quanto maior o valor do atributo, maior será a utilidade. As potenciais regiões candidatas continuarão a crescer até que os requisitos de área especificados para a região sejam cumpridos. Este processo de crescimento é realizado para cada origem. Cada região resultante é considerada uma opção candidata e nesta fase haverá muitas regiões candidatas sobrepostas. Nenhuma célula é alocada nesta etapa e uma célula pode ser membro de múltiplas regiões candidatas.

Para selecionar a melhor região ou regiões, um algoritmo de seleção avalia cada região candidata identificada pela técnica PRG para a configuração mais ideal com base nas seguintes preferências:

  • O critério do método de avaliação especificado, como o valor médio mais alto, a soma mais alta ou a maior quantidade de borda.
  • O critério de avaliação inter-regional, conforme definido pelos parâmetros Distância Máxima e Distância Mínima.

Quando múltiplas regiões são desejadas, o Método de seleção oferece controle adicional sobre como as melhores regiões são selecionadas. Estes são COMBINATORIAL e SEQUENTIAL.

  • Se o método COMBINATORIAL for selecionado, todo número possível de combinações do número desejado de regiões será avaliado. Por exemplo, com este método, se o Número de regiões for definido como oito, e o número potencial de regiões criadas a partir do PRG for 150.000, então todas as combinações de oito regiões disponíveis nas 150.000 regiões candidatas serão testadas para identificar as oito regiões ideais com base no Método de avaliação e as restrições espaciais. É possível que a melhor região não seja selecionada se não fizer parte da combinação ótima de oito regiões.
  • Se o método SEQUENTIAL for selecionado, a primeira região selecionada será a melhor região com base no Método de avaliação e que atenda às restrições espaciais. A segunda região selecionada será a próxima melhor região com base no método de avaliação e que atenda às restrições espaciais relativas à primeira região selecionada. Este processo continua até que o Número de regiões seja atingido.

As regiões candidatas podem sobrepor-se, no entanto, uma célula só pode ser alocada a uma região. Uma vez selecionada uma região, quaisquer regiões candidatas restantes que incluam uma célula alocada não serão mais consideradas no processo de seleção das regiões subsequentes. As outras células dentro dessas regiões candidatas ainda serão consideradas para outras regiões candidatas.

Como as origens são distribuídas

Para reduzir o tempo de processamento, em vez de cultivar regiões a partir de todas as localizações de células disponíveis no raster de entrada, as regiões candidatas podem ser cultivadas a partir de determinadas localizações de células identificadas, conhecidas como origens. O número de origens a partir das quais crescer regiões pode ser controlado pelo parâmetro Número de origens a crescer.

O número especificado de sementes é distribuído por todo o raster com base na distribuição espacial dos valores de utilidade no raster de entrada. Ou seja, mais origens estão localizadas em áreas do raster de entrada onde os valores de utilidade são mais altos. Supõe-se que é mais provável que as melhores regiões estejam localizadas em áreas onde os valores de utilidade do raster de entrada são mais elevados.

Para identificar as localizações específicas das origens, é criada uma distribuição a partir de todas as células raster de entrada e seus valores de utilidade. As células com alto valor de utilidade compreenderão uma proporção maior da distribuição. Um valor é selecionado aleatoriamente nesta distribuição para identificar a localização da célula onde uma origem deve estar localizada. Como as células com valores de utilidade mais elevados representam uma proporção maior da distribuição, é mais provável que estas localizações sejam selecionadas.

Um ajuste adicional é feito para garantir que as origens não estejam muito próximas umas das outras e ao mesmo tempo garantir que a distribuição do número de origens em uma determinada área seja proporcional à utilidade total das células naquela área.

Exemplo de distribuição de origens

Para um exemplo simplificado, temos um raster de quatro células com valores de utilidade 1, 2, 3 e 4. Uma distribuição é criada a partir dos quatro valores. A soma dos valores das células aqui é 10. Os valores são então ajustados para uma escala de 0 a 1. A célula com valor de utilidade 1 contribui com 10 porcento para a distribuição (0 a 0,1 da distribuição), a célula com valor de 2 contribui com 20 porcento (0,1 a 0,3 da distribuição), a célula com valor de 3 contribui com 30 porcento (0,3 a 0,6 da distribuição) e a célula com valor 4 contribui com 40 porcento (0,6 a 1 da distribuição). Um valor aleatório entre 0 e 1 é selecionado. Há uma chance de 40% de que o valor aleatório fique entre o intervalo de 0,6 a 1 da distribuição, o que significaria colocar uma origem no local da célula ao qual foi atribuído o valor 4, a célula com maior utilidade.

Ajustando a resolução de crescimento da região com base no tamanho das regiões desejadas

Além de usar o parâmetroNúmero de origens a crescer para reduzir o tempo de processamento, você também pode melhorar o desempenho usando o parâmetro Resolução de crescimento. Você pode usar o parâmetro Resolução de crescimento para direcionar o algoritmo PRG para crescer em uma versão intermediária mais grosseira do raster de entrada. Neste caso, uma vez selecionadas as regiões desejadas das regiões candidatas usando o raster intermediário, as regiões resultantes são reamostradas para o Tamanho da célula para produzir o raster de saída final. A resolução do raster intermediário é determinada pelo número de células associadas a Resolução do crescimento especificada.

Para garantir que haverá células suficientes em cada uma das regiões resultantes e para reduzir o processamento desnecessário, um segundo ajuste poderá ocorrer na resolução e no número total de células identificadas por cada alvo de Resolução do crescimento para o raster intermediário. Com base na resolução determinada a partir da Resolução do crescimento especificada, o número de células no tamanho médio da região é identificado. O tamanho médio da região é calculado dividindo a área total desejada pelo número especificado de regiões. Para garantir que haja células suficientes em cada região selecionada, se houver poucas células no tamanho médio da região, a resolução do raster intermediário será mais fina (o tamanho da célula será reduzido, portanto o número de células será aumentado). Para reduzir o processamento desnecessário, se houver muitas células no tamanho médio da região, a resolução do raster intermediário será reduzida.

Os limites para determinar se o número de células no tamanho médio da região é muito pequeno ou muito grande baseiam-se na Resolução do crescimento. selecionada Por exemplo, se a opção de resolução LOW for selecionada e o número de células no tamanho médio da região for muito baixo para resultados razoáveis, para esta seleção menos de 1.800 células, a resolução do raster intermediário será definida mais fina para que haja pelo menos pelo menos 1.800 células no tamanho médio da região. Isso garante que haja células suficientes para produzir uma região razoável. Por outro lado, para reduzir o processamento desnecessário, se houver mais de 5.400 células no tamanho médio da região, a resolução do raster intermediário para resolução LOW será reduzida até que haja 5.400 células no tamanho médio da região.

Esses mesmos ajustes ocorrem para as seleções MEDIUM e HIGH de Resolução de crescimento, mas os limites variam. Para resolução MEDIUM, o limite inferior para o tamanho médio da região é de 3.200 células e o limite superior é de 9.600 células. Para resolução HIGH, o limite inferior para o tamanho médio da região é de 7.200 células e o limite superior é de 21.600 células.

Como resultado deste segundo ajuste, o total de células para o raster reamostrado intermediário no qual o PRG será realizado para cada um das Resoluções de crescimento especificadas podem ser menor ou maior que o número alvo de células.

Como as regiões são determinadas quando uma área mínima e máxima são especificadas

Quando Área mínima da região e Área máxima da região forem especificados, haverá muitas combinações de regiões para comparar se cada tamanho de região possível entre o tamanho mínimo e máximo especificado for considerado em cada origem. Portanto, a partir de cada origem, o algoritmo define o número de regiões dimensionadas entre o mínimo e o máximo que são criadas pelo processo PRG e consideradas no processo de seleção COMBINATORIAL e SEQUENTIAL para identificar as melhores regiões.

Todos os tamanhos de região são gerados a partir dos tamanhos mínimo, máximo e médio de região. Para determinar o tamanho médio da região, o algoritmo divide a área total pelo número de regiões especificadas. O tamanho médio da região é o primeiro tamanho da região que será gerado a partir de cada origem. Geralmente, o tamanho médio da região estará mais próximo do tamanho mínimo ou máximo da área especificado. Ou seja, é a maior distância entre o Abs(máximo - média) ou Abs(mínimo - média). Este valor será denominado como LargerDist.

Para calcular o intervalo de etapas para definir os tamanhos das regiões que ficam entre o tamanho médio da região e a distância maior, a seguinte fórmula é usada:

StepInterval = LargerDist/(N - 1)
  • onde N é o número de regiões especificadas.

Começando pelo tamanho médio da região, o StepInterval é adicionado ou subtraído sequencialmente até que o valor maior da distância seja alcançado. O mesmo StepInterval é adicionado ou subtraído sequencialmente no sentido oposto até que o menor valor da distância seja alcançado.

Nesta etapa de processamento, se o número de tamanhos de região for menor que 4, dois tamanhos adicionais serão adicionados entre cada um dos valores existentes. Se o número de tamanhos for menor que 7, mas maior que 3, um tamanho adicional será adicionado entre cada um dos valores existentes. Como resultado, o número mínimo de tamanhos de regiões que serão criados a partir de cada origem é 7 e, dependendo do número de regiões especificado, o número máximo de tamanhos de regiões é 15.

Alguns exemplos que mostram a interação desses parâmetros estão disponíveis mais adiante nesta seção.

Quando a Área mínima da região e Área máxima da região são especificadas, durante o processo de seleção COMBINATORIAL ou SEQUENTIAL, cada um dos tamanhos de região é considerado para cada origem como uma região candidata e é testado no processo de seleção para identificar as melhores regiões.

Se apenas uma Área mínima da região for especificado e nenhuma Área máxima da região for identificada, a área máxima é determinada a partir do tamanho mínimo da área, da área total e do número de regiões especificadas. Por exemplo, a Área mínima da região é definida como 5 milhas quadradas, a área total como 50 milhas quadradas e o número de regiões como 5. A área máxima possível é determinada assumindo que 4 das regiões têm o tamanho da área mínima, no nosso exemplo, 5 milhas quadradas, o que totaliza 20 milhas quadradas. Restam trinta milhas quadradas, que é a maior área máxima possível, por isso será atribuída. Lógica semelhante é aplicada quando apenas uma Área máxima da região for especificada, mas a área mínima deve ser maior que 0.

Exemplo 1

Neste exemplo, os seguintes parâmetros são definidos:

  • Área total está definida para 300 milhas quadradas
  • O número de regiões está definido como 6
  • A área mínima da região está definida para 40 milhas quadradas
  • A área máxima da região está definida para 100 milhas quadradas

O primeiro tamanho de região que será criado pelo PRG é o tamanho médio da região, que é determinado dividindo a área total pelo número de regiões; 50 milhas quadradas (300/6). O LargerDist é 50 (LargerDist = Abs(100 - 50)). O StepInterval é 10 (StepInterval = 50/(6 - 1)).

Para identificar o tamanho da segunda região a ser criada a partir de cada origem é determinado adicionando o StepInterval ao tamanho médio da região (10 + 50), ou seja, 60 milhas quadradas. Continuando a adicionar StepInterval de 10 ao tamanho médio da região até que o valor de distância maior seja alcançado. Isso identifica os tamanhos da terceira, quarta, quinta e sexta região, que são 70, 80, 90 e 100 milhas quadradas. Finalmente, subtrair iterativamente o StepInterval do tamanho médio da região até que o valor de distância menor seja alcançado identifica o sétimo tamanho da região a ser criado; neste caso, 40 milhas quadradas. Neste exemplo, o número de regiões que serão criadas a partir de cada semente é 7; eles têm 40, 50, 60, 70, 80, 90 e 100 milhas quadradas.

Exemplo 2

Neste exemplo, os seguintes parâmetros são definidos:

  • Área total está definida para 100 milhas quadradas
  • O número de regiões está definido como 4
  • A área mínima da região está definida para 10 milhas quadradas
  • A área máxima da região está definida para 60 milhas quadradas

O primeiro tamanho de região que será criado pelo PRG é o tamanho médio da região que é determinado dividindo a área total pelo número de regiões; 25 milhas quadradas.

O LargerDist é de 35 milhas quadradas (Abs(60 - 25)). O StepInterval é 11.6667 (35/(4 - 1)). Adicionar iterativamente 11,6667 ao tamanho médio da região até que o valor de distância maior seja alcançado resulta em valores de 36,6667, 48,3334 e 60. A subtração de StepInterval do tamanho médio da região até que a diferença seja igual ou fique abaixo do mínimo resulta em 13,3333. Até agora, o número de tamanhos de região é 5; eles são 13,3333, 25, 36,6667, 48,3334 e 60. Observe que não é garantido que o valor mínimo ou máximo que criou a distância menor seja incluído nos tamanhos da região (neste exemplo, 13,3333 - 11,6667 = 1,6666, que é menor que 10). Novamente, o número mínimo de tamanhos de região que serão criados a partir de cada origem é 7 e o número máximo de tamanhos de região é 15. Como 5 é menor que o mínimo exigido de 7, tamanhos de regiões adicionais são adicionados entre cada um dos 5 tamanhos de região. Neste exemplo, o número de regiões que serão criadas a partir de cada origem é 9; eles são 13,3333, 19,1667, 25, 30,8334, 36,6667, 42,5001, 48,3334, 54,1667 e 60 milhas quadradas.

Referências

Brooks, Christopher J. 1997. Um programa de crescimento de regiões parametrizadas para alocação de locais em mapas de adequação raster. International Journal of Geographic Information Science, 11:4, 375-396.

Brooks, Christopher J. 1997. Um algoritmo genético para localização ideal de locais em mapas de adequação raster. Transactions in GIS, Vol. 2, No. 3, p 201-212.

Brooks, Christopher J. 1998. Um algoritmo genético para projetar configurações de região ideais em GIS. Tese apresentada para o grau de Doutor em Filosofia, University College, Universidade de Londres, Londres.

Brooks, Christopher J. 2001. Um algoritmo genético para projetar configurações ideais de patches em GIS. International Journal of Geographic Information Science, Vol. 15, No. 6, 539-559.

Li, Xia and Anthony Gar-On Yeh, 2005. Integração de algoritmos genéticos e GIS para busca ideal de localizaçãoh, International Journal of Geographic Information Science, Vol. 19, No. 5, 581-601.