지역 찾기 도구 작동 방식

지역 찾기는 입력 래스터에서 지정된 크기 요구 사항 및 공간 제약 조건을 충족하는 최적의 지역을 식별하는 도구입니다. 지역은 동일한 값을 지닌 인접 셀의 그룹입니다. 이 도구에서 정의할 수 있는 요구 사항 및 제약 조건으로는 선택할 총 면적, 총 면적이 분산되어야 할 지역의 수, 원하는 지역의 쉐이프, 지역 간 최소 및 최대 거리 등이 있습니다.

지역 찾기는 사용 가능한 최적의 지역을 가장 효율적인 방식으로 선택하고 조인할 수 있도록 최적 영역 연결 도구와 함께 사용하는 경우가 많습니다. 이 분석을 수행하려면 먼저 적합성 표면이 필요합니다. 이 표면은 이 도구집합의 다른 도구를 사용해 생성할 수 있습니다. 그런 다음 지역 찾기를 사용해 사용 가능한 최적의 지역을 식별합니다. 마지막으로 최적 영역 연결을 사용해 영역 간의 최저 비용 경로 네트워크를 파악합니다. 적합성 모델을 생성하는 방법에 대한 자세한 내용은 중첩 분석 이해를 참고하세요.

지역 찾기를 통해 해결할 수 있는 문제 예시

적합성 모델로 생성한 표면을 사용하면 다음과 같은 상황에서 최적의 지역을 식별할 수 있습니다.

  • 보전 지역으로 가장 선호되는 사슴 서식지. 가능한 개체 수를 유지하려면 8개의 서식지 영역(지역)이 필요하며 각 지역은 약 50에이커(인접 상태)여야 합니다. 무리 내에서의 번식을 지원하기 위해, 해당 지역들은 야생 생물 이동 통로를 통해 연결될 수 있도록 서로 충분히 가까워야 합니다.
  • 벌목 작업을 위해 목재를 추출할 최적의 위치. 재정적으로 가능하도록, 벌목할 면적(지역)은 인접 상태로 최소 250에이커(인접 상태)여야 하며 다른 지역으로부터 1마일 이내에 있어야 합니다.
  • 새 쇼핑 센터를 지을 이상적인 위치. 쇼핑 센터에는 최적의 60에이커가 필요하지만, 건설 용도로 면적이 인접해 있어야 하며 건물 부지(지역)의 모양은 최대한 작고 치밀하게 구성되어야 합니다.

셀을 지역으로 그룹화

적합성 래스터의 개별 셀에서 지역을 생성하는 기본적인 방법은 다음 6가지입니다.

  • 셀을 단일 지역으로 그룹화합니다.
  • 셀을 지정된 수의 동일 면적 지역으로 그룹화합니다.
  • 셀을 지정된 지역 간 거리 제약 조건을 준수하는 지정된 수의 동일 면적 지역으로 그룹화합니다.
  • 셀을 지역에 대해 정의된 최소 및 최대 면적 요구 사항으로 제어되는, 지정된 수의 크기가 다양한 지역으로 그룹화합니다.
  • 셀을 지역에 대해 정의된 최소 및 최대 면적 요구 사항으로 제어되며 어떤 두 지역도 식별된 최소 거리보다 가깝거나 최대 거리보다 멀지 않은, 지정된 수의 크기가 다양한 지역으로 그룹화합니다.
  • 이전 옵션과 동일하지만, 선택 프로세스에서 연구 면적에 이미 할당된 기존 지역을 고려해야 합니다.

지역 찾기를 위한 일반 알고리즘

지역 찾기는 값이 높으면 유틸리티 수준도 더 높은 것을 뜻하는 래스터를 입력으로 취합니다. 이 도구는 지정된 지역 요구 사항 및 공간 제약 조건을 충족하는 최적의 지역을 해당 래스터에서 선택합니다.

이 도구로 지역을 찾는 프로세스는 4단계로 이루어져 있습니다. 이러한 일반적인 4단계는 자세한 설명과 함께 아래에 나와 있습니다.

  1. 선택 프로세스에 적합하지 않다고 판단되는 위치는 제거합니다. 일반적으로 이러한 위치의 예시로는 수역 내에 있는 위치, 기존 건물, 너무 가파른 영역 등이 있습니다. 이 단계는 전처리 단계입니다.
  2. 원하는 지역의 특성을 정의합니다. 이러한 특성의 예시로는 지역의 크기, 형태, 방향이 있습니다. 이 단계는 도구에서 매개변수를 설정하여 수행됩니다.
  3. 유틸리티를 극대화하는 것과 지역의 쉐이프를 유지하는 것 간의 사용자 정의 맞교환을 기반으로 입력 래스터에서 모든 후보 지역을 식별합니다. 이 단계는 도구로 구현된 지역 성장 알고리즘을 통해 수행됩니다.
  4. 사용자 정의 평가 기준을 사용해 후보 지역 중 최적의 지역을 선택합니다. 예를 들어, 평균값이 가장 높은 지역만 선택할 수 있습니다. 이 단계는 지정된 평가 방법을 사용하는 선택 알고리즘을 적용하여 도구 내에서 수행됩니다.

후보 지역 식별을 위한 주요 알고리즘은 매개변수화된 지역 성장(PRG) 기법을 사용합니다. 이 기법은 식별된 각 셀을 지역이 성장하게 될 잠재적 시드로 취급합니다. 지역에 추가될 인접 셀은 셀의 속성 값의 유틸리티(적합성)와 관련해 원하는 지역 쉐이프를 유지하는 것에 대한 셀의 기여도 간의 맞교환을 평가하여 선택됩니다. 속성 값이 높을수록 유틸리티가 큽니다. 잠재적 후보 지역은 해당 지역에 지정된 면적 요구 사항이 충족될 때까지 계속 성장합니다. 이 성장 프로세스는 각 시드에 대해 진행됩니다. 각 결과 지역은 후보 옵션으로 간주되며, 이 단계에는 서로 중첩되는 후보 지역이 여러 개 있습니다. 이 단계에서는 셀이 할당되지 않으며 하나의 셀이 여러 후보 지역의 구성원이 될 수 있습니다.

최적의 지역을 선택하기 위해, 선택 알고리즘은 PRG 기술이 가장 적합한 구성으로 식별한 각 후보 지역을 다음 선호도를 기반으로 평가합니다.

  • 최고 평균값, 최고 합계, 최대 엣지 양 등의 지정된 평가 방법.
  • 최대 거리최소 거리로 정의되는 지역 간 평가 기준.

여러 지역이 필요한 경우 선택 방법을 이용해 최적의 지역 선택 방법을 추가로 제어할 수 있습니다. 이러한 방법은 COMBINATORIALSEQUENTIAL입니다.

  • COMBINATORIAL 방법을 선택하면 원하는 지역 수의 가능한 모든 조합이 평가됩니다. 예를 들어, 이 방법을 사용하면 지역 수가 8개로 설정되었고 PRG에서 생성된 잠재적 지역의 수가 15만 개일 경우 해당 15만 개의 후보 지역에서 사용 가능한 8개 지역의 모든 조합을 테스트해 평가 방법과 공간 제약 조건을 기반으로 최적의 8개 지역을 식별합니다. 8개 지역의 최적 조합에 포함되지 않는 단일 최적 지역은 선택되지 않을 수 있습니다.
  • SEQUENTIAL 방법을 선택하면 처음으로 선택된 지역이 평가 방법을 기반으로 한 최적의 지역이자 공간 제약 조건을 충족하는 지역이 됩니다. 두 번째로 선택된 지역은 공간 제약 조건을 충족하며 평가 방법을 기반으로 처음으로 선택된 지역 다음으로 최적인 지역이 됩니다. 이 프로세스는 지역 수가 충족될 때까지 계속됩니다.

후보 지역은 중첩될 수 있지만 셀은 하나의 지역에만 할당될 수 있습니다. 지역 하나가 선택되면 할당된 셀이 포함된 모든 나머지 후보 지역은 후속 지역 선택 프로세스에서 더 이상 고려되지 않습니다. 해당 후보 지역 내의 다른 셀은 다른 후보 지역에 대해 계속 고려됩니다.

시드가 분포되는 방식

프로세싱 시간을 단축하기 위해, 입력 래스터 내의 사용 가능한 모든 셀 위치에서 지역을 성장시키는 대신 시드라고도 하는 식별된 특정 셀 위치에서 후보 지역을 성장시킬 수 있습니다. 지역을 성장시킬 시드의 수는 성장시킬 시드 수 매개변수로 제어할 수 있습니다.

지정된 수의 시드가 입력 래스터 내 유틸리티 값의 공간 분포를 기반으로 래스터 전반에 분포됩니다. 즉, 유틸리티 값이 가장 높은 입력 래스터 면적에 더 많은 시드가 위치하게 됩니다. 최적의 지역은 입력 래스터 유틸리티 값이 가장 높은 면적에 위치할 가능성이 높다고 가정됩니다.

특정 시드 위치를 식별하기 위해, 모든 입력 래스터 셀과 그 유틸리티 값에서 분포가 생성됩니다. 유틸리티 값이 높은 셀은 분포에서 더 높은 비율을 차지하게 됩니다. 시드가 위치해야 할 셀 위치를 식별하기 위해 이 분포에서 값이 무작위로 선택됩니다. 유틸리티 값이 높은 셀은 분포에서 더 높은 비율을 차지하게 되므로 이러한 위치가 선택될 가능성이 높습니다.

주어진 면적 내의 시드 수 분포가 해당 면적 셀의 총 유틸리티에 비례하고, 이와 동시에 시드가 서로 너무 가까이 위치하지 않도록 하기 위해 추가적인 조정이 이루어집니다.

시드 분포 예시

단순한 예시로 유틸리티 값이 1, 2, 3, 4인 셀 래스터 4개가 있다고 가정해 보겠습니다. 이러한 네 개의 값에서 분포가 생성됩니다. 셀 값의 합계는 10입니다. 그런 다음 값이 0~1 척도로 조정됩니다. 유틸리티 값이 1인 셀은 분포에서 10%를 차지하고(분포의 0~0.1) 값이 2인 셀은 20%를 차지합니다(분포의 0.1~0.3). 값이 3인 셀은 30%를 차지하고(분포의 0.3~0.6) 값이 4인 셀은 40%를 차지합니다(분포의 0.6~1). 0~1 사이의 무작위 값이 선택됩니다. 해당 무작위 값이 분포의 0.6~1 사이에 해당할 확률은 40%이며 이는 4의 값이 할당된 셀 위치(유틸리티가 가장 높은 셀)에 시드를 배치한다는 것을 의미합니다.

원하는 지역의 크기를 기반으로 지역 성장 해상도 조정

성장시킬 시드 수 매개변수를 사용하여 프로세싱 시간을 단축하는 것 외에도, 성장 해상도 매개변수를 사용하여 성능을 개선할 수도 있습니다. 성장 해상도 매개변수를 사용하면 PRG 알고리즘이 해상도가 보다 낮은 중간 버전의 입력 래스터에서 성장시키도록 할 수 있습니다. 이 경우 중간 래스터를 사용해 후보 지역에서 원하는 지역을 선택하면 해당 결과 지역이 셀 크기에 대해 리샘플링되어 최종 결과 래스터를 생성합니다. 중간 래스터의 해상도는 지정된 성장 해상도와 관련된 셀의 수에 따라 결정됩니다.

각 결과 지역에 셀이 충분히 있도록 하고 불필요한 프로세싱을 줄이기 위해, 중간 래스터의 각 대상 성장 해상도 기준으로 식별된 셀의 총수와 해상도에 대해 두 번째 조정이 이루어질 수 있습니다. 지정된 성장 해상도에서 결정된 해상도를 기반으로 평균 지역 크기의 셀 수가 식별됩니다. 평균 지역 크기는 원하는 총 면적을 지정된 지역 수로 나누어 계산합니다. 선택한 각 지역에 셀이 충분히 있도록 하기 위해, 평균 지역 크기에 있는 셀이 너무 적다면 중간 래스터의 해상도를 높입니다(셀 크기가 줄어들기 때문에 셀 수는 증가함). 불필요한 프로세싱을 줄이기 위해, 평균 지역 크기에 있는 셀이 너무 많다면 중간 래스터의 해상도를 낮춥니다.

평균 지역 크기에 있는 셀이 너무 적은지 아니면 너무 많은지 결정하기 위한 임계값은 선택한 성장 해상도를 기반으로 합니다. 예를 들어, LOW 해상도 옵션을 선택했고 평균 지역 크기에 있는 셀 수가 너무 적어(이 선택의 경우 셀 수가 1,800개 미만) 합당한 결과를 얻을 수 없는 경우 중간 래스터의 해상도를 더 높게 조정해 평균 지역 크기에 최소 1,800개의 셀이 포함되도록 합니다. 이렇게 하면 합당한 지역을 생성하기에 충분한 셀을 확보할 수 있습니다. 이와 반대로, 불필요한 프로세싱을 줄이기 위해 평균 지역 크기에 5,400개 이상의 셀이 있을 경우 평균 지역 크기의 셀 수가 5,400개가 될 때까지 LOW 해상도에 대한 중간 래스터 해상도를 낮춥니다.

성장 해상도MEDIUMHIGH 선택에 대해서도 이와 동일한 조정이 이루어지지만 임계값은 다릅니다. MEDIUM 해상도의 경우 평균 지역 크기 내 셀 수의 임계값 하한은 3,200개이며 상한은 9,600개입니다. HIGH 해상도의 경우 평균 지역 크기 내 셀 수의 임계값 하한은 7,200개이며 상한은 21,600개입니다.

이 두 번째 조정 결과, 지정된 각 성장 해상도에 대해 PRG가 수행될 리샘플링된 중간 래스터의 총 셀은 목표 셀 수보다 낮거나 높을 수 있습니다.

최소 및 최대 면적이 지정되었을 때 지역이 결정되는 방식

지역 최소 면적지역 최대 면적이 지정된 경우 각 시드에서 지정된 최소 크기와 최대 크기 사이의 가능한 지역 크기를 모두 고려한다면 비교할 지역 조합의 수가 너무 많아집니다. 따라서 각 시드에서 알고리즘은 PRG 프로세스로 생성되어 최적의 지역을 식별하기 위한 COMBINATORIALSEQUENTIAL 선택 프로세스에서 고려될 최소 크기와 최대 크기 사이의 지역 수를 정의합니다.

모든 지역 크기는 최소, 최대, 평균 지역 크기에서 생성됩니다. 평균 지역 크기를 결정하기 위해, 알고리즘은 총 면적을 지정된 지역의 수로 나눕니다. 평균 지역 크기는 각 시드에서 생성될 첫 번째 지역 크기입니다. 일반적으로 평균 지역 크기는 지정된 최소 면적 크기 또는 최대 면적 크기에 더 가깝습니다. 즉, Abs(최대 - 평균) 또는 Abs(최소 - 평균) 사이 거리 중 더 큰 거리입니다. 이 값을 LargerDist라고 하겠습니다.

평균 지역 크기와 더 큰 거리 사이에 속하는 지역 크기를 정의하는 단계 간격을 계산하기 위해 다음 공식이 사용됩니다.

StepInterval = LargerDist/(N - 1)
  • 여기에서 N은 지정된 지역의 수입니다.

평균 지역 크기에서 시작해 더 큰 거리 값에 도달할 때까지 순차적으로 StepInterval을 더하거나 뺍니다. 더 작은 거리 값에 도달할 때까지 반대 방향으로 이와 동일한 StepInterval을 순차적으로 더하거나 뺍니다.

이 프로세싱 단계에서 지역 크기의 수가 4 미만인 경우 각 기존 값 사이에 크기 2개가 더 추가됩니다. 크기의 수가 7 미만, 3 이상일 경우 기존 값 사이에 크기 1개가 더 추가됩니다. 그 결과, 각 시드에서 생성될 지역 크기의 최소 수는 7이며 지역 크기의 최대 수는 지정된 지역의 수에 따라 15입니다.

이러한 매개변수의 상호작용을 보여주는 몇 가지 예시는 이 섹션 뒷부분에서 확인할 수 있습니다.

지역 최소 면적지역 최대 면적이 지정된 경우 COMBINATORIAL 또는 SEQUENTIAL 선택 프로세스 중 각 지역 크기가 각 시드의 후보 지역으로 고려되며, 해당 선택 프로세스에서 테스트를 거쳐 최적의 지역을 식별합니다.

지역 최소 면적만 지정되고 지역 최대 면적은 식별되지 않은 경우 최대 면적은 최소 면적 크기, 총 면적, 지정된 지역의 수로 결정됩니다. 예를 들어, 지역 최소 면적이 5제곱마일, 총 면적이 50제곱마일, 지역 수가 5로 설정되었다고 가정해 보겠습니다. 가능한 최대 면적은 4개의 지역이 최소 면적 크기라고 가정하여 결정됩니다. 이 예시에서는 최소 면적 크기가 5제곱마일이므로 총 20제곱마일이 됩니다. 따라서 가능한 최대 면적은 나머지 30제곱마일이므로, 이 값이 할당됩니다. 지역 최소 면적만 지정된 경우에도 동일한 로직이 적용되지만 최소 면적은 0보다 커야 합니다.

예시 1:

이 예시에서는 매개변수가 다음과 같이 설정됩니다.

  • 총 면적은 300제곱마일로 설정됩니다.
  • 지역 수는 6으로 설정됩니다.
  • 지역 최소 면적은 40제곱마일로 설정됩니다.
  • 지역 최대 면적은 100제곱마일로 설정됩니다.

PRG로 생성될 첫 번째 지역 크기는 평균 지역 크기로, 이는 총 면적을 지역 수로 나누어 결정됩니다. 이 경우 50제곱마일입니다(300/6). LargerDist는 50입니다(LargerDist = Abs(100 - 50)). StepInterval는 10입니다(StepInterval = 50/(6 - 1)).

각 시드에서 생성될 두 번째 지역의 크기는 평균 지역 크기에 StepInterval를 더해서 결정되므로(10 + 50) 이 경우 60제곱마일입니다. 더 큰 거리 값에 도달할 때까지 평균 지역 크기에 StepInterval 10을 계속 더합니다. 이렇게 하면 세 번째, 네 번째, 다섯 번째, 여섯 번째 지역 크기를 식별할 수 있으며 각각 70, 80, 90, 100제곱마일입니다. 마지막으로 더 작은 거리 값에 도달할 때까지 평균 지역 크기에서 StepInterval를 계속 빼면 일곱 번째로 생성될 지역 크기를 식별할 수 있으며 이 경우 40제곱마일입니다. 이 예시의 경우 각 시드에서 생성될 지역의 수는 7이며 각각 40, 50, 60, 70, 80, 90, 100제곱마일입니다.

예시 2

이 예시에서는 매개변수가 다음과 같이 설정됩니다.

  • 총 면적은 100제곱마일로 설정됩니다.
  • 지역 수는 4로 설정됩니다.
  • 지역 최소 면적은 10제곱마일로 설정됩니다.
  • 지역 최대 면적은 60제곱마일로 설정됩니다.

PRG로 생성될 첫 번째 지역 크기는 평균 지역 크기로, 이는 총 면적을 지역 수로 나누어 결정합니다. 이 경우 25제곱마일입니다.

LargerDist는 35제곱마일입니다(Abs(60 - 25)). StepInterval은 11.6667입니다(35/(4 - 1)). 더 큰 거리 값에 도달할 때까지 평균 지역 크기에 11.6667을 계속 더하면 36.6667, 48.3334, 60의 값이 나옵니다. 차이가 최소값 이하가 될 때까지 평균 지역 크기에서 StepInterval를 빼면 13.3333이 나옵니다. 지금까지 지역 수는 5이며 각각 13.3333, 25, 36.6667, 48.3334, 60입니다. 더 작은 거리를 생성한 최소값 또는 최대값이 지역 크기에 포함된다는 보장은 없습니다(이 예시에서는 13.3333 - 11.6667 = 1.6666으로 10보다 작음). 각 시드에서 생성될 지역 크기의 최소 수는 7이며 지역 크기의 최대 수는 15입니다. 5는 필수 최소값인 7보다 작으므로 5개의 각 지역 크기 사이에 지역 크기가 더 추가됩니다. 이 예시의 경우 각 시드에서 생성될 지역의 수는 9이며 각각 13.3333, 19.1667, 25, 30.8334, 36.6667, 42.5001, 48.3334, 54.1667, 60제곱마일입니다.

참조

Brooks, Christopher J. 1997. A parameterized region growing programme for site allocation on raster suitability maps. International Journal of Geographic Information Science, 11:4, 375-396.

Brooks, Christopher J. 1997. A genetic algorithm for location optimal sites on raster suitability maps. Transactions in GIS, Vol. 2, No. 3, p 201-212.

Brooks, Christopher J. 1998. A genetic algorithm for designing optimal region configurations in GIS. A thesis submitted for the degree of Doctor of Philosophy, University College, University of London, London.

Brooks, Christopher J. 2001. A genetic algorithm for designing optimal patch configurations in GIS. International Journal of Geographic Information Science, Vol. 15, No. 6, 539-559.

Li, Xia and Anthony Gar-On Yeh, 2005. Integration of genetic algorithms and GIS for optimal location search, International Journal of Geographic Information Science, Vol. 19, No. 5, 581-601.