Sposób działania narzędzia Gęstość skupień

Dostępne z aplikacją ArcGIS Image for ArcGIS Online.

Narzędzie Oblicz zagęszczenie oblicza gęstość obiektów w sąsiedztwie wokół tych obiektów. Można ją obliczać zarówno dla obiektów punktowych, jak i liniowych.

Możliwe zastosowania to analiza zagęszczenia zamieszkania lub występowania przestępstw na potrzeby planowania społeczności lub badanie wpływu dróg i linii energetycznych na siedliska dzikich zwierząt. Pole populacji można wykorzystać do określenia większych wag niektórych obiektów w porównaniu do innych lub aby umożliwić reprezentowanie kilku obserwacji przez jeden punkt. Na przykład jeden adres może reprezentować kondominium złożone z sześciu jednostek lub niektóre przestępstwa mogą mieć większą wagę niż inne przy ustalaniu ogólnych poziomów przestępczości. W przypadku obiektów liniowych droga dwujezdniowa może mieć większy wpływ niż wąska droga gruntowa.

Sposób obliczania gęstości skupień

Gęstość skupień jest obliczana w różny sposób dla różnych obiektów.

Obiekty punktowe

Oblicz zagęszczenie oblicza zagęszczenie obiektów punktowych wokół każdej komórki rastra wynikowego.

Koncepcyjnie gładka zakrzywiona powierzchnia jest dopasowywana do każdego punktu. Wartość powierzchni jest największa w lokalizacji punktu i zmniejsza się, gdy odległość od punktu rośnie, osiągając wartość zero w odległości Promień wyszukiwania od punktu. Możliwe jest tylko sąsiedztwo okrągłe. Objętość pod powierzchnią jest równa wartości Pole populacji dla punktu lub 1, jeśli podano wartość BRAK. Gęstość w każdej komórce rastra wynikowego jest obliczana przez dodanie wartości wszystkich powierzchni skupień, w których nakładają się one na środek komórki rastra. Funkcja skupień jest oparta na funkcji skupień Quartic opisanej przez Silvermana (1986, s. 76, równanie 4.5).

Jeśli ustawienie pola populacji jest inne niż BRAK, wartość każdego elementu określa, ile razy ma być liczony dany punkt. Na przykład wartość 3 powoduje, że punkt jest liczony jako trzy punkty. Wartości mogą być całkowitoliczbowe lub zmiennoprzecinkowe.

Domyślnie jednostka jest wybierana na podstawie jednostki liniowej definicji odwzorowania danych wejściowych obiektów punktowych lub w przeciwnym razie jako określona w ustawieniu środowiska Wynikowy układ współrzędnych.

Jeśli wybrany jest wynikowy współczynnik Jednostki powierzchni, obliczone zagęszczenie dla komórki jest przed zapisaniem w rastrze wynikowym mnożone przez odpowiedni współczynnik. Jeśli na przykład jednostkami wejściowymi są metry, wynikowymi jednostkami powierzchni są domyślnie Kilometry kwadratowe. Wynikiem porównania współczynnika skali jednostek dla metrów i kilometrów są wartości różniące się o mnożnik 1 000 000 (1000 metrów × 1000 metrów).

Obiekty liniowe

Narzędzie Gęstość skupień może także obliczać zagęszczenie obiektów liniowych w sąsiedztwie każdej komórki rastra wynikowego.

Koncepcyjnie gładka zakrzywiona powierzchnia jest dopasowywana do każdej linii. Wartość jest największa na linii i zmniejsza się wraz z odsuwaniem się od linii, osiągając zero w podanej odległości Promień wyszukiwania od linii. Powierzchnia jest zdefiniowana w taki sposób, aby objętość pod powierzchnią była równa iloczynowi długości linii i wartości Pole populacji. Gęstość w każdej komórce rastra wynikowego jest obliczana przez dodanie wartości wszystkich powierzchni skupień, w których nakładają się one na środek komórki rastra. Użycie funkcji skupień dla linii zostało zaadaptowane z funkcji skupień Quartic opisanej przez Silvermana (1986, str. 76, równanie 4.5).

Gęstość skupień dla obiektów liniowych
Segment linii i dopasowana do niego powierzchnia skupień.

Na ilustracji powyżej przedstawiono segment linii i dopasowaną do niego powierzchnię skupień. Udział segmentu linii w gęstości jest równy wartości powierzchni skupień w środku komórki rastra.

Domyślnie jednostka jest wybierana na podstawie jednostki liniowej definicji odwzorowania danych wejściowych obiektów poliliniowych lub w przeciwnym razie jako określona w ustawieniu środowiska Wynikowy układ współrzędnych.

Jeśli określony jest wynikowy współczynnik Jednostki powierzchni, konwertuje on jednostki zarówno długości, jak i powierzchni. Jeśli na przykład jednostkami wejściowymi są metry, wynikowymi jednostkami powierzchni są domyślnie Kilometry kwadratowe, a wynikowe jednostki gęstości linii będą konwertowane na kilometry na kilometr kwadratowy. Wynikiem porównania współczynnika skali jednostek dla metrów i kilometrów są wartości gęstości różniące się o mnożnik 1000.

Można kontrolować jednostki gęstości zarówno dla obiektów punktowych, jak i liniowych przez ręczny wybór odpowiedniego współczynnika. Aby jednostkami gęstości były metry na metr kwadratowy (zamiast domyślnych kilometrów na kilometr kwadratowy), należy skonfigurować jednostki powierzchni na Metry kwadratowe. Podobnie, aby jednostkami gęstości w danych wynikowych były mile na milę kwadratową, należy skonfigurować jednostki powierzchni na Mile kwadratowe.

Jeśli używane jest pole populacji inne niż BRAK, długość linii jest uważana za rzeczywistą długość pomnożoną przez wartość pola populacji dla tej linii.

Wzory na obliczanie gęstości skupień

Poniższe wzory definiują sposób obliczania gęstości skupień dla punktów oraz określania domyślnego promienia wyszukiwania we wzorze na gęstość skupień.

Prognozowanie gęstości dla punktów

Prognozowana gęstość w nowej lokalizacji (x,y) jest określana na podstawie następującego wzoru:

Wzór na prognozowaną gęstość

gdzie:

  • i = 1,…,n to punkty wejściowe. W sumie uwzględniane są tylko te punkty, które znajdują się w odległości promienia od lokalizacji (x,y).
  • popi to wartość pola populacji w punkcie i. Jest to parametr opcjonalny.
  • disti to odległość między punktem i a lokalizacją (x,y).

Obliczona gęstość jest następnie mnożona przez liczbę punktów lub sumę pola populacji, jeśli została podana. Ta poprawka powoduje, że całka przestrzenne jest równa liczbie punktów (lub sumie pola populacji), a nie jest zawsze równa 1. W tej implementacji używana jest funkcja skupień Quartic opisana przez Silvermana (1986). Wartość tę należy obliczyć dla każdej lokalizacji, w której należy oszacować gęstość. Ponieważ tworzony jest raster, obliczenia są wykonywane dla środka każdej komórki w rastrze wynikowym.

Domyślny promień wyszukiwania (przepustowość)

Algorytm używany do określania domyślnego promienia wyszukiwania (nazywanego także przepustowością) przebiega następująco:

  1. Oblicza średni środek punktów wejściowych. Jeśli podano pole Populacja, to i wszystkie następne obliczenia będą ważone według wartości w tym polu.
  2. Oblicza odległość od (ważonego) średniego środka dla wszystkich punktów.
  3. Oblicza (ważoną) medianę tych odległości: Dm.
  4. Oblicza (ważoną) odległość standardową (SD).
  5. Stosuje poniższy wzór do obliczenia przepustowości.

Wzór na obliczanie domyślnego promienia wyszukiwania dla gęstości skupień

gdzie:

  • Dm to (ważona) mediana odległości od (ważonego) średniego środka.
  • n to liczba punktów, jeśli nie jest używane pole populacji, a jeśli pole populacji zostało podane, n jest sumą wartości pola populacji.
  • SD to odległość standardowa.

Należy pamiętać, że część min równania oznacza użycie mniejszej z dwóch wartości: SD lub Opcja 2 równania promienia wyszukiwania.

Istnieją dwie metody obliczania odległości standardowej: nieważona i ważona.

Odległość nieważona

Wzór na odległość nieważoną

gdzie:

  • x i , y i i z i to współrzędne obiektu i
  • {x̄, ȳ, z̄} reprezentuje średni środek obiektów
  • n to łączna liczba obiektów.

Odległość ważona

Wzór na odległość ważoną

gdzie:

  • wi to waga obiektu i
  • {x w, y w, z w} reprezentuje ważony średni środek.

Metodologia

Ta metodologia wyboru promienia wyszukiwania jest oparta na przybliżonej formule szacowania przepustowości Silvermana, ale została przystosowana do dwóch wymiarów. W tym podejściu do obliczania domyślnego promienia zazwyczaj unika się zjawiska pierścienia wokół punktów, które często występuje w przypadku rzadkiego zestawu danych. Jest ono także odporne na elementy odstające — kilka punktów, które znajdują się daleko od pozostałych.

Wpływ barier na obliczanie gęstości

Bariera zmienia wpływ obiektu podczas obliczania gęstości skupień dla komórki w rastrze wynikowym. Barierą może być warstwa obiektów poliliniowych lub poligonowych. Może ona mieć dwojaki wpływ na obliczanie gęstości — przez zwiększenie odległości między obiektem, a komórką, w której obliczana jest gęstość lub przez wykluczenie obiektu z obliczeń.

Przy braku bariery odległość między obiektem a komórką jest najkrótszą możliwą odległością, czyli linią prostą między dwoma punktami. W przypadku bariery otwartej zwykle reprezentowanej przez polilinię ma ona wpływ na ścieżkę między obiektem, a komórką. W takim przypadku odległość między obiektem a komórką jest wydłużona ze względu na konieczność obejścia bariery, jak pokazano na ilustracji poniżej. W rezultacie wpływ obiektu jest ograniczony podczas szacowania zagęszczenia w komórce. Ścieżka wokół bariery jest tworzona przez połączenie ciągu linii prostych umożliwiających obejście bariery z wejściowego obiektu punktowego do komórki. Wciąż jest to najkrótsza odległość wokół bariery, ale dłuższa niż odległość bez bariery. W przypadku bariery zamkniętej zwykle reprezentowanej przez poligon całkowicie obejmujący kilka obiektów obliczenie gęstości w komórce po jednej stronie bariery całkowicie wyklucza obiekty po drugiej stronie bariery.

Rysunek koncepcyjny przy obliczaniu odległości w gęstości skupień bez barier i z barierami.
Rysunek koncepcyjny przy obliczaniu odległości między komórką a wejściowym obiektem punktowym. Gęstość skupień bez bariery znajduje się po lewej stronie; Gęstość skupień z barierą znajduje się po prawej stronie.

Operacja określania gęstości skupień z barierą może dawać bardziej realistyczne i dokładniejsze wyniki w niektórych sytuacjach w porównaniu do operacji określania gęstości skupień bez bariery. Na przykład podczas badania gęstości rozmieszczenia gatunku płazów obecność klifu lub drogi może wpłynąć na ich przemieszczanie. Klifu lub drogi można użyć jako bariery, aby uzyskać lepsze oszacowanie gęstości. Podobnie wynik analizy gęstości wskaźnika przestępczości w mieście może być inny, jeśli rzeka przepływająca przez miasto zostanie potraktowana jako bariera.

Na poniższej ilustracji przedstawiono wynikową gęstość skupień wypadków drogowych w Los Angeles mających miejsce w późnych godzinach nocnych (dane dostępne w portalu z danymi GIS dotyczącymi hrabstwa Los Angeles). Szacowana gęstość bez bariery znajduje się po lewej stronie (1), a z barierą po obu stronach ulic znajduje się po prawej stronie (2). Narzędzie zapewnia wyższą jakość oszacowania gęstości z użyciem bariery, gdzie odległość jest mierzona wzdłuż sieci dróg, niż przy użyciu najmniejszej odległości między lokalizacjami wypadków.

Gęstość skupień z barierą i bez bariery
Gęstość skupień bez bariery (1) i z barierą po obu stronach ulic (2).

Odniesienia

Silverman, B. W. Density Estimation for Statistics and Data Analysis. Nowy Jork: Chapman and Hall, 1986.