Lo strumento Calcola densità calcola la densità del kernel delle feature in un quartiere intorno a tali feature. Può essere calcolato sia per elementi puntuali che lineari.
I possibili usi includono l'analisi della densità abitativa o dei casi di criminalità ai fini della pianificazione della comunità e l'esplorazione di come le strade o le linee di servizio influenzano l'habitat della fauna selvatica. Il campo della popolazione può essere utilizzato per ponderare alcune caratteristiche più pesantemente di altre o consentire a un punto di rappresentare diverse osservazioni. Ad esempio, un indirizzo può rappresentare un condominio con sei unità, oppure alcuni reati possono avere un peso maggiore di altri nel determinare i livelli complessivi di criminalità. Per le caratteristiche della linea, un'autostrada divisa può avere un impatto maggiore rispetto a una stretta strada sterrata.
Com'è calcolata la densità kernel
La densità kernel è calcolata in modo diverso per le diverse feature.
Feature puntuali
Calcola Densità calcola la densità delle caratteristiche puntuali attorno a ciascuna cella raster di output.
Concettualmente, viene creata una superficie curva uniforme su ciascun punto. Il valore della superficie è più alto nella posizione del punto e diminuisce con l'aumentare della distanza dal punto, raggiungendo lo zero alla distanza del Raggio di ricerca dal punto. È possibile solo un quartiere circolare. Il volume sotto la superficie è uguale al valore del campo Popolazione per il punto o 1 se NESSUNO è specificato. La densità per ogni cella raster di output viene calcolata aggiungendo i valori di tutte le superfici del kernel nel punto in cui si sovrappongono al centro della cella di output. La funzione kernel si basa sulla funzione kernel quartico descritta in Silverman (1986, p. 76, Equation 4.5).
Se viene utilizzata un'impostazione del campo della popolazione diversa da NESSUNO, il valore di ciascun elemento determina il numero di volte per contare il punto. Ad esempio, un valore di 3 farà sì che il punto venga conteggiato come tre punti. I valori possono essere interi o in virgola mobile.
Per impostazione predefinita, un'unità viene selezionata in base all'unità lineare della definizione di proiezione dei dati della feature del punto di input o come altrimenti specificato nell'impostazione dell'ambiente Sistema di coordinate di output.
Se viene selezionato un fattore Unità area di output, la densità calcolata per la cella viene moltiplicata per il fattore appropriato prima di essere scritta nel raster di output. Ad esempio, se le unità di input sono metri, le unità di area di output verranno impostate per impostazione predefinita su chilometri quadrati. Il risultato finale, confrontando un fattore di scala unitario di metri con chilometri, sarà che i valori differiscono di un moltiplicatore di 1.000,000 (1.000 metri × 1,000 metri).
Feature linea
Calcola densità può anche calcolare la densità delle feature lineari nelle vicinanze di ogni cella raster di uscita.
Concettualmente, viene creata una superficie curva uniforme su ciascuna linea. Il suo valore è massimo sulla linea e diminuisce man mano che ci si allontana dalla linea, raggiungendo lo zero alla distanza del Raggio di ricerca specificata dalla linea. La superficie è definita in modo che il volume sotto la superficie sia uguale al prodotto della lunghezza della linea per il valore del campo Popolazione. La densità per ogni cella raster di output viene calcolata aggiungendo i valori di tutte le superfici del kernel nel punto in cui si sovrappongono al centro della cella di output. L'uso della funzione del kernel per le linee è adattato dalla funzione del kernel quartico per le densità di punti come descritto in Silverman (1986, p. 76, Equation 4.5).
L'illustrazione sopra mostra un segmento di linea e la superficie del kernel adattata su di esso. Il contributo del segmento di linea alla densità è pari al valore della superficie del kernel al centro della cella raster.
Per impostazione predefinita, un'unità viene selezionata in base all'unità lineare della definizione di proiezione dei dati della feature polilinea di input o come altrimenti specificato nell'impostazione dell'ambiente Sistema di coordinate di output.
Quando viene specificato un fattore di Unità di area di output, converte le unità di lunghezza e area. Ad esempio, se le unità di input sono metri, le unità dell'area di output verranno impostate per impostazione predefinita su chilometri quadrati e le unità di densità di linea risultanti verranno convertite in chilometri per chilometro quadrato. Il risultato finale, confrontando un fattore di scala unitario di metri con chilometri, sarà che i valori di densità differiscono di un moltiplicatore di 1.000.
È possibile controllare le unità di densità sia per gli elementi puntuali che per quelli lineari selezionando manualmente il fattore appropriato. Per impostare la densità su metri per metro quadrato (invece dei chilometri predefiniti per chilometro quadrato), impostare le unità di area su metri quadrati. Allo stesso modo, per avere le unità di densità della tua produzione in miglia per miglio quadrato, imposta le unità di area su miglia quadrate.
Se viene utilizzato un campo di popolazione diverso da NONE, la lunghezza della linea viene considerata come la sua lunghezza effettiva moltiplicata per il valore del campo di popolazione per quella linea.
Formule per il calcolo della densità del kernel
Le seguenti formule definiscono come viene calcolata la densità del kernel per i punti e come viene determinato il raggio di ricerca predefinito all'interno della formula della densità del kernel.
Previsione della densità per i punti
La densità prevista in una nuova posizione (x,y) è determinata dalla seguente formula:
dove:
- i = 1,…,n sono i punti di input. Includere i punti nella somma solo se si trovano entro la distanza del raggio della posizione (x,y).
- popi è il valore del campo popolazione del punto i, che è un parametro facoltativo.
- disti è la distanza tra il punto i e la posizione (x,y).
La densità calcolata viene quindi moltiplicata per il numero di punti o per la somma del campo della popolazione, se ne è stato fornito uno. Questa correzione rende l'integrale spaziale uguale al numero di punti (o somma o campo di popolazione) invece di essere sempre uguale a 1. Questa implementazione utilizza un kernel quartico (Silverman, 1986). La formula dovrà essere calcolata per ogni posizione in cui si desidera stimare la densità. Poiché viene creato un raster, i calcoli vengono applicati al centro di ogni cella nel raster di output.
Raggio di ricerca predefinito (larghezza di banda)
L'algoritmo utilizzato per determinare il raggio di ricerca predefinito, noto anche come larghezza di banda, esegue le seguenti operazioni:
- Calcola il centro medio dei punti di input. Se è stato fornito un campo Popolazione, questo e tutti i calcoli successivi verranno ponderati in base ai valori in quel campo.
- Calcola la distanza dal centro medio (ponderato) per tutti i punti.
- Calcola la mediana (ponderata) di queste distanze, Dm.
- Calcola la distanza standard (ponderata), SD.
- Applica la seguente formula per calcolare la larghezza di banda.
dove:
- Dm è la distanza mediana (ponderata) dal centro medio (ponderato).
- n è il numero di punti se non viene utilizzato alcun campo di popolazione o se viene fornito un campo di popolazione, n è la somma dei valori del campo di popolazione.
- SD è la distanza standard.
Si noti che la parte min dell'equazione indica che verrà utilizzata qualsiasi delle due opzioni, SD o , che risulta in un valore inferiore.
Esistono due metodi per calcolare la distanza standard, non ponderata e ponderata.
Distanza non ponderata
dove:
- x i , y i e z i sono le coordinate per feature i
- {x̄, ȳ, z̄} rappresenta il centro medio delle caratteristiche
- n è pari al numero totale di feature.
Distanza ponderata
dove:
- wi è il peso di una feature i
- {x w, y w, z w} rappresenta il centro medio verificato.
Metodologia
Questa metodologia per la scelta del raggio di ricerca si basa sulla formula di stima della larghezza di banda della regola empirica di Silverman, ma è stata adattata per due dimensioni. Questo approccio al calcolo di un raggio predefinito generalmente evita il fenomeno dell'anello attorno ai punti che si verifica spesso con dataset sparsi ed è resistente ai valori anomali spaziali, ovvero alcuni punti che sono lontani dal resto dei punti.
In che modo la barriera influisce sul calcolo della densità
Una barriera altera l'influenza di una feature durante il calcolo della densità del kernel per una cella nel raster di output. Una barriera può essere una polilinea o un feature layer poligonale. Può influire sul calcolo della densità in due modi, aumentando la distanza tra una feature e la cella in cui viene calcolata la densità o escludendo una feature dal calcolo.
Senza barriera, la distanza tra una feature e una cella è la più breve possibile, essendo una linea retta tra due punti. Con una barriera aperta, solitamente rappresentata da una polilinea, il percorso tra una feature e una cella è influenzato dalla barriera. In questo caso, la distanza tra la feature e la cella viene estesa a causa di una deviazione intorno alla barriera, come mostrato nell'illustrazione seguente. Di conseguenza, l'influenza della feature viene ridotta durante la stima della densità nella cella. Il percorso attorno alla barriera viene creato collegando una serie di linee rette per aggirare la barriera dalla feature del punto di input alla cella. È ancora la distanza più breve intorno alla barriera, ma più lunga della distanza che sarebbe senza la barriera. Con una barriera chiusa, solitamente rappresentata da un poligono che racchiude completamente alcune feature, il calcolo della densità in una cella su un lato della barriera esclude completamente le feature sull'altro lato della barriera.
L'operazione di densità del kernel con una barriera può fornire risultati più realistici e accurati in alcune situazioni rispetto all'operazione di densità del kernel senza un'operazione di barriera. Ad esempio, quando si esplora la densità della distribuzione di una specie di anfibio, la presenza di una scogliera o di una strada può influenzare il loro movimento. La scogliera o la strada possono essere utilizzate come barriera per ottenere una migliore stima della densità. Allo stesso modo, il risultato di un'analisi della densità del tasso di criminalità in una città può variare se un fiume che attraversa la città è considerato come una barriera.
L'illustrazione seguente mostra l'output della densità del kernel degli incidenti stradali notturni a Los Angeles (dati disponibili dal portale di dati GIS della contea di Los Angeles). La stima della densità senza barriera è a sinistra (1) e con una barriera su entrambi i lati delle strade è a destra (2). Lo strumento fornisce una stima della densità molto migliore utilizzando la barriera, in cui la distanza viene misurata insieme alla rete stradale, piuttosto che utilizzando la distanza più breve tra i luoghi dell'incidente.
Riferimenti
Silverman, Bernard W. 1986. Density Estimation for Statistics and Data Analysis. New York: Chapman and Hall.