Como a Densidade de Kernel funciona

Disponível com ArcGIS Image for ArcGIS Online.

A ferramenta Calcular Densidade calcula a densidade de feições em uma vizinhança em torno dessas feições. Ele pode ser calculado para feições de ponto e linha.

Os usos possíveis incluem a análise da densidade de moradias ou ocorrências de crimes para fins de planejamento comunitário e a exploração de como as estradas ou linhas de serviços públicos influenciam o habitat da vida selvagem. O campo de população pode ser usado para ponderar algumas feições com mais detalhes do que outras ou permitir que um ponto represente várias observações. Por exemplo, um endereço pode representar um condomínio com seis unidades, ou alguns crimes podem ser mais ponderados do que outros na determinação dos níveis gerais de criminalidade. Para feições de linha, uma rodovia dividida pode ter mais impacto do que uma estrada de terra estreita.

Como a densidade do kernel é calculada

A densidade do kernel é calculada de forma diferente para diferentes feições.

Feições de Ponto

Calcular Densidade calcula a densidade de feições pontuais ao redor de cada célula raster de saída.

Conceitualmente, uma superfície curva suave é ajustada sobre cada ponto. O valor da superfície é maior no local do ponto e diminui com o aumento da distância do ponto, chegando a zero na distância do Raio de pesquisa do ponto. Apenas uma vizinhança circular é possível. O volume sob a superfície é igual ao valor do Campo População do ponto ou 1 se NONE for especificado. A densidade em cada célula raster de saída é calculada adicionando os valores de todas as superfícies kernel onde elas se sobrepõem ao centro da célula raster. A função kernel é baseada na função Kernel quártico descrita em Silverman (1986, p. 76, equação 4.5).

Se uma configuração de campo de preenchimento diferente de NONE for usada, o valor de cada item determinará o número de vezes para contar o ponto. Por exemplo, um valor de 3 fará com que o ponto seja contado como três pontos. Os valores podem ser inteiros ou ponto flutuante.

Por padrão, uma unidade é selecionada com base na unidade linear da definição de projeção dos dados de feição de ponto de entrada ou conforme especificado na configuração de ambiente do Sistema de Coordenadas de Saída.

Se um fator de Unidades de área de saída for selecionado, a densidade calculada para a célula é multiplicada pelo fator apropriado antes de ser gravada no raster de saída. Por exemplo, se as unidades de entrada forem metros, as unidades de área de saída serão padronizadas para Quilometros quadrados. O resultado final da comparação de um fator de escala de unidade de metros para quilômetros resultará em valores diferentes por um multiplicador de 1.000.000 (1.000 metros × 1.000 metros).

Feições de linha

Densidade de Kernel também pode calcular a densidade de feições lineares na vizinhança de cada célula raster de saída.

Conceitualmente, uma superfície suavemente curvada é ajustada sobre cada linha. Seu valor é maior na linha e diminui à medida que você se afasta da linha, chegando a zero na distância especificada do Raio de pesquisa da linha. A superfície é definida de modo que o volume sob a superfície seja igual ao produto do comprimento da linha e o valor do Campo População. A densidade em cada célula raster de saída é calculada adicionando os valores de todas as superfícies kernel onde elas se sobrepõem ao centro da célula raster. O uso da função de núcleo para linhas é adaptado da função de núcleo quártico para densidades de pontos conforme descrito em Silverman (1986, p. 76, equação 4.5).

Densidade do kernel para feições de linha
Um segmento de linha e a superfície do kernel ajustada sobre ele são mostrados.

A ilustração acima mostra um segmento de linha e a superfície kernel ajustada sobre ele. A contribuição do segmento de linha para a densidade é igual ao valor da superfície do kernel no centro da célula raster.

Por padrão, uma unidade é selecionada com base na unidade linear da definição de projeção dos dados da feição de polilinha de entrada ou conforme especificado na configuração do ambiente do Sistema de Coordenadas de Saída.

Quando um fator de Unidades de área de saída é especificado, ele converte as unidades de comprimento e área. Por exemplo, se as unidades de entrada forem metros, as unidades de área de saída serão padronizadas para Quilometros quadrados e as unidades de densidade de linha resultantes serão convertidas em quilômetros por quilômetro quadrado. O resultado final, comparando um fator de escala de unidade de metros para quilômetros, será os valores de densidade sendo diferentes por um multiplicador de 1.000.

Você pode controlar as unidades de densidade para feições de ponto e linha selecionando manualmente o fator apropriado. Para definir a densidade para metros por metro quadrado (em vez dos quilômetros padrão por quilômetro quadrado), defina as unidades de área como Metros quadrados. Da mesma forma, para ter as unidades de densidade de sua saída em milhas por milha quadrada, defina as unidades de área como Milhas quadradas.

Se um campo de preenchimento diferente de NONE for usado, o comprimento da linha será considerado seu comprimento real multiplicado pelo valor do campo de preenchimento dessa linha.

Fórmulas para calcular a densidade do kernel

As fórmulas a seguir definem como a densidade de kernel para pontos é calculada e como o raio de pesquisa padrão é determinado na fórmula de densidade de kernel.

Prevendo a densidade de pontos

A densidade prevista em um novo local (x,y) é determinada pela seguinte fórmula:

Fórmula de densidade prevista

Onde:

  • i = 1,…,n são os pontos de entrada. Apenas inclua pontos na soma se eles estiverem dentro da distância do raio do local (x,y).
  • popi é o valor do campo de população do ponto i, que é um parâmetro opcional.
  • disti é a distância entre o ponto i e o local (x,y).

A densidade calculada é então multiplicada pelo número de pontos ou pela soma do campo de população, se um foi fornecido. Essa correção torna a integral espacial igual ao número de pontos (ou soma ou campo populacional) em vez de ser sempre igual a 1. Esta implementação usa um Kernel Quártico (Silverman, 1986). A fórmula precisará ser calculada para cada local onde você deseja estimar a densidade. Como um raster está sendo criado, os cálculos são aplicados ao centro de cada célula no raster de saída.

Raio de pesquisa padrão (largura de banda)

O algoritmo usado para determinar o raio de pesquisa padrão, também conhecido como largura de banda, faz o seguinte:

  1. Calcula o centro médio dos pontos de entrada. Se um campo População foi fornecido, este e todos os cálculos seguintes serão ponderados pelos valores desse campo.
  2. Calcula a distância do centro médio (ponderado) para todos os pontos.
  3. Calcula a mediana (ponderada) dessas distâncias, Dm.
  4. Calcula a distância padrão (ponderada), SD.
  5. Aplica a seguinte fórmula para calcular a largura de banda.

Fórmula para calcular o raio de pesquisa padrão para a densidade do kernel

Onde:

  • Dm é a distância mediana (ponderada) do centro médio (ponderado).
  • n é o número de pontos se nenhum campo de população for usado, ou se um campo de população for fornecido, n é a soma dos valores do campo de população.
  • SD é a distância padrão.

Note que a parte min da equação significa que qualquer uma das duas opções, SD ou Opção 2 da equação do Raio de pesquisa, que resulta em um valor menor será usado.

Há dois métodos para calcular a distância padrão, não ponderada e ponderada.

Distância não ponderada

Equação de distância não ponderada

Onde:

  • x i , y i e z i são as coordenadas da feição i
  • {x̄, ȳ, z̄} representa o centro médio para as feições
  • n é igual ao número total de feições.

Distância ponderada

Equação de distância ponderada

Onde:

  • wi é o peso na feição i
  • {x w, y w, z w} representa o centro médio ponderado.

Metodologia

Essa metodologia para escolher o raio de busca é baseada na fórmula de estimativa de largura de banda da regra prática de Silverman, mas foi adaptada para duas dimensões. Essa abordagem para calcular um raio padrão geralmente evita o fenômeno do anel ao redor dos pontos que geralmente ocorre com um conjunto de dados esparso e é resistente a discrepâncias espaciais—alguns pontos distantes do resto dos pontos.

Como a barreira afeta o cálculo da densidade

Uma barreira altera a influência de uma feição ao calcular a densidade do kernel para uma célula no raster de saída. Uma barreira pode ser uma polilinha ou uma camada de feição de polígono. Ele pode afetar o cálculo da densidade de duas maneiras: aumentando a distância entre uma feição e a célula onde a densidade está sendo calculada ou excluindo uma feição do cálculo.

Sem barreira, a distância entre uma feição e uma célula é a menor possível, ou seja, uma linha reta entre dois pontos. Com uma barreira aberta, geralmente representada por uma polilinha, o caminho entre uma feição e uma célula é influenciado pela barreira. Neste caso, a distância entre o elemento e a célula é ampliada devido a um desvio em torno da barreira, conforme ilustrado na figura abaixo. Como resultado, a influência da feição é reduzida ao estimar a densidade na célula. O caminho ao redor da barreira é criado conectando uma série de linhas retas para contornar a barreira desde a feição de ponto de entrada até a célula. Ainda é a distância mais curta ao redor da barreira, mas maior do que seria a distância sem a barreira. Com uma barreira fechada, geralmente representada por um polígono que engloba completamente algumas feições, o cálculo da densidade em uma célula de um lado da barreira exclui completamente as feições do outro lado da barreira.

Figura conceitual para cálculo de distância em densidade de kernel sem e com barreiras.
Uma figura conceitual para o cálculo da distância entre uma célula e uma feição de ponto de entrada é mostrada. A densidade do kernel sem barreira está à esquerda; A densidade do kernel com uma barreira está à direita.

A operação de densidade do kernel com uma barreira pode fornecer resultados mais realistas e precisos em algumas situações em comparação com a densidade do kernel sem uma operação de barreira. Por exemplo, ao explorar a densidade da distribuição de uma espécie de anfíbio, a presença de uma falésia ou estrada pode afetar seu movimento. O penhasco ou a estrada podem ser usados ​​como uma barreira para obter uma melhor estimativa de densidade. Da mesma forma, o resultado de uma análise de densidade da taxa de criminalidade em uma cidade pode variar se um rio que passa pela cidade for considerado uma barreira.

A ilustração abaixo mostra a saída de densidade do kernel de acidentes de trânsito noturnos em Los Angeles (dados disponíveis no Los Angeles County GIS Data Portal). A estimativa de densidade sem barreira está à esquerda (1) e com barreira em ambos os lados das estradas está à direita (2). A ferramenta fornece uma estimativa muito melhor da densidade usando a barreira, onde a distância é medida junto com a malha viária, do que usando a distância mais curta entre os locais dos acidentes.

Densidade do kernel com e sem barreiras
A estimativa da densidade do kernel é mostrada sem uma barreira (1) e com uma barreira em ambos os lados das estradas (2).

Referências

Silverman, B. W. Estimativa de densidade para estatística e análise de dados. Nova York: Chapman e Hall, 1986.