Cómo funciona Clustering alto/bajo (G general de Getis-Ord)

La herramienta Clustering alto/bajo (G general de Getis-Ord) mide la concentración de valores altos o bajos de un área de estudio determinada.

Cálculos

Matemáticas de la estadística G general

Ver más cálculos de la estadística G general

Observe que la única diferencia entre el numerador y el denominador es el peso (wij). Clustering alto/bajo solo funcionará con valores positivos. Como consecuencia, si sus ponderaciones son binarias (0/1) o siempre son menores que 1, el rango de G general estará entre 0 y 1. Para esta estadística se recomienda un esquema de pesos binarios. Seleccione Banda de distancia fija, Solo bordes de contigüidad, Bordes o esquinas de contigüidad, Vecinos K más cercanos o un archivo .swm con Triangulación de Delaunay para el parámetro Conceptualización de relaciones espaciales. Seleccione Ninguna para el parámetro Estandarización.

Interpretación

La estadística Clustering alto/bajo (G general de Getis-Ord) es una estadística inferencial, lo que significa que los resultados del análisis se interpretan dentro del contexto de la hipótesis nula. La hipótesis nula para la estadística Clustering alto/bajo (G general) establece que no existe un clustering espacial de valores de entidades. Cuando el valor P que devuelve esta herramienta es pequeño y estadísticamente significativo, la hipótesis nula se puede rechazar (consulte ¿Qué es una puntuación z? ¿Qué es un valor P?). Si la hipótesis nula se rechaza, el signo de la puntuación z cobra importancia. Si el valor de la puntuación z es positivo, el índice de G general observada es mayor que el esperado, lo que indica que se agrupan valores altos del atributo en el área de estudio. Si el valor de la puntuación z es negativo, el índice de G general observada es menor que el índice de G general esperada, lo que indica que se agrupan valores bajos en el área de estudio.

La herramienta Clustering alto/bajo (G general de Getis-Ord) es la más apropiada cuando la distribución de valores es bastante uniforme y busca picos espaciales inesperados de valores altos. Desafortunadamente, cuando se agrupan valores altos y bajos, estos tienden a cancelarse entre sí. Si le interesa medir el clustering espacial cuando se agrupan los valores altos y los bajos, utilice la herramienta Autocorrelación espacial.

La hipótesis nula de las herramientas Clustering alto/bajo (G general de Getis-Ord) y Autocorrelación espacial (I de Moran global) es aleatoriedad espacial completa (CSR, por sus siglas en inglés); los valores se distribuyen aleatoriamente entre las entidades del dataset, lo que refleja los procesos espaciales aleatorios en el trabajo. Sin embargo, la interpretación de las puntuaciones z de la herramienta Clustering alto/bajo es distinta de la interpretación de las puntuaciones z de la herramienta Autocorrelación espacial (I de Moran global), tal y como se muestra en esta tabla:

ResultadoClustering alto/bajoAutocorrelación espacial

El valor P no es estadísticamente significativo.

No puede rechazar la hipótesis nula. Puede que la distribución espacial de valores de atributo de entidades sea el resultado de procesos espaciales aleatorios. Dicho que otro modo, el patrón espacial observado de valores podría ser una de las muchas versiones de aleatoriedad espacial completa.

El valor P es estadísticamente significativo y la puntuación z es positiva.

Puede rechazar la hipótesis nula. La distribución espacial de valores altos del dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fuesen realmente aleatorios.

Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los bajos en el dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran realmente aleatorios.

El valor P es estadísticamente significativo y la puntuación z es negativa.

Puede rechazar la hipótesis nula. La distribución espacial de valores bajos del dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fuesen realmente aleatorios.

Puede rechazar la hipótesis nula. La distribución espacial de valores altos y bajos del dataset está más dispersa espacialmente de lo que se esperaría si los procesos espaciales subyacentes fuesen realmente aleatorios. Un patrón espacial disperso suele reflejar algún tipo de proceso competitivo: una entidad con un valor alto rechaza a otras entidades con valores altos; del mismo modo, una entidad con un valor bajo rechaza a otras entidades con valores bajos.

Output

La herramienta Clustering alto/bajo (G general de Getis-Ord) devuelve cuatro valores: G general observada, G general esperada, puntuación z y valor P. Los valores se escriben como mensajes en la parte inferior del panel Geoprocesamiento durante la ejecución de la herramienta y se transmiten como valores de salida derivados para uso potencial en modelos o scripts. Puede acceder a los mensajes desplazándose sobre la barra de progreso, haciendo clic en el botón emergente o expandiendo la sección de mensajes en el panel Geoprocesamiento. También puede acceder a los mensajes de una herramienta ejecutada anteriormente a través del historial de geoprocesamiento. Opcionalmente, puede usar esta herramienta para crear un archivo de informe HTML con un resumen gráfico de los resultados. La ruta al informe se incluirá con los mensajes que resumen los parámetros de ejecución de la herramienta. Haga clic en esa ruta para abrir el archivo de informe.

Preguntas frecuentes

P: Los resultados de la herramienta Análisis de puntos calientes (Gi* de Getis-Ord) indican puntos calientes estadísticamente significativos. ¿Por qué los resultados de la herramienta Clustering alto/bajo (G general de Getis-Ord) no son también estadísticamente significativos?

R: Las herramientas de estadísticas globales, como la herramienta Clustering alto/bajo (G general de Getis-Ord), evalúan el patrón y la tendencia generales de sus datos. Son más efectivas cuando el patrón espacial es consistente en toda el área de estudio. Las herramientas de estadísticas locales (como Análisis de puntos calientes) evalúan cada entidad en el contexto de entidades vecinas y comparan la situación local con la global. Considere un ejemplo. Cuando calcula una media o un promedio para un conjunto de valores, también está calculando una estadística global. Si todos los valores se acercan a 20, el valor medio también lo hará y ese resultado sería una buena representación y resumen del dataset como conjunto. No obstante, si la mitad de los valores se acercan a 1 y la otra mitad se acercan a 100, el valor medio se acercará a 50. Es posible que no haya valores de datos cerca de 50, por lo que el valor medio no es una buena representación ni resumen del dataset como conjunto. Sin embargo, si crea un histograma de los valores de los datos, podrá ver la distribución de dos modelos. Del mismo modo, las estadísticas espaciales globales, incluida la herramienta Clustering alto/bajo, son más efectivas cuando los procesos espaciales que se miden son consistentes en toda el área de estudio. Por lo tanto, los resultados serán una buena representación y resumen del patrón espacial general. Para obtener más información, consulte Getis y Ord (1992), que se menciona más abajo, y el análisis de SIDS que presentan.

P: ¿Por qué los resultados de la herramienta Clustering alto/bajo (G general de Getis-Ord) son distintos de los de la herramienta Autocorrelación espacial (I de Moran global)?

R: Consulte la tabla anterior. Estas herramientas miden distintos patrones espaciales.

P: ¿Es posible comparar las puntuaciones z o valores P de esta herramienta con los resultados de un análisis de otra área de estudio?

R: Los resultados no se pueden comparar, salvo que el área de estudio y los parámetros utilizados en los análisis sean fijos (los mismos en todos los análisis que desea comparar). No obstante, si el área de estudio comprende un conjunto fijo de polígonos y los parámetros del análisis son fijos, puede comparar las puntuaciones z para un atributo en particular con el transcurso del tiempo. Por ejemplo, desea analizar tendencias en la agrupación de compras de medicamentos sin receta en el nivel de distrito de un condado en concreto. Podría ejecutar Clustering alto/bajo (G general de Getis-Ord) para cada periodo de tiempo y crear un gráfico de líneas de los resultados. Si descubre que las puntuaciones z son estadísticamente significativas y van en aumento, puede llegar a la conclusión de que se incrementó la intensidad del clustering espacial para las compras altas de OTC.

P: ¿Afecta el tamaño de una entidad al análisis?

R: El tamaño de sus entidades puede afectar a sus resultados. Por ejemplo, los polígonos grandes tienden a tener valores bajos y los polígonos más pequeños tienden a tener valores altos, incluso si las concentraciones de valores altos y bajos son iguales, de modo que es posible que el índice de G general observada sea mayor que el índice de G general esperada, puesto que hay más pares de polígonos pequeños dentro de la distancia especificada.

Aplicaciones potenciales

  • Búsqueda de picos inesperados en la cantidad de visitas a urgencias, lo que podría indicar el brote de un problema sanitario local o regional.
  • Comparación del patrón espacial de distintos tipos de minoristas de una ciudad para ver los tipos que se agrupan con la competencia para sacar partido de la compra con comparación de precios (como concesionarios de coches) y los tipos que evitan la competencia (como gimnasios).
  • Resumen del nivel en el que se agrupan fenómenos espaciales para examinar cambios en distintos momentos o ubicaciones. Por ejemplo, si se sabe que las ciudades y sus poblaciones se agrupan. Mediante Clustering alto/bajo (G general de Getis-Ord) puede comparar el nivel de población que se agrupa en una sola ciudad a lo largo del tiempo (análisis de densidad y crecimiento urbanos).

Recursos adicionales

Getis, Arthur y J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics." Geographical Analysis 24, n.º 3. 1992.

Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. Esri Press, 2005.