Cómo funciona Autocorrelación espacial (I de Moran global)

La herramienta Autocorrelación espacial (I de Moran global) mide la autocorrelación espacial basada en las ubicaciones y los valores de las entidades simultáneamente. Dado un conjunto de entidades y un atributo asociado, evalúa si el patrón expresado está agrupado, disperso o es aleatorio. La herramienta calcula el valor del Índice I de Moran y una puntuación z y un valor P para evaluar la significancia de ese índice. Los valores P son aproximaciones numéricas del área debajo de la curva de una distribución conocida, limitada por la estadística de prueba.

Cálculos

Operaciones matemáticas utilizadas para calcular I de Moran global

Ver operaciones matemáticas adicionales para I de Moran global

Más arriba se muestran las operaciones matemáticas para la estadística I de Moran global. La herramienta calcula el valor medio y la varianza para el atributo que se evalúa. A continuación, resta el valor medio en cada valor de la entidad, lo que crea una desviación del valor medio. Los valores de desviación para todas las entidades vecinas (por ejemplo, las entidades dentro de la banda de distancia especificada) se multiplican de forma conjunta para crear un producto cruzado. Note que el numerador para la estadística I de Moran global suma estos productos cruzados. Supongamos que las entidades A y B son vecinas y que el valor medio para todos los valores de entidades es 10. Tenga en cuenta el rango de resultados posibles de los productos cruzados:

Valores de entidades

Desviaciones

Productos cruzados

A=50

B=40

40

30

1200

A= 8

B=6

-2

-4

8

A=20

B=2

10

-8

-80

Cuando los valores para las entidades vecinas son mayores que el valor medio o menores que el valor medio, el producto cruzado será positivo. Cuando un valor es menor que el valor medio y el otro es mayor que el valor medio, el producto cruzado será negativo. En todos los casos, mientras mayor sea la desviación del valor medio, mayor será el resultado del producto cruzado. Si los valores en el dataset tienden a agruparse espacialmente (los valores altos se agrupan cerca de otros valores altos; los valores bajos se agrupan cerca de otros valores bajos), el Índice de Moran será positivo. Cuando los valores altos rechazan otros valores altos y tienden a estar cerca de valores bajos, el Índice será negativo. Si los valores positivos de los productos cruzados equilibran los valores negativos de los productos cruzados, el Índice será cercano a cero. El numerador está normalizado por la varianza de modo que los valores del Índice oscilan entre -1,0 y +1,0 (vea la sección Preguntas frecuentes a continuación para conocer las excepciones).

Después de calcular el valor del Índice, la herramienta Autocorrelación espacial (I de Moran global) calcula el valor del Índice esperado. Después se comparan los valores del Índice esperado y del Índice observado. Dado el número de entidades en el dataset y la varianza del total de los valores de datos, la herramienta calcula una puntuación z y un valor P que indican si esta diferencia es estadísticamente significativa. Los valores del índice no se pueden interpretar directamente; sólo se pueden interpretar dentro del contexto de la hipótesis nula.

Interpretación

La herramienta Autocorrelación espacial (I de Moran) es una estadística deductiva, lo que significa que los resultados del análisis siempre se interpretan dentro del contexto de la hipótesis nula. Para la estadística I de Moran global, la hipótesis nula establece que el atributo que se analiza está distribuido en forma aleatoria entre las entidades del área de estudio; es decir, los procesos espaciales que promueven el patrón de valores observado constituyen una opción aleatoria. Imagínese que pudiera elegir los valores para al atributo que analiza, arrojarlos sobre las entidades y dejar que cada valor caiga donde caiga. Este proceso (elegir y arrojar los valores) es un ejemplo de un proceso espacial de opción aleatoria.

Cuando el valor P que devuelve esta herramienta es estadísticamente significativo, puede rechazar la hipótesis nula. La siguiente tabla resume la interpretación de los resultados:

El valor P no es estadísticamente significativo.

No puede rechazar la hipótesis nula. Es posible que la distribución espacial de los valores de entidades sea el resultado de procesos espaciales aleatorios. El patrón espacial observado de los valores de entidades podría ser cualquiera de las tantas versiones posibles de aleatoriedad espacial completa (CSR).

El valor P es estadísticamente significativo y la puntuación z es positiva.

Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los valores bajos en el dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran aleatorios.

El valor P es estadísticamente significativo y la puntuación z es negativa.

Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los valores bajos en el dataset está más dispersa espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran aleatorios. Un patrón espacial disperso suele reflejar algún tipo de proceso competitivo: una entidad con un valor alto rechaza a otras entidades con valores altos; del mismo modo, una entidad con un valor bajo rechaza a otras entidades con valores bajos.

Nota:

La hipótesis nula para las herramientas Clustering alto/bajo (G general) y Autocorrelación espacial (I de Moran global) es Aleatoriedad espacial completa. Sin embargo, la interpretación de las puntuaciones z para la herramienta Clustering alto/bajo (G general) es diferente.

Salida

Pautas de mejores prácticas

  • ¿La Clase de entidad de entrada contiene al menos 30 entidades? Los resultados no son confiables con menos de 30 entidades.
  • ¿Es adecuada la Conceptualización de relaciones espaciales que seleccionó? Vea Seleccionar una conceptualización de relaciones espaciales.
  • ¿Es adecuada la Banda de distancia o distancia de umbral? Consulte Seleccionar una distancia fija.
    • Todas las entidades deben tener al menos un vecino.
    • Ninguna entidad debe tener todas las otras entidades como un vecino.
    • Especialmente si los valores para el Campo de entrada están sesgados, querrá que las entidades tengan aproximadamente ocho vecinos cada una.
  • ¿Debe realizar una estandarización de filas? Para las entidades de polígono, casi siempre deseará realizar una estandarización de filas. Vea Estandarización.

Preguntas frecuentes

P: Los resultados de la herramienta Análisis de punto caliente (Gi* de Getis-Ord) indican los puntos calientes que son significativos desde el punto de vista estadístico. ¿Por qué los resultados de la herramienta Autocorrelación espacial (I de Moran global) no son estadísticamente significativos también?

R: Las estadísticas globales como la herramienta Autocorrelación espacial (I de Moran) evalúan el patrón y la tendencia general de los datos. Son más efectivas cuando el patrón espacial es consistente en toda el área de estudio. Las estadísticas locales (como la herramienta Análisis de punto caliente [Gi* de Getis-Ord]) evalúan cada entidad dentro del contexto de entidades vecinas y comparan la situación local con la situación global. Considere un ejemplo. Cuando calcula una media o un promedio para un conjunto de valores, también está calculando una estadística global. Si todos los valores están cerca de 20, la media también estará cerca de 20, y dicho resultado será un buen resumen/una buena representación de todo el dataset. Pero si la mitad de los valores está cerca de 1 y la otra mitad de los valores está cerca de 100, la media estará cerca de 50. Puede que no haya valores de datos cerca de 50, de modo que el valor medio no es un buen resumen/una buena representación de todo el dataset. Si crea un histograma de los valores de los datos, podrá ver la distribución de dos modelos. Del mismo modo, las estadísticas espaciales globales, incluida la herramienta Autocorrelación espacial (I de Moran global), son más efectivas cuando los procesos espaciales que se miden son consistentes en toda el área de estudio. Los resultados serán entonces un buen resumen/una buena representación del patrón espacial general. Para obtener más información, consulte Getis y Ord (1992), que se menciona más abajo, y el análisis de SIDS que presentan.

 

P: ¿Por qué los resultados de la herramienta Clustering alto/bajo (G general de Getis-Ord) son distintos de los resultados de la herramienta Autocorrelación espacial (I de Moran)?

R: Estas herramientas miden distintos patrones espaciales. Haga clic aquí para obtener más información.

 

P: ¿Puede comparar las puntuaciones z o los valores P de esta herramienta con los resultados de análisis para áreas de estudio diferentes?

R: Los resultados de distintas áreas de estudio no se pueden comparar entre sí. No obstante, cuando el área de estudio es fija (por ejemplo, todos los análisis son para condados de California), el Campo de entrada es comparable (por ejemplo, todos los análisis incluyen algún tipo de conteo de población) y los parámetros de la herramienta son los mismos (por ejemplo, Distancia fija con una Banda de distancia o distancia de umbral de 5.000 metros y Estandarización de filas), se pueden comparar las puntuaciones z estadísticamente significativas para obtener una idea de la intensidad del clustering o la dispersión espacial o para comprender mejor las tendencias a lo largo del tiempo. También puede ejecutar el análisis para una serie de valores en aumento de Banda de distancia o distancia de umbral para ver la distancia/escala donde los procesos que promueven el clustering espacial son más pronunciados.

 

P: ¿Por qué obtengo un Índice de Moran mayor que 1,0 o menor que -1,0?

R: En general, el Índice de Moran global está delimitado entre -1,0 y 1,0. Esto sucede siempre que los pesos están estandarizados por fila. Cuando los pesos no están estandarizados por fila, puede haber instancias en las que el valor del Índice esté fuera del rango entre -1,0 y 1,0, lo que indica que existe un problema con la configuración del parámetro. Los problemas más comunes son los siguientes:

  • El Campo de entrada está muy sesgado (para ver esto, cree un histograma de los valores de datos) y la Conceptualización de relaciones espaciales o la Banda de distancia es tal que algunas entidades tienen muy pocos vecinos. La estadística I de Moran global es asintóticamente normal, lo que significa que para los datos sesgados, deseará que cada entidad tenga como mínimo ocho vecinos. El valor predeterminado que se calcula para el parámetro Banda de distancia o distancia de umbral garantiza que todas las entidades tengan como mínimo un vecino, pero es probable que esto no sea suficiente, especialmente cuando los valores del Campo de entrada están muy sesgados.
  • Se utiliza una Conceptualización de relaciones espaciales de Distancia inversa, y las distancias invertidas son muy pequeñas.
  • La Estandarización de filas no está seleccionada, pero debería estarlo. Cuando se agregan los datos, debe seleccionar estandarización de filas a menos que el esquema de agregación se relacione directamente con el campo que está analizando.

Potenciales aplicaciones

  • Ayudar a identificar una distancia de la vecindad adecuada para diversos métodos de análisis espacial al buscar la distancia donde la autocorrelación espacial es mayor.
  • Medir tendencias generales con respecto a la segregación étnica o racial a lo largo del tiempo: ¿la segregación aumenta o disminuye?
  • Resumir la difusión de una idea, enfermedad o tendencia en el espacio y el tiempo: ¿la idea, enfermedad o tendencia permanece aislada o concentrada, o se propaga y se vuelve más difusa?

Recursos adicionales

Los siguientes libros y artículos de publicaciones incluyen más información sobre esta herramienta:

Getis, Arthur y J. K. Ord. "The Analysis of Spatial Association by Use of Distance Statistics". Geographical Analysis 24, Nº 3. 1992.

Goodchild, Michael F. Spatial Autocorrelation. Catmog 47, Geo Books. 1986.

Griffith, Daniel. Spatial Autocorrelation: A Primer. Resource Publications in Geography, Association of American Geographers. 1987.

Mitchell, Andy. La Guía de Esri para el análisis SIG, Volumen 2. Esri Press, 2005.