Autocorrelación espacial incremental (Estadística espacial)

Resumen

Mide la autocorrelación espacial de una serie de distancias y, de manera opcional, crea un gráfico de línea de esas distancias y sus correspondientes puntuaciones z. Las puntuaciones z reflejan la intensidad del clustering espacial y las puntuaciones z pico estadísticamente significativas indican las distancias donde los procesos espaciales que promueven el clustering son más marcadas. Estas distancias pico son a menudo los valores adecuados para utilizar para herramientas con un parámetro de Radio de distancia o Banda de distancia.

Ilustración

Ilustración de herramienta Autocorrelación espacial incremental
Los picos de puntuación z reflejan las distancias donde los procesos espaciales que promueven el clustering son más pronunciados.

Uso

  • Utilice esta herramienta para especificar un valor apropiado para el parámetro Umbral de distancia o Radio en las herramientas que tienen estos parámetros, como Análisis de punto caliente o Densidad de punto.

  • La herramienta Autocorrelación espacial incremental mide la autocorrelación espacial de una serie de incrementos de distancia e informes, para cada incremento de distancia, el Índice de Moran asociado, Índice esperado, Varianza, puntuación z y el valor p. Los valores se escriben como mensajes cuando se ejecuta la herramienta. Los mensajes también incluyen un gráfico de líneas de Autocorrelación espacial por distancia que muestra la puntuación z para cada distancia.

  • Cuando hay más de un pico estadísticamente significativo, el clustering se pronuncia en cada una de esas distancias. Seleccione la distancia pico que mejor corresponde a la escala de análisis en la que está interesado; con frecuencia, este es el primer pico estadísticamente significativo que se encuentra.

  • El valor del parámetro Campo de entrada debe contener una variedad de valores. La operación matemática para esta estadística requiere cierta variación en la variable analizada; no puede resolver si todos los valores de entrada son 1, por ejemplo. Para utilizar esta herramienta para analizar el patrón espacial de los datos de incidentes, considere agregar los datos de incidentes.

  • Cuando el valor del parámetro Clase de entidad de entrada no está proyectada (es decir, cuando las coordenadas se especifican en grados, minutos y segundos) o cuando el sistema de coordenadas de salida está establecido en un sistema de coordenadas geográficas, las distancias se calculan mediante mediciones de cuerda. Las mediciones de distancia de cuerda se utilizan porque se pueden calcular rápidamente y proporcionan buenas estimaciones de las verdaderas distancias geodésicas, al menos para los puntos separados un máximo de unos treinta grados entre sí. Las distancias de cuerda se basan en un esferoide oblato. Dados dos puntos en la superficie de la Tierra, la distancia de cuerda entre ellos es la longitud de una línea, que atraviesa la Tierra tridimensional, para conectar estos dos puntos. Las distancias de cuerda se informan en metros.

    Precaución:

    Asegúrese de proyectar los datos si el área de estudio se extiende más allá de 30 grados. Las distancias de cuerda no son una buena estimación de las distancias geodésicas más allá de 30 grados.

  • Cuando se utilizan distancias de cuerda en el análisis, los valores de los parámetros Distancia de inicio e Incremento de distancia, si se proporcionan, deben darse en metros.

  • Los centroides de entidad se utilizan en los cálculos de distancia para las entidades de línea y polígono. Para multipuntos, polilíneas o polígonos con varias partes, el centroide se calcula utilizando el centro medio ponderado de todas las partes de entidad. La ponderación para las entidades de punto es 1, para las entidades de línea es longitud y para las entidades de polígono es área.

  • Las capas del mapa se pueden utilizar para definir la Clase de entidad de entrada. Cuando se utiliza una capa con una selección, solo las entidades seleccionadas se incluyen en el análisis.

  • Para las entidades de polígono, casi siempre deseará especificar Fila para el parámetro Estandarización de filas. El parámetro Estandarización de filas reduce el sesgo cuando la cantidad de vecinos que posee cada entidad es una función del esquema de agregación o proceso de muestreo, en lugar de reflejar la distribución espacial real de la variable que está analizando.

  • Si no se especifica ningún valor para el parámetro Distancia de inicio, el valor predeterminado es la distancia mínima requerida para que cada entidad del dataset tenga al menos un vecino (la distancia máxima del vecino más cercano entre todas las entidades). Es posible que esta no sea la distancia de inicio más apropiada si el dataset incluye valores atípicos de ubicación.

  • Si no se especifica ningún valor para el parámetro Distancia de aumento, se utiliza la distancia promedio menor de vecinos más cercanos o (Td - B) / I, donde Td es una distancia de umbral máxima, B es el valor del parámetro Distancia de inicio y I es el valor del parámetro Cantidad de bandas de distancia. Este algoritmo garantiza que los cálculos siempre se realizarán para el valor de Cantidad de bandas de distancia especificado y que las mayores bandas de distancia no lo serán tanto como para que algunas entidades tengan todas o casi todas las demás entidades como vecinas.

  • Si los valores de los parámetros Distancia de inicio o Distancia de aumento dan como resultado una banda de distancia que es mayor que la máxima distancia de umbral, el valor Distancia de aumento reducirá la escala automáticamente. Para evitar este ajuste, puede reducir el valor Distancia de aumento o reducir el valor Cantidad de bandas de distancia.

  • Es posible que la memoria sea insuficiente cuando ejecuta esta herramienta. Generalmente, esto se produce cuando se especifica un valor para los parámetros Distancia de inicio o Distancia de aumento que genera entidades con miles de vecinos. Es mejor no crear relaciones espaciales donde las entidades tengan miles de vecinos. Utilice un valor más pequeño para el valor Distancia de aumento y elimine temporalmente los valores atípicos de ubicación para empezar con un valor de Distancia de inicio menor.

  • Incluso cuando la herramienta calcula los valores de los parámetros Distancia de inicio y Distancia de aumento, el tiempo de procesamiento puede ser largo para datasets grandes. Puede mejorar el rendimiento haciendo lo siguiente:

    • Elimine temporalmente los valores atípicos de ubicación (como se indicó anteriormente).
    • Ejecute el análisis en entidades seleccionadas en una parte representativa del área de estudio en lugar de en todas las entidades.
    • Tome una muestra aleatoria de entidades del dataset y ejecute el análisis en las entidades muestreadas.

  • Las distancias siempre se basan en la configuración del entorno Sistema de coordenadas de salida. La opción predeterminada para el entorno del Sistema de coordenadas de salida es Igual que la entrada. Las entidades de entrada se proyectan al sistema de coordenadas de salida antes de ejecutar el análisis.

  • El valor del parámetro Tabla de salida opcional incluirá el valor de distancia en cada iteración, el valor del Índice I de Moran, el valor esperado del Índice I de Moran, la varianza, la puntuación z y el valor p. Un pico supondría un aumento en el valor de la puntuación z, seguido por una caída en el valor de la puntuación z. Por ejemplo, si la herramienta encuentra puntuaciones z para distancias de 50, 100 y 150 metros, 2,95, 3,68, 3,12, el pico sería 100 metros. La tabla de salida también incluye un gráfico de líneas de Autocorrelación espacial por distancia que muestra la puntuación z para cada distancia que puede utilizar para identificar los picos.

  • Cuando se utiliza esta herramienta desde Python, el objeto resultado devuelto al ejecutar la herramienta tiene las siguientes salidas:

    PosiciónDescripciónTipo de datos

    0

    Primer pico

    Doble

    1

    Pico máximo

    Doble

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades de entrada

La clase de entidad para la que se medirá la autocorrelación espacial en una serie de distancias.

Feature Layer
Campo de entrada

El campo numérico que se utilizará en la evaluación de la autocorrelación espacial.

Field
Cantidad de bandas de distancia

El número de veces que se incrementará el tamaño de la vecindad y que se analizará el dataset para determinar la autocorrelación espacial. El punto de inicio y el tamaño del incremento se especifican mediante los parámetros Distancia de inicio e Incremento de distancia, respectivamente.

Long
Distancia de inicio
(Opcional)

La distancia a la que empezará el análisis de autocorrelación espacial y la distancia a partir de la cual se incrementará. El valor proporcionado para este parámetro debe estar en las unidades de la configuración del entorno del Sistema de coordenadas de salida.

Double
Incremento de distancia
(Opcional)

La distancia que se incrementará después de cada iteración. La distancia que se utiliza en el análisis comienza en el valor del parámetro Distancia de inicio y aumenta según la cantidad especificada en el valor del parámetro Incremento de distancia. El valor proporcionado para este parámetro debe estar en las unidades de la configuración del entorno del Sistema de coordenadas de salida.

Double
Método de distancia
(Opcional)

Especifica cómo se calcularán las distancias desde cada entidad hasta las entidades vecinas.

  • EuclidianoLas distancias se calcularán usando la distancia en línea recta entre dos puntos (como a vuelo de pájaro). Esta es la opción predeterminada.
  • ManhattanLas distancias se calcularán utilizando la distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana), que se calcula sumando la diferencia (absoluta) entre las coordenadas x e y.
String
Estandarización de filas
(Opcional)

Especifica si las ponderaciones espaciales se estandarizan. Se recomienda la estandarización de filas siempre que la distribución de entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.

  • Activado: las ponderaciones espaciales se estandarizarán. Cada ponderación se dividirá por la suma de su fila (la suma de los pesos de todas las entidades vecinas). Esta es la opción predeterminada.
  • Desactivado: las ponderaciones espaciales no se estandarizarán.
Boolean
Tabla de Salida
(Opcional)

La tabla que se creará con cada banda de distancia y resultado de la puntuación z asociado.

Table
Archivo de informe de salida
(Opcional)

El archivo .pdf que se creará y que contendrá un gráfico de línea que resume los resultados.

File

Salida derivada

EtiquetaExplicaciónTipo de datos
Primer pico

La primera puntuación z pico.

Double
Pico máximo

La puntuación z pico máxima.

Double

arcpy.stats.IncrementalSpatialAutocorrelation(Input_Features, Input_Field, Number_of_Distance_Bands, {Beginning_Distance}, {Distance_Increment}, {Distance_Method}, {Row_Standardization}, {Output_Table}, {Output_Report_File})
NombreExplicaciónTipo de datos
Input_Features

La clase de entidad para la que se medirá la autocorrelación espacial en una serie de distancias.

Feature Layer
Input_Field

El campo numérico que se utilizará en la evaluación de la autocorrelación espacial.

Field
Number_of_Distance_Bands

El número de veces que se incrementará el tamaño de la vecindad y que se analizará el dataset para determinar la autocorrelación espacial. El punto de inicio y el tamaño del incremento se especifican mediante los parámetros Beginning_Distance y Distance_Increment, respectivamente.

Long
Beginning_Distance
(Opcional)

La distancia a la que empezará el análisis de autocorrelación espacial y la distancia a partir de la cual se incrementará. El valor proporcionado para este parámetro debe estar en las unidades de la configuración del entorno del Sistema de coordenadas de salida.

Double
Distance_Increment
(Opcional)

La distancia que se incrementará después de cada iteración. La distancia que se utiliza en el análisis comienza en el valor del parámetro Beginning_Distance y aumenta según la cantidad especificada en el valor del parámetro Distance_Increment. El valor proporcionado para este parámetro debe estar en las unidades de la configuración del entorno del Sistema de coordenadas de salida.

Double
Distance_Method
(Opcional)

Especifica cómo se calcularán las distancias desde cada entidad hasta las entidades vecinas.

  • EUCLIDEANLas distancias se calcularán usando la distancia en línea recta entre dos puntos (como a vuelo de pájaro). Esta es la opción predeterminada.
  • MANHATTANLas distancias se calcularán utilizando la distancia entre dos puntos medida a lo largo de los ejes en ángulos rectos (manzana), que se calcula sumando la diferencia (absoluta) entre las coordenadas x e y.
String
Row_Standardization
(Opcional)

Especifica si las ponderaciones espaciales se estandarizan. Se recomienda la estandarización de filas siempre que la distribución de entidades esté potencialmente influenciada debido al diseño de muestreo o a un esquema de agregación impuesto.

  • ROW_STANDARDIZATIONLas ponderaciones espaciales se estandarizarán. Cada ponderación se dividirá por la suma de su fila (la suma de los pesos de todas las entidades vecinas). Esta es la opción predeterminada.
  • NO_STANDARDIZATIONLas ponderaciones espaciales no se estandarizarán.
Boolean
Output_Table
(Opcional)

La tabla que se creará con cada banda de distancia y resultado de la puntuación z asociado.

Table
Output_Report_File
(Opcional)

El archivo .pdf que se creará y que contendrá un gráfico de línea que resume los resultados.

File

Salida derivada

NombreExplicaciónTipo de datos
First_Peak

La primera puntuación z pico.

Double
Max_Peak

La puntuación z pico máxima.

Double

Muestra de código

IncrementalSpatialAutocorrelation ejemplo 1 (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función IncrementalSpatialAutocorrelation.

import arcpy
arcpy.env.workspace = r"C:\ISA"
arcpy.stats.IncrementalSpatialAutocorrelation("911CallsCount.shp", "ICOUNT", 
                                              "20", "", "", "EUCLIDEAN",
                                              "ROW_STANDARDIZATION", 
                                              "outTable.dbf")
Ejemplo 2 de IncrementalSpatialAutocorrelation (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función IncrementalSpatialAutocorrelation.

# Hot Spot Analysis of 911 calls in a metropolitan area
# using the Incremental Spatial Autocorrelation and Hot Spot Analysis Tools

# Import system modules
import arcpy

# Set property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables
workspace = r"C:\ISA"

try:
    # Set the current workspace (to avoid having to specify the full path to 
    # the feature classes each time)
    arcpy.env.workspace = workspace

    # Copy the input feature class and integrate the points to snap together at 
    # 30 feet
    # Process: Copy Features and Integrate
    cf = arcpy.management.CopyFeatures("911Calls.shp", "911Copied.shp")
    integrate = arcpy.management.Integrate("911Copied.shp #", "30 Feet")

    # Use Collect Events to count the number of calls at each location
    # Process: Collect Events
    ce = arcpy.stats.CollectEvents("911Copied.shp", "911Count.shp")

    # Use Incremental Spatial Autocorrelation to get the peak distance
    # Process: Incremental Spatial Autocorrelation
    isa = arcpy.stats.IncrementalSpatialAutocorrelation(ce, "ICOUNT", "20", "", 
                     "", "EUCLIDEAN", "ROW_STANDARDIZATION", "outTable.dbf", 
                     "outReport.pdf")

    # Hot Spot Analysis of 911 Calls
    # Process: Hot Spot Analysis (Getis-Ord Gi*)
    distance = isa.getOutput(2)
    hs = arcpy.stats.HotSpots(ce, "ICOUNT", "911HotSpots.shp", "Fixed Distance Band",
                     "Euclidean Distance", "None",  distance, "", "")

except arcpy.ExecuteError:
    # If an error occurred when running the tool, print out the error message.
    print(arcpy.GetMessages())

Entornos

Casos especiales

Sistema de coordenadas de salida

La geometría de entidades se proyecta al Sistema de coordenadas de salida antes del análisis. Todos los cómputos matemáticos se basan en la referencia espacial del Sistema de coordenadas de salida. Cuando el entorno del Sistema de coordenadas de salida se basa en grados, minutos y segundos, las distancias geodésicas se calculan mediante distancias de cuerda.