Se puede considerar que una banda de distancia fija es una ventana de análisis en movimiento que se establece momentáneamente en la parte superior de cada entidad y visualiza esa entidad en el contexto de sus vecinos. Las siguientes directrices y prácticas recomendadas le ayudarán a identificar una banda de distancia adecuada para su análisis:
- Seleccione una distancia basado en lo que sabe sobre la extensión geográfica de los procesos espaciales que promocionan el clustering para los fenómenos que está estudiando. Por lo general, no lo sabrá, pero si lo sabe, utilice este conocimiento para seleccionar un valor de distancia. Supongamos, por ejemplo, que sabe que la distancia de viaje promedio al trabajo es de 15 millas. Utilizar 15 millas para la banda de distancia es una buena estrategia para analizar datos sobre desplazamiento al trabajo.
- Utilice una banda de distancia que sea lo suficientemente grande como para garantizar que todas las entidades tendrán al menos un vecino, o los resultados no serán válidos.
- Si los datos de entrada están sesgados (y no crean una curva de campana cuando traza los valores como un histograma), asegúrese de que la banda de distancia no sea ni demasiado pequeña (la mayoría de las entidades solo tienen uno o dos vecinos) ni demasiado grande (varias entidades incluyen todas las demás entidades como vecinos), ya que eso hará que las puntuaciones z resultantes sean menos fiables.
- Las puntuaciones z son fiables (aún con datos sesgados) siempre y cuando la banda de distancia sea lo suficientemente grande como para garantizar varios vecinos (aproximadamente ocho) para cada entidad. Incluso si ninguna de las entidades tiene a las demás como vecinos, se pueden generar problemas de rendimiento y posibles limitaciones de memoria si crea una banda de distancia en la que las entidades tienen miles de vecinos.
- En ocasiones, garantizar que todas las entidades tengan al menos un vecino provoca que algunas tengan varios miles de vecinos, lo que no es ideal. Esto puede suceder cuando algunas de sus entidades son valores atípicos espaciales. Para resolver este problema, busque una banda de distancia adecuada para todas salvo para los valores atípicos espaciales y utilice la herramienta Generar matriz de ponderaciones espaciales para crear un archivo de matriz de ponderaciones espaciales que use esa distancia. Sin embargo, cuando ejecuta la herramienta Generar matriz de ponderaciones espaciales, especifique un número mínimo del valor de vecinos para el parámetro Número de vecinos. Por ejemplo, supongamos que está evaluando el acceso a alimentos saludables en el condado de Los Ángeles utilizando datos del distrito censal. Sabe que más del 90 por ciento de la población vive a menos de 3 millas de opciones para ir de compras. Si está analizando distritos censales, podría descubrir que las distancias entre distritos (basadas en centroides de distritos) en la región del centro de la ciudad son de unos 1.000 metros de media, pero las distancias entre distritos de áreas periféricas superan los 18.000 metros. Para garantizar que todas las entidades tengan al menos un vecino, es necesario que la banda de distancia supere los 18.000 metros. Esta escala de análisis (distancia) no es adecuada para las preguntas que plantea. La solución es crear un archivo de matriz de ponderaciones espaciales para la clase de entidad del distrito censal utilizando la herramienta Generar matriz de ponderaciones espaciales. Especifique un valor para la Banda de distancia o Distancia de umbral que tenga sentido para todos los valores salvo los valores atípicos espaciales (por ejemplo 4.800 metros –unas 3 millas–) y un número mínimo del valor de vecinos para el parámetro Cantidad de vecinos (por ejemplo, 2). Esto aplicará la vecindad de una distancia fija de 4.800 metros a todas las entidades excepto aquellas que no tengan al menos 2 vecinos que utilicen esa distancia. En caso de las entidades con valores atípicos (y solamente para ellas), la distancia se ampliará lo suficiente como para garantizar que cada entidad tenga al menos 2 vecinos.
- Utilice una banda de distancia que refleje una autocorrelación espacial máxima. Siempre que vea clustering espacial en el apaisado, ve evidencia de procesos espaciales subyacentes en el trabajo. La banda de distancia que muestra un clustering máximo, según mide la herramienta Autocorrelación espacial incremental, es la distancia en la que esos procesos espaciales son más activos o más pronunciados. Ejecute la herramienta Autocorrelación espacial incremental y observe dónde parece que hay un pico en las puntuaciones z resultantes. Utilice la distancia asociada con el valor máximo para el análisis.
Nota:
Introduzca valores de distancia con las mismas unidades que las especificadas por la referencia espacial de la capa del entorno de geoprocesamiento Sistema de coordenadas de salida.
- Cada pico representa una distancia en la que se marcan los procesos que promueven un clustering espacial. Los picos múltiples son comunes. En general, los picos asociados con distancias más largas reflejan tendencias amplias (por ejemplo, una tendencia amplia de este a oeste, donde el oeste es un punto caliente gigante y el este es un punto frío gigante). En general, usted será la persona más interesada en los picos asociados con distancias más pequeñas, normalmente, el primer pico.
- Un pico que pasa desapercibido por lo general significa que hay varios procesos espaciales diferentes que operan en una variedad de escalas espaciales. Probablemente desee buscar otros criterios para determinar qué distancia fija utilizar para el análisis (quizás la distancia más efectiva para la solución).
- Si la puntuación z nunca alcanza el pico (en otras palabras, sigue aumentando) y si utiliza datos agregados (por ejemplo, condados), por lo general significa que el esquema de agregación es demasiado grueso; los procesos espaciales de interés operan en una escala que es menor que la escala de las unidades de agregación. Si puede pasar a una escala de análisis más pequeña (pasar de condados a distritos, por ejemplo), puede ser de ayuda para encontrar una distancia pico. Si está trabajando con datos de punto y la puntuación z nunca se eleva, significa que hay muchos procesos espaciales diferentes que operan en una variedad de escalas espaciales y es posible que deba idear diferentes criterios para determinar la distancia fija a utilizar en el análisis. Además, cuando ejecute la herramienta Autocorrelación espacial incremental, confirme que el valor Distancia de inicio no sea demasiado elevado.
- Si no especifica una distancia de inicio, la herramienta Autocorrelación espacial incremental utilizará la distancia que garantice que todas las entidades tengan como mínimo un vecino. Sin embargo, si los datos incluyen valores atípicos espaciales, esa distancia podría ser demasiado grande para su análisis y puede ser la razón por la que no ve un pico pronunciado en el Archivo de informe de salida. La solución es ejecutar la herramienta Autocorrelación espacial incremental en un conjunto de selección que temporalmente excluye todos los valores atípicos espaciales. Si se encuentra un pico en los valores atípicos excluidos, utilice la estrategia que se describe anteriormente con esa distancia pico aplicada a todas las entidades (incluidos los valores atípicos espaciales) y obligue a cada entidad a que tenga al menos uno o dos vecinos. Si no está seguro si alguna de las entidades son valores atípicos espaciales, intente lo siguiente:
- Para datos de polígonos, represente las áreas de polígonos con un esquema de representación en pantalla de Desviación estándar y considere que los polígonos con áreas mayores de tres desviaciones estándar sean valores atípicos espaciales. Puede utilizar la herramienta Calcular campo para crear un campo con áreas de polígonos, si todavía no tiene ninguno.
- Para los datos de punto, utilice la herramienta Cercano para calcular la distancia del vecino más cercano para cada entidad. Para ello, defina los parámetros Entidades de entrada y Entidades próximas de la herramienta Cerca en su dataset de puntos. Cuando tenga un campo con distancias de vecino más cercano, represente los valores con un esquema de representación en pantalla de Desviación estándar y considere que las distancias mayores que tres desviaciones estándar sean valores atípicos espaciales.
- Trate de no estancarse en la idea de que hay solamente una banda de distancia correcta. La realidad nunca es tan simple. Es muy probable que haya varios procesos espaciales o que interactúan y que promueven el clustering observado. En lugar de pensar que necesita una banda de distancia, piense en las herramientas de análisis de patrón como métodos efectivos para explorar las relaciones espaciales en múltiples escalas espaciales. Tenga en cuenta que, cuando cambie la escala del análisis (cambiando el valor de banda de distancia), podría estar planteando otra pregunta. Supongamos que observa los datos de ingresos. Con pequeñas bandas de distancia, puede examinar patrones de ingresos de vecinos, las distancias de escala media pueden reflejar patrones de ingresos de la comunidad o la cuidad, y las bandas de distancia más grandes resaltarían patrones de ingresos regionales amplios.