Análisis de puntos calientes emergentes (Minería de patrones en espacio-tiempo)

Resumen

Identifica tendencias en el clustering de densidades de puntos (recuentos) o valores de un cubo de espacio-tiempo creado con la herramienta Crear cubo de espacio-tiempo agregando puntos, Crear cubo de espacio-tiempo a partir de ubicaciones definidas o Crear cubo de espacio-tiempo a partir de capa ráster multidimensional. Las categorías incluyen puntos calientes y fríos nuevos, consecutivos, en aumento, persistentes, en disminución, esporádicos, oscilantes e históricos.

Más información sobre cómo funciona la herramienta Análisis de puntos calientes emergentes

Ilustración

Ilustración de la herramienta Análisis de puntos calientes emergentes

Uso

  • Esta herramienta acepta archivos netCDF creados por varias herramientas en la caja de herramientas Minería de patrones en espacio-tiempo.

    Más información sobre la creación de un cubo de espacio-tiempo

  • Cada bin del cubo de espacio-tiempo tiene un valor LOCATION_ID, time_step_ID y COUNT, además de cualquier Campo de resumen o Variable que se agregara cuando se creó el cubo. Los bins que estén asociados a la misma ubicación física compartirán el mismo Id. de ubicación y, conjuntamente, representarán una serie temporal. Los bins que estén asociados al mismo periodo de tiempo compartirán el mismo Id. de periodo de tiempo y, conjuntamente, formarán un intervalo de tiempo. El valor del recuento de cada bin refleja la cantidad de incidentes o registros ocurridos en la ubicación asociada junto con el intervalo de tiempo asociado.

    Cada bin tiene un Id. de ubicación, un Id. de período de tiempo y un recuento

  • Esta herramienta analiza una variable en el Cubo de espacio-tiempo de entrada netCDF utilizando una implementación de espacio-tiempo de la estadística Gi* de Getis-Ord.

  • Las Entidades de salida se agregarán al panel de Contenido con una representación en la que se resumen los resultados del análisis de espacio-tiempo para todas las ubicaciones analizadas. Si especifica una Máscara de análisis de polígonos, las ubicaciones analizadas serán las que estén incluidas en la máscara de análisis; de lo contrario, las ubicaciones analizadas serán aquellas que tengan al menos un punto para un período de tiempo como mínimo.

    Ubicaciones de cubo con y sin datos.

  • Además de las Entidades de salida, se escribe un resumen del análisis como mensajes en la parte inferior del panel Geoprocesamiento durante la ejecución de la herramienta. Puede acceder a los mensajes desplazándose sobre la barra de progreso, haciendo clic en el botón emergente Ventana emergente o expandiendo la sección de detalles de los mensajes del panel Geoprocesamiento. También puede acceder a los mensajes de una herramienta ejecutada anteriormente a través del Historial de geoprocesamiento.

  • La herramienta Análisis de puntos calientes emergentes puede detectar ocho tendencias de puntos calientes o fríos concretos: nuevos, consecutivos, en aumento, persistentes, en disminución, esporádicos, oscilantes e históricos. Consulte Más información sobre cómo funciona la herramienta Análisis de puntos calientes emergentes para definiciones de categoría de salida, así como información adicional sobre los algoritmos que se utilizan en esta herramienta.

  • Para obtener una medida de la intensidad del clustering de entidades, esta herramienta utiliza una implementación de espacio-tiempo de la estadística Gi* de Getis-Ord, que considera el valor en cada bin en el contexto de los valores de los bins vecinos.

  • Para determinar los bins que se van a incluir en la vecindad de cada análisis, primero la herramienta busca los bins vecinos que están incluidos dentro de la Conceptualización de relaciones espaciales especificada. A continuación, para cada uno de esos bins, incluye bins en las mismas ubicaciones que los intervalos de tiempo N anteriores, donde N corresponde al valor de Período de tiempo de vecindad que ha especificado.

  • Su elección del parámetro Conceptualización de relaciones espaciales deberá reflejar relaciones inherentes entre las entidades que analiza. Cuanto más pueda modelar de manera realista cómo interactúan mutuamente las entidades en el espacio, más precisos serán sus resultados. Las recomendaciones se describen en Seleccionar una conceptualización de relaciones espaciales.

  • La Conceptualización de relaciones espaciales predeterminada es Distancia fija. Se considera que un bin es vecino si su centroide cae dentro de la Distancia de vecindad y su intervalo de tiempo cae dentro del Período de tiempo de vecindad que haya especificado. Cuando no se indica un valor de Distancia de vecindad, se calcula uno basado en la distribución espacial de los datos de los puntos. Cuando no se indica un valor de Período de tiempo de vecindad, la herramienta utiliza un valor predeterminado para el intervalo de tiempo de 1.

  • El parámetro Número de vecinos puede invalidar la Distancia de vecindad para la opción Distancia fija o ampliar la búsqueda de vecinos para las opciones Solo bordes de contigüidad y Bordes o esquinas de contigüidad. En estos casos, el Número de vecinos se utiliza como un número mínimo. Por ejemplo, si especifica la Distancia fija con una Distancia de vecindad de 10 millas y 3 para el parámetro Número de vecinos, todos los bins recibirán un mínimo de 3 vecinos espaciales, aunque la Distancia de vecindad se tenga que incrementar para encontrarlos. La distancia solo se incrementa para aquellos bins en los que no se alcanza el Número de vecinos mínimo. Del mismo modo, con las opciones de contigüidad, para los bins con una cantidad inferior a este número de vecinos contiguos, se elegirán vecinos adicionales basados en la proximidad al centroide.

  • El valor de Período de tiempo de vecindad es el número de intervalos de tiempo que incluir en la vecindad del análisis. Por ejemplo, si el intervalo de tiempo para el cubo es de tres meses y especifica 2 para el Período de tiempo de vecindad, en la vecindad del análisis se incluirán todos los recuentos de bins incluidos en la Distancia de vecindad, así como el resto de bins asociados para los dos intervalos de tiempo anteriores (abarcando un período de nueve meses).

  • La capa de entidades Máscara de análisis de polígonos puede incluir uno o más polígonos que definen el área de estudio del análisis. Estos polígonos indican el lugar en el que se podrían generar entidades de puntos y deberían excluir aquellas áreas en las que sería imposible que hubiera puntos. Si fuera a analizar tendencias de robos en viviendas, por ejemplo, podría utilizar la Máscara de análisis de polígonos para excluir zonas de lagos grandes, parques regionales u otras áreas en las que no existen viviendas.

  • La Máscara de análisis de polígonos se interseca con la extensión del Cubo de espacio-tiempo de entrada y no amplía las dimensiones del cubo.

  • Si la Máscara de análisis de polígonos que está utilizando para establecer su área de estudio cubre un área que supera la extensión de las entidades de entrada que se utilizaron al crear el cubo por primera vez, puede que desee volver a crear el cubo utilizando dicha Máscara de análisis de polígonos como el Entorno de extensión de salida. De este modo, garantizará que toda el área cubierta por la Máscara de análisis de polígonos se incluye al ejecutar la herramienta Análisis de puntos calientes emergentes. Si usa la Máscara de análisis de polígonos como la configuración del Entorno de extensión de salida durante la creación del cubo, se asegurará de que la extensión del cubo coincide con la extensión de la Máscara de análisis de polígonos.

  • Cuando se ejecuta la herramienta Análisis de puntos calientes emergentes, se vuelven a agregar algunos resultados del análisis en el Cubo de espacio-tiempo de entrada netCDF. Se realizan tres análisis:

    • Cada bin se analiza en el contexto de bins vecinos para medir la intensidad del clustering para los valores altos y bajos. El resultado de este análisis es una puntuación z, un valor P y una categoría de colocación de los bins en el cubo de espacio-tiempo.
    • A continuación, se evalúa la serie temporal de estas puntuaciones z en las ubicaciones analizadas utilizando la estadística de Mann-Kendall. El resultado de este análisis es una puntuación z de la tendencia de clustering, un valor P y una categoría de colocación de los bins para cada ubicación.
    • Finalmente, se evalúa la serie temporal de los valores en las ubicaciones analizadas utilizando la estadística de Mann-Kendall. El resultado de este análisis es una puntuación z de la tendencia, un valor P y una categoría de colocación de los bins para cada ubicación.

    A continuación se muestra un resumen de las variables agregadas al Cubo de espacio-tiempo de entrada:

    Nombre de la variableDescripciónDimensión

    EMERGING_{ANALYSIS_VARIABLE}_HS_PVALUE

    Valor P de la Estadística Gi* de Getis-Ord que mide la importancia estadística del clustering de valores altos (puntos calientes) y valores bajos (puntos fríos).

    Tres dimensiones: un valor p para cada bin del cubo de espacio-tiempo.

    EMERGING_{ANALYSIS_VARIABLE}_HS_ZSCORE

    Puntuación z de la Estadística Gi* de Getis-Ord que mide la intensidad del clustering de valores altos (puntos calientes) y valores bajos (puntos fríos).

    Tres dimensiones: una puntuación z para cada bin del cubo de espacio-tiempo.

    EMERGING_{ANALYSIS_VARIABLE}_HS_BIN

    La categoría del resultado utilizada para clasificar cada bin como un valor de punto caliente o frío significativo desde el punto de vista estadístico. El bin se basa en una corrección FDR.

    • -3: punto frío, 99% de fiabilidad
    • -2: punto frío, 95% de fiabilidad
    • -1: punto frío, 90% de fiabilidad
    • 0: no es un punto caliente o frío significativo desde el punto de vista estadístico.
    • 1: punto caliente, 90% de fiabilidad
    • 2: punto caliente, 95% de fiabilidad
    • 3: punto caliente, 99% de fiabilidad

    Tres dimensiones: una categoría de colocación de los bins para cada bin en el cubo de espacio-tiempo. El bin se basa en una corrección FDR.

    {ANALYSIS_VARIABLE}_TREND_PVALUE

    El valor P de Mann-Kendall que mide la importancia estadística de la tendencia de los valores en una ubicación.

    Dos dimensiones: un valor P para cada ubicación analizada.

    {ANALYSIS_VARIABLE}_TREND_ZSCORE

    La puntuación z que mide la tendencia de Mann-Kendall, al alza o a la baja, asociada a los valores en una ubicación. Una puntuación z positiva indica una tendencia al alza, mientras que una puntuación z negativa indica una tendencia a la baja.

    Dos dimensiones: una puntuación z para cada ubicación analizada.

    {ANALYSIS_VARIABLE}_TREND_BIN

    La categoría del resultado utilizada para clasificar cada ubicación con una tendencia al alza o a la baja, desde el punto de vista estadístico, para los valores.

    • -3: tendencia a la baja, 99% de fiabilidad
    • -2: tendencia a la baja, 95% de fiabilidad
    • -1: tendencia a la baja, 90% de fiabilidad
    • 0: tendencia no significativa
    • 1: tendencia al alza, 90% de fiabilidad
    • 2: tendencia al alza, 95% de fiabilidad
    • 3: tendencia al alza, 99% de fiabilidad

    Dos dimensiones: una categoría de colocación de bins para cada ubicación analizada.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_PVALUE

    El valor P de Mann-Kendall que mide la importancia estadística de la tendencia de las puntuaciones z de los puntos calientes/fríos en una ubicación.

    Dos dimensiones: un valor P para cada ubicación analizada.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_ZSCORE

    La puntuación z que mide la tendencia de Mann-Kendall, al alza o a la baja, asociada a la tendencia de las puntuaciones z de los puntos calientes/fríos en una ubicación. Una puntuación z positiva indica una tendencia al alza, mientras que una puntuación z negativa indica una tendencia a la baja.

    Dos dimensiones: una puntuación z para cada ubicación analizada.

    EMERGING_{ANALYSIS_VARIABLE}_TREND_BIN

    La categoría del resultado utilizada para clasificar cada ubicación con una tendencia al alza o a la baja, desde el punto de vista estadístico, para las puntuaciones z de los puntos calientes/fríos.

    • -3: tendencia a la baja, 99% de fiabilidad
    • -2: tendencia a la baja, 95% de fiabilidad
    • -1: tendencia a la baja, 90% de fiabilidad
    • 0: tendencia no significativa
    • 1: tendencia al alza, 90% de fiabilidad
    • 2: tendencia al alza, 95% de fiabilidad
    • 3: tendencia al alza, 99% de fiabilidad

    Dos dimensiones: una categoría de colocación de bins para cada ubicación analizada.

    EMERGING_{ANALYSIS_VARIABLE}_CATEGORY

    Una de las 17 categorías, de 1 a 8, 0 y de -1 a -8.

    • 1, nuevo punto caliente
    • 2, punto caliente consecutivo
    • 3, punto caliente en aumento
    • 4, punto caliente persistente
    • 5, punto caliente en disminución
    • 6, punto caliente esporádico
    • 7, punto caliente oscilante
    • 8, punto caliente histórico
    • 0, ningún patrón detectado
    • -1, nuevo punto frío
    • -2, punto frío consecutivo
    • -3, punto frío en aumento
    • -4, punto frío persistente
    • -5, punto frío en disminución
    • -6, punto frío esporádico
    • -7, punto frío oscilante
    • -8, punto frío histórico

    Dos dimensiones: una categoría para cada ubicación analizada.

Parámetros

EtiquetaExplicaciónTipo de datos
Cubo de espacio-tiempo de entrada

El cubo de espacio-tiempo que contiene la variable que se analizará. Los cubos de espacio-tiempo tienen una extensión de archivo .nc y se crean utilizando varias herramientas de la caja de herramientas Minería de patrones en espacio-tiempo.

File
Variable de análisis

La variable numérica en el archivo netCDF que desea analizar.

String
Entidades de salida

Los resultados de la clase de entidad de salida. Esta clase de entidad será una representación de mapa bidimensional de las tendencias de puntos calientes y fríos en los datos. Mostrará, por ejemplo, cualquier punto caliente nuevo o en disminución.

Feature Class
Distancia de vecindad
(Opcional)

La extensión espacial de la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering de espacio-tiempo local.

Linear Unit
Intervalo de tiempo de vecindad
(Opcional)

El número de intervalos de periodos de tiempo que incluir en la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering de espacio-tiempo local.

Long
Máscara de análisis de polígonos
(Opcional)

Una capa de entidad de polígono con uno o más polígonos que definen el área de estudio de análisis. Una máscara de análisis de polígono se utilizaría, por ejemplo, para excluir un lago grande del análisis. Los bins definidos en el Cubo de espacio-tiempo de entrada que queden fuera de la máscara no se incluirán en el análisis.

Este parámetro solo está disponible para cubos de cuadrículas.

Feature Layer
Conceptualización de relaciones espaciales
(Opcional)

Especifica cómo se definen las relaciones espaciales entre las entidades.

  • Distancia fijaCada bin se analiza dentro del contexto de los bins vecinos. Los bins vecinos que se encuentran dentro de la distancia crítica especificada (Distancia de vecindad) reciben un peso de 1 e influyen en los cálculos del bin de destino. Los bins vecinos fuera de la distancia crítica reciben un peso de cero y no influyen en los cálculos del bin de destino.
  • K vecinos más próximosLos bins k más cercanos se incluyen en este análisis para el bin de destino; k es un parámetro numérico especificado.
  • Solo bordes de contigüidadSolo los bins vecinos que comparten un límite influirán en los cálculos del bin poligonal de destino.
  • Bordes o esquinas de contigüidadLos bins que comparten o borde o nodo influirán en los cálculos del bin poligonal de destino.
String
Número de vecinos espaciales
(Opcional)

Entero que especifica el número exacto o mínimo de vecinos que se incluirá en los cálculos para el bin de destino. Para los Vecinos K más próximos, cada bin tendrá exactamente esta cantidad de vecinos especificada. Para la Distancia fija, cada bin tendrá al menos este número de vecinos (si es necesario, la distancia de umbral se ampliará temporalmente para garantizar que haya ese número de vecinos). Cuando se selecciona una de las conceptualizaciones de contigüidad, a cada polígono se le asigna este número mínimo de vecinos. Para los bins con una cantidad inferior a este número de vecinos contiguos, los vecinos adicionales estarán basados en la proximidad al centroide de la entidad.

Long
Definir ventana global
(Opcional)

El funcionamiento de la estadística consiste en comparar una estadística local calculada a partir de los vecinos para cada bin con un valor global. Este parámetro se puede usar para controlar qué bins se utilizan para calcular el valor global.

  • Cubo completoCada vecindario se analiza comparándolo con todo el cubo. Esta es la opción predeterminada.
  • Intervalo de tiempo de vecindadCada vecindario se analiza comparándolo con los bins incluidos en el Intervalo de tiempo de vecindad especificado.
  • Intervalo de tiempo individualCada vecindario se analiza comparándolo con los bins del mismo intervalo de tiempo.
String

arcpy.stpm.EmergingHotSpotAnalysis(in_cube, analysis_variable, output_features, {neighborhood_distance}, {neighborhood_time_step}, {polygon_mask}, {conceptualization_of_spatial_relationships}, {number_of_neighbors}, {define_global_window})
NombreExplicaciónTipo de datos
in_cube

El cubo de espacio-tiempo que contiene la variable que se analizará. Los cubos de espacio-tiempo tienen una extensión de archivo .nc y se crean utilizando varias herramientas de la caja de herramientas Minería de patrones en espacio-tiempo.

File
analysis_variable

La variable numérica en el archivo netCDF que desea analizar.

String
output_features

Los resultados de la clase de entidad de salida. Esta clase de entidad será una representación de mapa bidimensional de las tendencias de puntos calientes y fríos en los datos. Mostrará, por ejemplo, cualquier punto caliente nuevo o en disminución.

Feature Class
neighborhood_distance
(Opcional)

La extensión espacial de la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering de espacio-tiempo local.

Linear Unit
neighborhood_time_step
(Opcional)

El número de intervalos de periodos de tiempo que incluir en la vecindad de análisis. Este valor determina las entidades que se analizan conjuntamente para evaluar el clustering de espacio-tiempo local.

Long
polygon_mask
(Opcional)

Una capa de entidad de polígono con uno o más polígonos que definen el área de estudio de análisis. Una máscara de análisis de polígono se utilizaría, por ejemplo, para excluir un lago grande del análisis. Los bins definidos en el in_cube que queden fuera de la máscara no se incluirán en el análisis.

Este parámetro solo está disponible para cubos de cuadrículas.

Feature Layer
conceptualization_of_spatial_relationships
(Opcional)

Especifica cómo se definen las relaciones espaciales entre los bins.

  • FIXED_DISTANCECada bin se analiza dentro del contexto de los bins vecinos. Los bins vecinos que se encuentran dentro de la distancia crítica especificada (neighborhood_distance) reciben una ponderación de 1 e influyen en los cómputos del bin de destino. Los bins vecinos fuera de la distancia crítica reciben un peso de cero y no influyen en los cálculos del bin de destino.
  • K_NEAREST_NEIGHBORSLos bins k más cercanos se incluyen en este análisis para el bin de destino; k es un parámetro numérico especificado.
  • CONTIGUITY_EDGES_ONLYSolo los bins vecinos que comparten un límite influirán en los cálculos del bin poligonal de destino.
  • CONTIGUITY_EDGES_CORNERSLos bins que comparten o borde o nodo influirán en los cálculos del bin poligonal de destino.
String
number_of_neighbors
(Opcional)

Entero que especifica el número exacto o mínimo de vecinos que se incluirá en los cálculos para el bin de destino. Para K_NEAREST_NEIGHBORS, cada bin tendrá exactamente esta cantidad de vecinos especificada. Para FIXED_DISTANCE_BAND, cada bin tendrá al menos este número de vecinos (si es necesario, la distancia de umbral se ampliará temporalmente para garantizar que haya ese número de vecinos). Cuando se selecciona una de las conceptualizaciones de contigüidad, a cada polígono se le asigna este número mínimo de vecinos. Para los bins con una cantidad inferior a este número de vecinos contiguos, los vecinos adicionales estarán basados en la proximidad al centroide de la entidad.

Long
define_global_window
(Opcional)

El funcionamiento de la estadística consiste en comparar una estadística local calculada a partir de los vecinos para cada bin con un valor global. Este parámetro se puede usar para controlar qué bins se utilizan para calcular el valor global.

  • ENTIRE_CUBECada vecindario se analiza comparándolo con todo el cubo. Esta es la opción predeterminada.
  • NEIGHBORHOOD_TIME_STEPCada vecindario se analiza comparándolo con los bins incluidos en el Intervalo de tiempo de vecindad especificado.
  • INDIVIDUAL_TIME_STEPCada vecindario se analiza comparándolo con los bins del mismo intervalo de tiempo.
String

Muestra de código

Ejemplo 1 de EmergingHotSpotAnalysis (ventana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función EmergingHotSpotAnalysis.

import arcpy
arcpy.env.workspace = r"C:\STPM"
arcpy.stpm.EmergingHotSpotAnalysis("Homicides.nc", "COUNT", "EHS_Homicides.shp", "5 Miles", 2, "#", "FIXED_DISTANCE", "3")
Ejemplo 2 de EmergingHotSpotAnalysis (script independiente)

El siguiente script independiente de Python muestra cómo utilizar la función EmergingHotSpotAnalysis.

# Create Space Time Cube of homicide incidents in a metropolitan area

# Import system modules
import arcpy

# Set overwriteOutput property to overwrite existing output, by default
arcpy.env.overwriteOutput = True

# Local variables...
workspace = r"C:\STPM"

try:
    # Set the current workspace (to avoid having to specify the full path to the feature 
    # classes each time)
    arcpy.env.workspace = workspace

    # Create Space Time Cube of homicide incident data with 3 months and 3 miles settings
    # Process: Create Space Time Cube 
    cube = arcpy.stpm.CreateSpaceTimeCube("Homicides.shp", "Homicides.nc", "MyDate", "#", 
                                          "3 Months", "End time", "#", "3 Miles", "Property MEDIAN SPACETIME; Age STD ZEROS",
																																										"HEXAGON_GRID")

    # Create a polygon that defines where incidents are possible  
    # Process: Minimum Bounding Geometry of homicide incident data
    arcpy.management.MinimumBoundingGeometry("Homicides.shp", "bounding.shp", "CONVEX_HULL",
                                             "ALL", "#", "NO_MBG_FIELDS")

    # Emerging Hot Spot Analysis of homicide incident cube using 5 Miles neighborhood 
    # distance and 2 neighborhood time step to detect hot spots
    # Process: Emerging Hot Spot Analysis 
    cube = arcpy.stpm.EmergingHotSpotAnalysis("Homicides.nc", "COUNT", "EHS_Homicides.shp", 
                                              "5 Miles", 2, "bounding.shp", "FIXED_DISTANCE", "3")

except arcpy.ExecuteError:
    # If any error occurred when running the tool, print the messages
    print(arcpy.GetMessages())