Estimar el tiempo hasta el evento (Estadística espacial)

Resumen

Predice el tiempo que falta para que ocurra un evento basándose en los tiempos anteriores al evento. Las variables explicativas pueden utilizarse para mejorar las predicciones y la herramienta puede determinar qué variables aumentan o disminuyen el tiempo que queda hasta el evento.

Más información sobre cómo funciona Estimar el tiempo hasta el evento

Ilustración

Ilustración de la herramienta Estimar el tiempo hasta el evento

Uso

  • Cada observación de la tabla o las entidades de entrada deben tener campos que contienen la antigüedad de la observación, un indicador de si el evento ya ha ocurrido, y las variables explicativas. Estos campos se proporcionan en el campo Antigüedad, el campo Indicador de evento y los parámetros Variables explicativas, respectivamente. Las variables explicativas pueden ser continuas o categóricas, y el indicador de evento solo debe tener los valores 0 (el evento no ha ocurrido) o 1 (el evento ha ocurrido). En el caso del campo de antigüedad, a menudo incluirá la antigüedad actual del individuo, pero, en general, es la cantidad de tiempo a partir del primer posible tiempo en que podría haber ocurrido el evento y el final del momento en que ha ocurrido (o el tiempo actual, si el evento no ha ocurrido). Por ejemplo, para estimar la duración de los árboles, los valores del campo de antigüedad deben ser la antigüedad actual del árbol, si está vivo, o la antigüedad del árbol cuando murió. Sin embargo, para estimar el tiempo hasta el nuevo arresto, los valores del campo deben ser la cantidad de tiempo desde que el individuo fue excarcelado (la primera vez que podría ocurrir un nuevo arresto) hasta el momento del nuevo arresto (o la fecha actual si el individuo no se ha arrestado de nuevo). No es necesario proporcionar la unidad de la antigüedad (horas, días, años, etc.), pero todos los resultados deben interpretarse en esa unidad de tiempo.

  • Predecir cuándo ocurrirá un evento en el futuro plantea dificultades, por lo que recomendado mantener expectativas realistas. La herramienta solo puede extraer información de las variables explicativas que proporciona el usuario, pero los fenómenos complejos, como la rotura de la infraestructura, implican numerosos factores que a menudo suelen muy particulares y específicos de cada individuo. En la práctica, normalmente debería considerar los tiempos previstos hasta el evento como indicaciones generales del momento en que podría ocurrir el evento, en lugar de predicciones muy concretas de fechas particulares. También debería ser particularmente precavido y escéptico al extrapolarlo a tiempos más remotos que el tiempo del evento más largo de los datos de entrada. Aunque a menudo son imprecisos, los resultados del análisis del tiempo hasta el evento pueden seguir siendo muy útiles para proporcionar estimaciones generales de costes futuros o priorización y asignación de recursos a observaciones que más probablemente perciban el evento después.

  • Los modelos de tiempo hasta el evento no son intrínsecamente espaciales, pero la incorporación de información espacial podría mejorar el modelo al tomar en cuenta los patrones geográficos. Considere la posibilidad de agregar variables explicativas espaciales, como regiones geográficas como variables explicativas categóricas o distancias a entidades clave como variables explicativas continuas. Por ejemplo, al modelar la mortalidad de los árboles urbanos, la distancia hasta el edificio más cercano podría ser importante debido a la reducción de la luz solar provocada por las sombras del edificio.

  • Las observaciones en las que el evento aún no ha ocurrido se denominan observaciones censuradas y las observaciones en las que el evento ha ocurrido se denominan observaciones sin censura. Esta terminología proviene del hecho de que las observaciones sin censura tienen información completa (la hora del evento se conoce), pero las observaciones censuradas solo tienen información parcial; no se conoce la hora exacta del evento, pero se sabe que es más largo que una cierta cantidad de tiempo (la edad actual de la observación).

    Mientras que la estimación de los parámetros del modelo utilizan observaciones censuradas y sin censurar, las observaciones sin censurar facilitan el máximo de información porque se conoce su tiempo de supervivencia exacto. En general, se recomienda tener al menos 10 observaciones sin censurar por variable explicativa. Sin embargo, las variables categóricas deberían contarse como variables múltiples. Una variable categoría con dos categorías se considera una variable, con tres categorías cuenta como dos variables, con cuatro categorías como tres variables y así sucesivamente. Asimismo, cada categoría debería tener varias observaciones sin censurar para estimar mejor el efecto de todas las categorías de la variable categórica.

  • La herramienta produce una variedad de salidas, numéricas y gráficas, para entender cómo afectan las variables explicativas al tiempo hasta el evento, predecir cuándo ocurrirá el evento y evaluar la precisión y fiabilidad del modelo.

    Los mensajes de geoprocesamiento resumen los efectos de las variables explicativas y la precisión del modelo. La clase o tabla de entidades de salida incluye campos y gráficos emergentes que estiman cuándo se prevé que ocurra el evento para observaciones sin censura.

    Más información sobre los resultados de la herramienta y cómo interpretarlos

Parámetros

EtiquetaExplicaciónTipo de datos
Entidades o tabla de entrada

Las entidades de entrada o tabla que contienen los campos de la edad, las variables explicativas y el indicador de evento para cada observación.

Table View
Campo Antigüedad

Campo numérico de antigüedad de la observación. Con frecuencia, esta es la antigüedad de la observación, pero en general, es la cantidad de tiempo que comienza desde el primer momento en que el evento pudo haber ocurrido y termina cuando el evento ocurrió (o termina cuando la observación fue censurada). La unidad de la antigüedad (horas, días, años, etc.) no se proporciona, pero todos los resultados deben interpretarse en esa unidad de tiempo. Por ejemplo, si los valores de antigüedad están en días y la herramienta predice una hora de evento dos unidades de tiempo en el futuro, esto significa dos días en el futuro.

Field
Campo Indicador de evento

Campo que contiene un indicador o si el evento ha ocurrido para la observación. El campo debe contener solo los valores 0 o 1. Un valor de 0 indica que el evento no ha ocurrido (observación censurada) y un valor de 1 indica que el evento ha ocurrido (observación sin censura). Por ejemplo, para estimar la vida útil de los árboles, un valor de 0 significa que el árbol está vivo (el evento, la muerte del árbol, no ha ocurrido) y un valor de 1 significa que el árbol está muerto.

Field
Entidades o tabla de salida

Las entidades de salida o la tabla que contiene los tiempos previstos para el evento para las observaciones en las que el evento no ha ocurrido.

Feature Class; Table
Variables explicativas
(Opcional)

Una lista de campos que representan a las variables explicativas que ayudan a predecir el tiempo que queda para el evento. Active la casilla de verificación De categorías en para las variables que representen clases o categorías tales como tipo de material o categoría de ingresos. Deje la casilla activar para las variables que son continuas.

Value Table
Habilitar elementos emergentes de curva de supervivencia
(Opcional)

Especifica si se generarán gráficos emergentes para cada registro de salida. Los gráficos emergentes muestran la curva de supervivencia de la línea base para cada registro y una curva adicional de tiempo hasta el evento para observaciones censuradas.

  • Activado: se generarán gráficos emergentes para cada registro del dataset. Esta es la opción predeterminada.
  • Desactivado: no se generarán gráficos emergentes.
Boolean

arcpy.stats.EstimateTimeToEvent(in_features, age_field, event_field, out_features, {explanatory_variables}, {enable_survival_curve_popups})
NombreExplicaciónTipo de datos
in_features

Las entidades de entrada o tabla que contienen los campos de la edad, las variables explicativas y el indicador de evento para cada observación.

Table View
age_field

Campo numérico de antigüedad de la observación. Con frecuencia, esta es la antigüedad de la observación, pero en general, es la cantidad de tiempo que comienza desde el primer momento en que el evento pudo haber ocurrido y termina cuando el evento ocurrió (o termina cuando la observación fue censurada). La unidad de la antigüedad (horas, días, años, etc.) no se proporciona, pero todos los resultados deben interpretarse en esa unidad de tiempo. Por ejemplo, si los valores de antigüedad están en días y la herramienta predice una hora de evento dos unidades de tiempo en el futuro, esto significa dos días en el futuro.

Field
event_field

Campo que contiene un indicador o si el evento ha ocurrido para la observación. El campo debe contener solo los valores 0 o 1. Un valor de 0 indica que el evento no ha ocurrido (observación censurada) y un valor de 1 indica que el evento ha ocurrido (observación sin censura). Por ejemplo, para estimar la vida útil de los árboles, un valor de 0 significa que el árbol está vivo (el evento, la muerte del árbol, no ha ocurrido) y un valor de 1 significa que el árbol está muerto.

Field
out_features

Las entidades de salida o la tabla que contiene los tiempos previstos para el evento para las observaciones en las que el evento no ha ocurrido.

Feature Class; Table
explanatory_variables
[[Variable, Categorical],...]
(Opcional)

Una lista de campos que representan a las variables explicativas que ayudan a predecir el tiempo que queda para el evento. Especifique la variable como CATEGORICAL si representa clases o categorías tales como tipo de material o categoría de ingresos, y especifique NUMERIC si es continua.

Value Table
enable_survival_curve_popups
(Opcional)

Especifica si se generarán gráficos emergentes para cada registro de salida. Los gráficos emergentes muestran la curva de supervivencia de la línea base para cada registro y una curva adicional de tiempo hasta el evento para observaciones censuradas.

  • CREATE_POPUPSe generarán gráficos emergentes para cada registro del dataset. Esta es la opción predeterminada.
  • NO_POPUPNo se generarán gráficos emergentes.
Boolean

Muestra de código

Ejemplo 1 de EstimateTimeToEvent (venana de Python)

El siguiente script de la ventana de Python muestra cómo utilizar la función EstimateTimeToEvent.

# Estimate the time until an event.
import arcpy
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.EstimateTimeToEvent(
    in_features = r"myFeatureClass",
    age_field = "myAgeField",
    event_field = "myEventField",
    out_features = r"myOutputFeatureClass",
    explanatory_variables = r"cont_var1 false;cont_var2 false;cat_var1 true;cat_var2 true",
    enable_survival_curve_popups = "CREATE_POPUP"
)
Ejemplo 2 de EstimateTimeToEvent (secuencia de comandos independiente)

El siguiente script independiente muestra cómo utilizar la función EstimateTimeToEvent.

# Estimate the time until an event.  

import arcpy 

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool
arcpy.stats.EstimateTimeToEvent(
    in_features = r"myFeatureClass",
    age_field = "myAgeField",
    event_field = "myEventField",
    out_features = r"myOutputFeatureClass",
    explanatory_variables = r"cont_var1 false;cont_var2 false;cat_var1 true;cat_var2 true",
    enable_survival_curve_popups = "CREATE_POPUP"
)

# Print the messages.
print(arcpy.GetMessages())

Temas relacionados