Estimer le temps de survie (Statistiques spatiales)

Synthèse

Prévoit le délai avant un événement en fonction des délais précédents de l’événement. Des variables explicatives peuvent être utilisées pour améliorer les prévisions et l’outil peut déterminer les variables qui augmentent ou diminuent le délai avant l’événement.

En savoir plus sur l’outil Estimate Time to Event (Estimer le temps de survie)

Illustration

Illustration de l’outil Estimate Time to Event (Estimer le temps de survie)

Utilisation

  • Chaque observation dans la table ou les entités en entrée doit comporter des champs contenant l’ancienneté de l’observation, un indicateur précisant si l’événement est déjà survenu et des variables explicatives. Ces champs sont fournis dans les paramètres Champ d’ancienneté, Champ d’indicateur d’événement et Variables explicatives, respectivement. Les variables explicatives peuvent être continues ou catégorielles et l’indicateur d’événement doit uniquement prendre les valeurs 0 (l’événement ne s’est pas produit) ou 1 (l’événement s’est produit). Pour le champ d’ancienneté, il s’agit souvent de l’âge réel du sujet, mais en général, cela correspond au délai entre la première date/heure possible où l’événement aurait pu survenir et la date/l’heure où il s’est réellement produit (ou la date/l’heure actuelle, si l’événement ne s’est pas produit). Par exemple, pour estimer la durée de vie des arbres, les valeurs du champ d’ancienneté doivent être l’âge actuel de l’arbre s’il est toujours vivant ou l’âge de l’arbre lors de sa mort. Toutefois, pour estimer le temps jusqu’à une nouvelle arrestation, les valeurs du champ doivent être le délai écoulé depuis que le sujet a été remis en liberté (première fois qu’une nouvelle arrestation peut avoir lieu) jusqu’à la date de sa nouvelle arrestation (ou la date actuelle si le sujet n’a pas fait l’objet d’une nouvelle arrestation). L’unité de l’ancienneté (heures, jours, années, etc.) n’a pas besoin d’être spécifiée, mais tous les résultats doivent être interprétés dans cette unité de temps.

  • Prévoir quand un événement va se produire étant une tâche naturellement difficile, nous vous engageons à nourrir des attentes réalistes. L’outil peut uniquement extraire des informations des variables explicatives que vous fournissez, mais des phénomènes complexes tels qu’une panne d’infrastructure impliquent de nombreux facteurs qui sont généralement très locaux et propres à chaque sujet. En pratique, vous devez considérer les temps prévus jusqu’à l’événement comme des indications générales du moment où l’événement risque de se produire, et non comme des prévisions très spécifiques de dates données. Vous devez également être particulièrement prudent et faire preuve de scepticisme lorsque vous extrapolez des temps avant l’événement supérieurs au temps avant l’événement le plus long dans les données en entrée. Même s’ils sont souvent imprécis, les résultats d’une analyse du temps jusqu’à l’événement peuvent toujours être très utiles pour fournir des estimations générales des coûts futurs ou pour prioriser et allouer des ressources aux observations les plus susceptibles d’être les prochaines à expérimenter l’événement.

  • Les modèles de temps de survie ne sont pas intrinsèquement spatiaux, mais l’incorporation d’informations spatiales peut les améliorer par la prise en compte de modèles géographiques. Envisagez d’ajouter des variables explicatives spatiales, telles que des régions géographiques comme variables explicatives catégorielles ou des distances par rapport à des entités clés comme variables explicatives continues. Pour modéliser la mortalité des arbres en milieu urbain, par exemple, la distance par rapport au bâtiment le plus proche peut être importante car l’ombre d’un bâtiment peut réduire la lumière du soleil.

  • Les observations dans lesquelles l’événement ne s’est pas encore produit sont appelées observations censorées et les observations dans lesquelles l’événement est survenu sont appelées observations non censorées Cette terminologie provient du fait que les informations des observations non censorées sont complètes (le délai avant l’événement est connu), mais que celles des observations censorées sont partielles ; le délai exact avant l’événement n’est pas connu, mais il est plus long qu’un certain délai (l’âge actuel de l’observation).

    Bien que l’estimation des paramètres du modèle utilise à la fois des observations censurées et non censurées, les observations censurées fournissent le plus d’informations car leur temps de survie exact est connu. En règle générale, il est recommandé de disposer d’au moins 10 observations non censurées par variable explicative. Cependant, les variables catégorielles doivent compter comme plusieurs variables. Une variable catégorielle avec deux catégories compte comme une variable ; trois catégories compte comme deux variables ; quatre catégories comptent comme trois variables et ainsi de suite. En outre, chaque catégorie doit comporter plusieurs observations non censurées afin de mieux estimer l’effet de toutes les catégories de la variable catégorielle.

  • L’outil produit différentes sorties, numériques et graphiques, pour comprendre comment les variables explicatives affectent le temps jusqu’à l’événement, pour prévoir à quel moment l’événement va se produire et pour évaluer l’exactitude et la fiabilité du modèle.

    Les messages de géotraitement récapitulent les effets des variables explicatives et la précision du modèle. La classe d’entités ou la table en sortie inclut des champs et des diagrammes contextuels qui estiment quand l’événement doit survenir pour les observations non censorées.

    En savoir plus sur les sorties de l’outil et leur interprétation

Paramètres

ÉtiquetteExplicationType de données
Entités ou table en entrée

Table ou entités en entrée contenant les champs de l’âge, des variables explicatives et de l’indicateur d’événement de chaque observation.

Table View
Champ Age (Âge)

Champ numérique de l’âge de l’observation. Il s’agit souvent de l’âge de l’observation, mais en général, cela correspond au délai entre le premier moment où l’événement aurait pu survenir et le moment où il s’est réellement produit (ou le moment où l’observation a été censorée). L’unité de l’âge (heures, jours, années, etc.) n’est pas spécifiée, mais tous les résultats doivent être interprétés dans cette unité de temps. Par exemple, si les valeurs d’âge sont en jours et que l’outil prévoit un délai avant l’événement de deux unités de temps dans le futur, cela signifie deux jours dans le futur.

Field
Champ Event Indicator (Indicateur d’événement)

Champ contenant un indicateur ou précisant si l’événement est survenu pour l’observation. Ce champ doit contenir uniquement les valeurs 0 et 1. La valeur 0 indique que l’événement n’est pas survenu (observation censorée) et la valeur 1, que l’événement s’est produit (observation non censorée). Par exemple, pour estimer la durée de vie des arbres, la valeur 0 signifie que l’arbre est vivant (l’événement, la mort de l’arbre, ne s’est pas produit) et la valeur 1 signifie que l’arbre est mort.

Field
Entités ou table en sortie

Table ou entités en entrée contenant les délais prévus avant l’événement pour les observations où l’événement ne s’est pas produit.

Feature Class; Table
Variables explicatives
(Facultatif)

Liste des champs qui représentent les variables explicatives permettant de prévoir le délai avant l’événement. Cochez la case Categorical (Catégoriel) des variables qui représentent des classes ou des catégories, comme le type de matériau ou la fourchette de revenus. Laissez cette case non cochée pour les variables continues.

Value Table
Activer les fenêtres contextuelles de la courbe de survie
(Facultatif)

Indique si des diagrammes contextuels sont générés pour chaque enregistrement en sortie. Les diagrammes contextuels représentent la courbe de survie de référence de chaque enregistrement et une courbe du temps de survie supplémentaire pour les observations censurées.

  • Cochée : les diagrammes contextuels sont générés pour chaque enregistrement du jeu de données. Il s’agit de l’option par défaut.
  • Non cochée : les diagrammes contextuels ne sont pas générés.
Boolean

arcpy.stats.EstimateTimeToEvent(in_features, age_field, event_field, out_features, {explanatory_variables}, {enable_survival_curve_popups})
NomExplicationType de données
in_features

Table ou entités en entrée contenant les champs de l’âge, des variables explicatives et de l’indicateur d’événement de chaque observation.

Table View
age_field

Champ numérique de l’âge de l’observation. Il s’agit souvent de l’âge de l’observation, mais en général, cela correspond au délai entre le premier moment où l’événement aurait pu survenir et le moment où il s’est réellement produit (ou le moment où l’observation a été censorée). L’unité de l’âge (heures, jours, années, etc.) n’est pas spécifiée, mais tous les résultats doivent être interprétés dans cette unité de temps. Par exemple, si les valeurs d’âge sont en jours et que l’outil prévoit un délai avant l’événement de deux unités de temps dans le futur, cela signifie deux jours dans le futur.

Field
event_field

Champ contenant un indicateur ou précisant si l’événement est survenu pour l’observation. Ce champ doit contenir uniquement les valeurs 0 et 1. La valeur 0 indique que l’événement n’est pas survenu (observation censorée) et la valeur 1, que l’événement s’est produit (observation non censorée). Par exemple, pour estimer la durée de vie des arbres, la valeur 0 signifie que l’arbre est vivant (l’événement, la mort de l’arbre, ne s’est pas produit) et la valeur 1 signifie que l’arbre est mort.

Field
out_features

Table ou entités en entrée contenant les délais prévus avant l’événement pour les observations où l’événement ne s’est pas produit.

Feature Class; Table
explanatory_variables
[[Variable, Categorical],...]
(Facultatif)

Liste des champs qui représentent les variables explicatives permettant de prévoir le délai avant l’événement. Affectez la valeur CATEGORICAL à la variable si cette dernière représente des classes ou des catégories, comme le type de matériau ou la fourchette de revenus, ou spécifiez la valeur NUMERIC si elle est continue.

Value Table
enable_survival_curve_popups
(Facultatif)

Indique si des diagrammes contextuels sont générés pour chaque enregistrement en sortie. Les diagrammes contextuels représentent la courbe de survie de référence de chaque enregistrement et une courbe du temps de survie supplémentaire pour les observations censurées.

  • CREATE_POPUPLes diagrammes contextuels sont générés pour chaque enregistrement du jeu de données. Il s’agit de l’option par défaut.
  • NO_POPUPLes diagrammes contextuels ne sont pas générés.
Boolean

Exemple de code

Exemple 1 d’utilisation de l’outil EstimateTimeToEvent (fenêtre Python)

Le script ci-dessous pour la fenêtre Python illustre l’utilisation de la fonction EstimateTimeToEvent.

# Estimate the time until an event.
import arcpy
arcpy.env.workspace = r"c:\data\project_data.gdb"
arcpy.stats.EstimateTimeToEvent(
    in_features = r"myFeatureClass",
    age_field = "myAgeField",
    event_field = "myEventField",
    out_features = r"myOutputFeatureClass",
    explanatory_variables = r"cont_var1 false;cont_var2 false;cat_var1 true;cat_var2 true",
    enable_survival_curve_popups = "CREATE_POPUP"
)
Exemple 2 d’utilisation de l’outil EstimateTimeToEvent (script autonome)

Le script autonome ci-dessous illustre l’utilisation de la fonction EstimateTimeToEvent.

# Estimate the time until an event.  

import arcpy 

# Set the current workspace.
arcpy.env.workspace = r"c:\data\project_data.gdb" 

# Run tool
arcpy.stats.EstimateTimeToEvent(
    in_features = r"myFeatureClass",
    age_field = "myAgeField",
    event_field = "myEventField",
    out_features = r"myOutputFeatureClass",
    explanatory_variables = r"cont_var1 false;cont_var2 false;cat_var1 true;cat_var2 true",
    enable_survival_curve_popups = "CREATE_POPUP"
)

# Print the messages.
print(arcpy.GetMessages())

Rubriques connexes