L’outil Space Time Kernel Density (Densité du noyau spatio-temporel) étend les calculs de densité du noyau à partir de l’analyse de la position relative et de la magnitude des entités en entrée pour inclure d’autres dimensions comme le temps et la profondeur (élévation). La sortie obtenue identifie la grandeur par unité de surface avec plusieurs fonctions de noyau pour ajuster une surface régulièrement effilée à chaque point en entrée.
Comparer aux autres outils de densité
L’analyse de densité est essentielle pour un certain nombre d’analyses spatiales et géostatistiques. Voici quelques exemples :
- Études démographiques
- Recherche en matière de concentration, d’exposition et de résilience
- Stratégie pour faciliter la détermination des besoins en matière de services spécifiques à une certaine localisation ou pour une certaine communauté (par exemple, établissements de soins, services d’urgence, infrastructure et réseaux routiers)
D’autres outils permettant de calculer la densité sont disponibles et notamment les suivants : Kernel Density (Densité de noyau), Point Density (Densité de points) et Line Density (Densité de lignes). Ces outils calculent la densité des entités (points ou lignes) dans un voisinage autour des entités. Toutefois, Ils ne prennent pas en compte les autres dimensions.
L’outil Space Time Kernel Density (Densité du noyau spatio-temporel) analyse la densité des événements ou incidents qui se produisent dans l’espace et le temps et peut prendre en compte l’élévation. En incorporant l’élévation et le temps dans l’équation, l’outil permet de mieux comprendre les distributions spatiales et temporelles, ainsi que les modèles et tendances du phénomène étudié.
Principaux avantages de l’outil Space Time Kernel Density (Densité du noyau spatio-temporel)
L’outil Space Time Kernel Density (Densité du noyau spatio-temporel) combine les concepts d’estimation de densité du noyau avec l’analyse temporelle pour bien comprendre les modèles. Cet outil offre certains avantages par rapport aux autres formes d’estimation de la densité et notamment les suivants :
- Il analyse simultanément les dimensions spatiales et temporelles des événements à des élévations différentes. Cela permet une compréhension plus holistique des modèles et l’identification des zones à fortes ou faibles concentrations d’événements dans le temps, en fonction de l’espace et de l’élévation.
- Il prend en compte l’aspect temporel pour analyser l’évolution de la densité des événements dans le temps. Cela est particulièrement utile pour l’étude de phénomènes dynamiques, comme les modèles de criminalité, les épidémies ou les flux de transport.
- Il prend en compte à la fois l’élévation et l’aspect temporel, pour vous permettre d’analyser l’évolution de la densité des événements dans le temps à des élévations différentes. Cela s’avère particulièrement utile pour l’étude des phénomènes dynamiques dans les géosciences (par exemple, la pression atmosphérique, la densité d’ozone, les polluants, la composition de l’air et de l’eau, la salinité de l’eau, le niveau d’oxygène dissous, la conductivité de l’eau, la pression de l’eau et la température).
- Il offre une certaine flexibilité pour sélectionner les paramètres, notamment en ce qui concerne le choix du type de noyau, le rayon de recherche (largeur de bande), l’élévation et l’unité de temps. Cela vous permet de personnaliser l’analyse en fonction de besoins spécifiques et des caractéristiques des données, afin d’obtenir des résultats plus précis et significatifs.
- Exploitez les fonctionnalités existantes de ArcGIS AllSource pour analyser et visualiser des données raster multidimensionnelles et offrez diverses options de visualisation avec le format CRF (Cloud Raster Format) de Esri pour les données multidimensionnelles comme raster en sortie par défaut. Cela est particulièrement intéressant pour isoler toute dimension spécifique ou visualiser et identifier les points chauds, tendances et modèles dans les données en fonction de l’espace et du temps, pour améliorer la prise de décision et la compréhension des relations spatio-temporelles.
Cet outil permet une compréhension plus nuancée des modèles d’événement. Il peut être appliqué dans divers domaines et notamment l’analyse de la criminalité, la cartographie des maladies, la planification des transports, le suivi environnemental ou les sciences océanographiques et atmosphériques. Sa capacité à analyser à la fois l’espace et le temps en fait un outil versatile pour la compréhension de phénomènes complexes. Toutefois, ses avantages spécifiques et son adéquation peuvent varier en fonction de la nature des données et des objectifs de l’analyse.
Méthode de calcul de la densité du noyau spatio-temporel
L’outil Space Time Kernel Density (Densité du noyau spatio-temporel) utilise des entités ponctuelles avec des données sur l’élévation et le temps pour calculer la densité du noyau des entités ponctuelles autour de chaque cellule raster en sortie.
Théoriquement, une surface uniformément incurvée passe par chaque point. La technique est similaire au fonctionnement de l’outil Kernel Density (Densité de noyau) pour l’entrée des points. La valeur de la surface à la localisation du point est la plus élevée et diminue à mesure que l’on s’en éloigne, pour atteindre zéro à la distance à partir du point, spécifiée par le paramètre Search radius (Rayon de recherche). Les données en entrée étant de type point, seul un voisinage circulaire est possible. Le volume sous la surface équivaut à la valeur du paramètre Population Field (Champ de population) pour le point ou à la valeur 1 si le paramètre NONE est spécifié. La densité à chaque cellule raster en sortie est calculée par l’addition des valeurs de toutes les surfaces de noyau où elles se superposent au centre de la cellule raster. La fonction Densité de noyau est basée sur la fonction de noyau quartique décrite par Silverman (1986, p. 76, équation 4.5).
La formule est la suivante :
Où :
- i = 1,…,n sont les points en entrée.
- f(j) correspond à la densité au centre de chaque cellule.
- dij correspond à la distance entre le point d’incident et le centre de la cellule.
- h correspond au rayon de recherche.
Si une valeur de paramètre Population Field (Champ de population) autre que NONE est utilisée, la valeur de chaque élément détermine le nombre de comptabilisations du point. Par exemple, avec la valeur 3, le point compte pour trois points. Les valeurs peuvent être entières ou à virgule flottante.
Par défaut, une unité est sélectionnée en fonction de l’unité linéaire de la définition de la projection des données des entités ponctuelles en entrée ou telle qu’elle est spécifiée dans le paramètre d’environnement Output Coordinate System (Système de coordonnées en sortie).
Si un facteur du paramètre Area units (Unités de surface) en sortie est sélectionné, la densité calculée pour la cellule est multipliée par le facteur correspondant avant d’être écrite dans le raster en sortie. Par exemple, si les unités en entrée sont des mètres, les unités de surface en sortie sont par défaut des kilomètres carrés. La comparaison d’un facteur d’échelle d’unité de mètres aux kilomètres entraîne une différence entre les valeurs en raison de l’application d’un multiplicateur de 1 000 000 (1 000× 1 000 mètres).
Prévoir la densité d’une localisation
La densité prévue à un nouvel emplacement (x,y) est déterminée par la formule suivante :
Où :
- i = 1,…,n sont les points en entrée. Pour disti < rayon, il convient d’inclure dans la somme uniquement des points situés dans le rayon de la localisation (x,y).
- popi correspond à la valeur du champ de population du point i. Ce paramètre est facultatif.
- disti désigne la distance entre le point i et l’emplacement (x,y).
- radius est le rayon de recherche défini autour de l’emplacement (x,y).
La densité calculée est ensuite multipliée par le nombre de points ou par la somme du champ de population le cas échéant. Cette correction rend l’intégrale spatiale égale au nombre de points (ou à la somme du champ de population), alors qu’elle est habituellement égale à 1. Cette implémentation utilise un noyau quartique, comme décrit dans Silverman (1986). La formule est calculée pour chaque localisation dont vous souhaitez estimer la densité. Étant donné qu’un raster est créé, les calculs sont appliqués au centre de chaque cellule du raster en sortie.
Temps et élévation
Pour inclure la dimension temporelle dans le calcul de cet outil, vous devez établir l’heure de début, l’heure de fin et l’intervalle temporel.
Le paramètre Start Time (Heure de début) spécifie le début de la période sur laquelle vous souhaitez calculer la densité. Il peut s’agir d’une date spécifique (par exemple, 31/12/2023), d’une heure (15h45:45) ou d’un horodatage (31/12/2023 15h45:45). L’heure de début définit la limite inférieure de la fenêtre horaire de recherche (t_window) pour le calcul.
Le paramètre End Time (Heure de fin) spécifie la fin de la période du calcul de densité. Comme pour l’heure de début, il peut s’agir d’une date, d’une heure ou d’un horodatage. L’heure de fin définit la limite supérieure de la fenêtre horaire de recherche (t_window) pour le calcul.
Le paramètre Time Interval (Intervalle temporel) spécifie la granularité des intervalles temporels utilisés dans l’analyse. Il spécifie la longueur de chaque intervalle temporel (par exemple, une heure, un jour ou un mois). L’intervalle temporel divise la plage horaire entre les heures de début et de fin en segments plus petits pour le calcul de la densité. L’unité d’intervalle peut être la seconde, la minute, l’heure, le jour ou la semaine.
En fonction des heure de début, heure de fin et intervalle temporel spécifiés, l’outil calcule la densité des événements dans chaque intervalle temporel, le long de la plage horaire spécifiée. En divisant la plage horaire entre l’heure de début et l’heure de fin en segments plus petits en fonction de l’intervalle temporel spécifié, l’outil calcule la densité des événements dans chaque intervalle temporel. Cela permet une analyse plus détaillée de l’évolution de la densité des événements dans le temps. Par exemple, si l’intervalle de temps est défini sur une heure et que la plage horaire est comprise entre 9h00 et 17h00, l’outil calcule la densité des événements pour chaque heure (9h00-10h00, 10h00-11h00, etc.) pour identifier les modèles temporels de l’occurrence des événements.
Densité de noyau dans le temps sur points (x,y)
Pour calculer la densité du noyau dans le temps sur points (x,y), un noyau spatial, k(x,y), et un noyau temporel, k(t), sont utilisés. Il en résulte la formule suivante pour la densité du noyau dans le temps :
Où :
- Pour disti < radius, il convient d’inclure dans la somme uniquement des points situés dans le rayon de l’emplacement (x,y).
- Pour ti < t_window, il convient d’inclure le temps dans le calcul uniquement s’il se trouve dans la fenêtre horaire définie par les heures de début et de fin.
- popi correspond à la valeur du champ de population du point i. Ce paramètre est facultatif.
- disti désigne la distance entre le point i et l’emplacement (x,y).
- radius est le rayon de recherche défini autour de l’emplacement (x,y).
- ti est le temps à chaque intervalle calculé au sein de la fenêtre horaire (t_window).
- t_window est la fenêtre horaire définie grâce aux heures de début et de fin.
Les paramètres d’élévation permettre d’analyser la densité des événements ou phénomènes qui se produisent en fonction de l’espace et l’élévation. L’outil prend en compte la localisation spatiale des événements, ainsi que l’élévation à laquelle ils surviennent. Pour calculer la dimension d’élévation dans cet outil, vous devez spécifier trois paramètres : Minimum elevation (Élévation minimale), Maximum elevation (Élévation maximale) et Elevation interval (Intervalle d’élévation).
Le paramètre Minimum Elevation (Élévation minimale) spécifie la valeur d’élévation la plus faible dans la plage des élévations à prendre en compte pour le calcul de la densité. Il définit la limite inférieure de la plage d’élévations de l’analyse.
Le paramètre Maximum Elevation (Élévation maximale) spécifie la valeur d’élévation la plus élevée dans la plage des élévations à prendre en compte. De la même manière que l’élévation minimale, il définit la limite supérieure de la plage d’élévations de l’analyse.
Le paramètre Elevation Interval (Intervalle d’élévation) spécifie la granularité des intervalles d’élévation utilisés dans l’analyse. Il spécifie la longueur de chaque intervalle d’élévation (par exemple, 100 mètres, 500 mètres ou un kilomètre). L’intervalle d’élévation divise la plage d’élévations entre les élévations minimale et maximale en segments plus petits pour le calcul de la densité.
En spécifiant l’élévation minimale, l’élévation maximale et l’intervalle d’élévation, l’outil calcule la densité d’événements dans chaque intervalle d’élévation pour la plage d’élévations spécifiée.
Densité de noyau en fonction de l’élévation sur points (x,y)
Pour calculer la densité du noyau en fonction de l’élévation sur points (x,y), un noyau spatial, k(x,y), et un noyau d’élévation, k(z), sont utilisés. Il en résulte la formule suivante pour la densité du noyau dans le temps :
Où :
- Pour disti < radius, il convient d’inclure dans la somme uniquement des points situés dans le rayon de l’emplacement (x,y).
- Pour zi < z_distance, il convient d’inclure dans le calcul les points d’élévation uniquement s’ils se trouvent dans la fenêtre d’élévation définie grâce à l’élévation minimale et l’élévation maximale.
- popi correspond à la valeur du champ de population du point i. Ce paramètre est facultatif.
- disti désigne la distance entre le point i et l’emplacement (x,y).
- radius est le rayon de recherche défini autour de l’emplacement (x,y).
- zi est l’élévation à chaque intervalle calculé au sein de la fenêtre d’élévation.
- z_distance est la fenêtre d’élévation définie grâce à l’élévation minimale et l’élévation maximale.
Densité de noyau en fonction de l’élévation et du temps sur points (x,y)
Pour le calcul de la densité du noyau en fonction de l’élévation et du temps sur points (x,y), la formule suivante est utilisée :
Où :
- Pour disti < radius, il convient d’inclure dans la somme uniquement des points situés dans le rayon de l’emplacement (x,y).
- Pour zi < z_distance, il convient d’inclure dans le calcul les points d’élévation uniquement s’ils se trouvent dans la fenêtre d’élévation définie grâce à l’élévation minimale et l’élévation maximale.
- Pour ti < t_window, il convient d’inclure le temps dans le calcul uniquement s’il se trouve dans la fenêtre horaire définie par les heures de début et de fin.
- popi correspond à la valeur du champ de population du point i. Ce paramètre est facultatif.
- disti désigne la distance entre le point i et l’emplacement (x,y).
- radius est le rayon de recherche défini autour de l’emplacement (x,y).
- zi est l’élévation à chaque intervalle calculé au sein de la fenêtre d’élévation.
- z_distance est la fenêtre d’élévation définie grâce à l’élévation minimale et l’élévation maximale.
- ti est le temps à chaque intervalle calculé au sein de la fenêtre horaire (t_window).
- t_window est la fenêtre horaire définie grâce aux heures de début et de fin.
Paramètres de la fenêtre de recherche
Le rayon de recherche (ou largeur de bande dans l’outil Kernel Density (Densité de noyau)) détermine l’étendue ou la portée de l’influence de chaque événement sur le calcul de la densité. Il joue un rôle crucial dans la définition des portées spatiale et temporelle de l’analyse. Pour plus d’informations, reportez-vous à la rubrique Rayon de recherche par défaut (bande passante) de l’aide de l’outil Kernel Density (Densité de noyau).
Dans l’outil Space Time Kernel Density (Densité du noyau spatio-temporel), vous pouvez spécifier le rayon de recherche séparément pour trois types de dimensions : (x, y), élévation (z) et temps (t).
Rayon de recherche pour x et y
Le paramètre Search Radius (x and y) (Rayon de recherche [x et y]) spécifie la distance à l’intérieur de laquelle les événements influencent le calcul de la densité dans les dimensions x et y. Le rayon de recherche peut être exprimé dans la même unité que les données en entrée ou dans des unités telles que les mètres, les kilomètres ou les degrés.
Spécifier un rayon de recherche plus grand permet d’obtenir une surface de densité plus lisse car les événements les plus éloignés d’une localisation particulière ont une plus grande influence sur la densité.
Rayon de recherche de l’élévation
Le paramètre Search Radius (z) (Rayon de recherche [z]) détermine la distance verticale à l’intérieur de laquelle les événements influencent le calcul de la densité dans la dimension d’élévation. Il peut être spécifié dans des unités telles que les mètres ou les pieds ou dans les unités d’élévation des données en entrée.
Comme pour le rayon de recherche x et y, spécifier un rayon de recherche d’élévation plus grand permet d’obtenir une surface de densité plus lisse car les événements à des distances verticales plus grandes d’une localisation particulière ont une plus grande influence sur la densité.
Rayon de recherche du temps
Le paramètre Search Time Window (t) (Fenêtre horaire de recherche [t]) définit l’étendue temporelle à l’intérieur de laquelle les événements influencent le calcul de la densité. Il peut être spécifié dans des unités telles que l’heure, le jour ou le mois. La fenêtre horaire définit une durée autour de chaque événement et les événements qui se produisent dans cette durée contribuent au calcul de la densité à une localisation et une heure spécifiques.
Détails et lissage du résultat
En ajustant les valeurs du rayon de recherche sous l’onglet des paramètres du noyau, vous pouvez contrôler le niveau de détails et le lissage de la surface de densité obtenue. Un rayon de recherche ou largeur de bande plus petit capture davantage de modèles localisés, tandis qu’un rayon de recherche ou largeur de bande plus grand capture des tendances et modèles plus vastes.
Pour sélectionner des valeurs de rayon de recherche ou largeur de bande appropriées, vous devez faire très attention aux caractéristiques des données et aux objectifs de l’analyse. Expérimenter différentes valeurs et évaluer les surfaces de densité obtenues peut permettre de rechercher les paramètres les plus appropriés pour votre analyse spécifique.
Calcul du rayon de recherche
L’algorithme permettant de déterminer le rayon de recherche par défaut effectue les opérations suivantes :
- Calculez le centre moyen des points en entrée. Si un champ de population a été fourni, ce calcul et tous les calculs suivants sont pondérés par les valeurs de ce champ.
- Calculez la distance à partir des centres moyens pondérés de tous les points.
- Calculez la médiane pondérée de ces distances, Dm.
- Calculez la distance standard pondérée, SD.
Remarque :
Pour des détails sur le mode de calcul de la distance standard, reportez-vous à la rubrique Fonctionnement de l’outil de distance standard de l’aide de la boîte à outils Spatial Statistics (Statistiques spatiales).
Le rayon de recherche par défaut pour (x,y) est déterminé par la formule suivante :
Où :
- SD représente la distance standard.
- Dm représente la distance médiane (pondérée) à partir du centre moyen (pondéré).
- n représente le nombre de points si aucune valeur n’est spécifiée pour le paramètre Population Field (Champ de population). Si une valeur est spécifiée pour le paramètre Population Field (Champ de population), n représente la somme des valeurs du champ.
Le rayon de recherche par défaut pour l’élévation (distance_z) et la fenêtre horaire (fenêtre_t) est déterminé par la formule suivante :
Où :
- σz,t représente l’écart type dans la distribution des points des dimensions z et t.
- n représente le nombre de points si aucune valeur n’est spécifiée pour le paramètre Population Field (Champ de population). Si une valeur est spécifiée pour le paramètre Population Field (Champ de population), n représente la somme des valeurs du champ.
- d représente la dimension de l’analyse. La valeur par défaut est 1.
Calcul de la distance standard
Deux méthodes permettent de calculer la distance standard : non pondérée et pondérée.
La distance non pondérée est déterminée par la formule suivante :
Où :
- xi,yi et zi sont les coordonnées de l’entitéi.
- {x̄, ȳ, z̄} représente le centre moyen des entités.
- n est égal au nombre total d’entités.
La distance pondérée est déterminée par la formule suivante :
Où :
- wii est la pondération à l’entité i.
- xi, yi et zi sont les coordonnées de l’entitéi.
- {X̄w, Ȳw, Z̄w} représente le centre moyen pondéré des entités.
Intervalles d’élévation et de temps d’un raster multidimensionnel
La sortie de l’outil Space Time Kernel Density (Densité du noyau spatio-temporel) est un raster multidimensionnel avec des tranches individuelles pour chaque intervalle d’élévation et intervalle de temps. Le nombre total de tranches dans le raster en sortie est calculé à l’aide de l’équation suivante si les données relatives à l’élévation et au temps sont fournies :
Où :
- Zmax représente l’élévation maximale.
- Zmin représente l’élévation minimale.
- Tmax représente le temps maximal.
- Tmin représente le temps minimal.
Effet des méthodes planaire et géodésique sur la densité
Le calcul de la densité varie en fonction de la sélection du système de référence spatiale planaire ou géodésique.
L’option Planar (Planaire) du paramètre Method (Méthode) convient si l’analyse doit être exécutée à l’échelle locale avec une projection qui conserve avec précision les distance et surface correctes. Péar défaut, l’outil utilise la distance planaire.
L’option Geodesic (Géodésique) convient si l’analyse doit être exécutée au niveau régional ou à grande échelle (par exemple, si un système de coordonnées géographiques ou Web Mercator est utilisé). Cette méthode tient compte de la courbure du sphéroïde et traite correctement les données situées près des pôles et la ligne internationale de changement de jour. La méthode géodésique génère toujours un résultat plus précis et est recommandée.
La différence entre les distances planaire et géodésique augmente proportionnellement avec la distance de la source. Si vous travaillez dans une petite zone géographique, telle qu’une ville ou un comté, la différence entre les distances planaire et géodésique est proportionnellement plus petite que si vous travaillez à l’échelle de tout un pays. L’impact de la taille de la zone d’étude et les distortions du projet de carte peuvent interagir pour augmenter davantage la distortion. Pour une projection telle que Web Mercator, plus vous vous rapprochez des pôles, plus la zone que vous pouvez analyser avec la même distorsion de distance est petite.
Pour comprendre les différences entre les distances géodésique et planaire, reportez-vous à la rubrique Distance géodésique ou planaire.
Types de densité en sortie
Le paramètre Resultant Values fournit deux options permettant de calculer et visualiser les types de densité en sortie : Densities (Densités) et Expected Counts (Volumes attendus).
Si l’option Densities (Densités) est sélectionnée, les valeurs des cellules dans le raster en sortie représentent la densité calculée par unité de surface.
Si l’option Expected Counts (Volumes attendus) est sélectionnée, les valeurs représentent le nombre d’événements attendus par zone de cellule. Les équations permettant de calculer les volumes sont les suivantes :
- Avec uniquement le rayon sur le plan x,y, Volume = Densité × Surface.
- Avec l’élévation, Volume = Densité × Surface × Intervalle d’élévation.
- Avec le temps, Volume = Densité × Surface × Intervalle de temps.
- Avec le temps et l’élévation, Volume = Densité × Surface × Intervalle d’élévation × Intervalle de temps.
Il est important de souligner que ces formules supposent une densité constante dans les cellules raster en sortie, l’intervalle d’élévation et l’intervalle de temps. Pour générer des volumes attendus fiables, vous devez sélectionner avec précaution les valeurs des paramètres de taille de cellule, d’intervalle d’élévation et d’intervalle de temps.
Applications possibles
Voici quelques applications possibles de cet outil :
- Comprendre la surface des océans et la composition de l’eau à l’aide de l’élévation et du temps. Par exemple, examinez l’évolution de paramètres, tels que la salinité, la température de l’eau ou le niveau d’oxygène dissous dans l’océan, dans le temps.
- Comprendre les conditions atmosphériques. Par exemple, examinez les changements de densité des relevés de PM2.5 sur une unité géographique à différentes heures du jour ou de l’année.
- Appliquez la capacité de l’outil à utiliser le temps pour comprendre les épidémies, la densité de la criminalité ou la population de sans-abri sur différentes périodes.
- Analyser la composition des particules en suspension dans l’atmosphère à des localisations et élévations différentes. Par exemple, examinez les changements de composition des PM2.5 dans le temps afin d’identifier des modèles de pollution de l’air et des sources de pollution potentielles.
Ressources supplémentaires
Härdle, W. K., Müller, M, Sperlich, S., and Werwatz, A. Nonparametric and semiparametric models (Vol. 1). Berlin: Springer, 2004.
Hu, Y., Wang, F., Guin, C., and Zhu, H. "A spatio-temporal kernel density estimation framework for predictive crime hotspot mapping and evaluation." Applied geography, 99, 2018, 89-97.
Nakaya, T., and Yano, K. "Visualising crime clusters in a space‐time cube: An exploratory data analysis approach using space time kernel density estimation and scan statistics." Transactions in GIS, 14(3), 2010, 223-239.
Silverman, B. W. Density Estimation for Statistics and Data Analysis. New York: Chapman and Hall, 1986.
Rubriques connexes
- Vue d'ensemble du jeu d'outils Densité
- Comprendre l’analyse de la densité
- Densité du noyau spatio-temporel
- Fonctionnement de l'outil Densité de noyau
- Données raster multidimensionnelles
- Onglet Multidimensional (Multidimensionnel)
- Utiliser des données raster multidimensionnelles
- Analyse multidimensionnelle dans ArcGIS AllSource
Vous avez un commentaire à formuler concernant cette rubrique ?