时空核密度工具 - 将核密度计算从分析输入要素的相对位置和量值扩展为包含其他维度,例如时间和深度(高程)。 生成的输出使用多个核函数识别单位面积的量值,以将锥形表面平滑拟合到每个输入点。
与其他密度工具比较
密度分析是许多空间分析和地统计分析的关键。 示例包括以下内容:
- 人口统计研究
- 集中度、暴露度和弹性研究
- 制定政策以帮助确定特定地点或社区对特定服务的需求,例如医疗保健设施、紧急服务、基础设施和道路网络
还有其他用于计算密度的工具,包括核密度、点密度和线密度。 这些工具计算要素周围邻域内要素(点或线)的密度。 但是,他们没有考虑其他维度。
时空核密度工具可以分析在空间和时间上发生的事件或事件点的密度,并且能够考虑高程。 通过将海拔和时间纳入方程,该工具扩展了对所考虑现象的空间和时间分布以及模式和趋势的理解。
时空核密度的主要优势
时空核密度工具将核密度估计的概念与时间分析相结合,以提供对模式的全面理解。 与其他形式的密度估计相比,此工具具有以下优势:
- 同时在不同高度分析事件的空间和时间维度。 这提供了对模式的更全面的理解,并有助于识别随时间、空间和海拔变化事件集中度高或低的区域。
- 考虑时间维度,分析事件密度如何随时间变化。 这对于研究犯罪模式、疾病爆发或运输流等动态现象特别有用。
- 同时考虑高程和时间方面,您可以分析事件密度在不同海拔随时间的变化情况。 这对于研究地球科学中的动态现象特别有用,例如气压、臭氧密度、污染物、空气和水的成分、水的盐度、溶解氧水平、水的电导率、水压和温度。
- 提供参数选择的灵活性,包括核类型、搜索半径(带宽)、高程和时间单位的选择。 这使得您能够根据特定需求和数据特征定制分析,从而获得更准确、更有意义的结果。
- 利用 ArcGIS AllSource 现有的功能来分析和可视化多维栅格数据,并以多维数据的 Esri 云栅格格式 (CRF) 格式作为默认输出栅格提供各种可视化选项。 这对于隔离任何特定维度或可视化来说很有用,并有助于识别空间和时间数据中的热点、趋势和模式,从而能够更好地决策和理解时空关系。
该工具提供了对事件模式更细致的理解。 它可以应用于犯罪分析、疾病地图、交通规划、环境监测、海洋学和大气科学等各个领域。 凭借分析空间和时间的能力,让它成为理解复杂现象的多功能工具。 不过它的具体优势和适用性可能因数据性质和分析目标的不同而有所不同。
时空核密度的计算原理
时空核密度工具使用具有高程和时间数据的点要素来计算每个输出栅格像元周围点要素的核密度。
概念上,每个点上方均覆盖着一个平滑曲面。 该技术与点输入的核密度工具的工作方式类似。 该点位置处的曲面值最高,并随着与该点位置距离的增加而不断减小,当距该点距离达到搜索半径参数值时,曲面值为零。 由于输入数据类型是点,因此只能使用圆形邻域。 曲面与下方的平面所围成的空间的体积等于此点的 Population Field 参数值,如果将此字段值指定为 NONE 则体积为 1。 每个输出栅格像元的密度均为叠加在栅格像元中心的所有核表面的值之和。 核函数以 Silverman 的著作(1986 年版,第 76 页,equation 4.5)中描述的四次核函数为基础。
公式如下:
其中:
- i = 1,…,n 是输入点。
- f(j) 是每个像元中心的密度。
- dij 是事件点和像元中心之间的距离。
- h 是搜索半径。
如果 Population Field 参数设置使用的是 NONE 之外的值,则每项的值用于确定点被计数的次数。 例如,值 3 会导致点被算作三个点。 值可以为整型或浮点型。
默认情况下,单位是根据输入点要素数据的投影定义的线性单位进行选择的,或是在输出坐标系环境设置中以其他方式指定的。
如果选择的是输出面积单位系数参数,则计算所得的像元密度将乘以相应系数,然后写入到输出栅格。 例如,如果输入单位为米,则输出面积单位将默认为平方千米。 将以米和千米为单位的单位比例因子进行比较的最终结果,将得到相差 1,000,000(1,000 米 x 1,000 米)倍的值。
预测某个位置的密度
新 (x,y) 位置的预测密度由以下公式确定:
其中:
- i = 1,…,n 是输入点。 如果 disti < radius,且它们位于 (x,y) 位置的半径距离内,则仅包括总和中的点。
- popi 是 i 点的 population 字段值。 这是可选参数。
- disti 是点 i 和 (x,y) 位置之间的距离。
- radius 是围绕 (x,y) 位置定义的搜索半径。
然后将计算的密度乘以点数,或者乘以 population 字段的总和(如果有)。 这种校正使空间积分等于点数(或总和或 population 字段),而非总等于 1。 该实现使用四次核(Silverman,1986)。 为要估算密度的每个位置分别计算公式。 由于正在创建栅格,因此计算将应用于输出栅格中每个像元的中心。
时间和高程
要将时间维度包含在此工具的计算中,您需要确定开始时间、结束时间和时间间隔。
开始时间参数指定要计算密度的时间段的开始。 它可以是特定的日期(例如,2023 年 12 月 31 日),或时间(下午 3:45:45),或日期和时间一起(2023 年 12 月 31 日下午 3:45:45)。 开始时间设置了计算的搜索时间窗口(t_window)的下限。
结束时间参数指定密度计算的时间段的结束时间。 与开始时间类似,可以是具体的日期和时间,也可以是日期和时间一起。 结束时间设置了计算的搜索时间窗口(t_window)的上限。
时间间隔参数指定分析中使用的时间间隔的颗粒度。 它指定每个时间间隔的长度,例如 1 小时、1 天或 1 个月。 时间间隔将开始时间和结束时间之间的时间范围划分为更小的段,以进行密度计算。 间隔单位可以是秒、分钟、小时、天或周。
根据指定的开始时间、结束时间和时间间隔,该工具计算每个时间间隔内以及指定时间范围内的事件密度。 该工具根据指定的时间间隔将开始时间和结束时间之间的时间范围划分为更小的段,从而计算每个时间间隔内的事件密度。 这使我们能够更详细地分析事件密度随时间的变化情况。 例如,如果时间间隔设置为 1 小时,时间范围是上午 9:00 到下午 5:00,该工具将计算每个小时内事件的密度(上午 9:00-10:00、上午 10:00-11:00 等)以了解事件发生的时间模式。
(x,y) 点上随时间变化的核密度
为了计算 (x,y) 点跨时间的核密度,使用空间核 k(x,y) 和时间核 k(t)。 这得出了以下随时间变化的核密度公式:
其中:
- 对于 disti < radius,如果它们位于 (x,y) 位置的半径距离内,则仅包括总和中的点。
- 对于 ti < t_window,仅当时间位于由开始时间和结束时间定义的时间窗口内时,才将时间包含在计算中。
- popi 是 i 点的 population 字段值。 这是可选参数。
- disti 是点 i 和 (x,y) 位置之间的距离。
- radius 是围绕 (x,y) 位置定义的搜索半径。
- ti 是时间窗口 (t_window) 内计算的每个间隔的时间。
- t_window 是用开始时间和结束时间定义的时间窗口。
高程参数用于分析在空间和高程上发生的事件或现象的密度。 该工具考虑了事件的空间位置以及发生的高程高度。 要计算此工具中的高程尺寸,需要指定三个参数:最小高程、最大高程和高程间隔。
最小高程参数指定您想要考虑用于密度计算的高程范围内的最低高程值。 它设置了分析的高程范围的下限。
最大高程参数指定您要考虑的高程范围内的最大高程值。 与最低高程类似,它设置了分析的高程范围上限。
高程间隔参数指定分析中使用的高程间隔的颗粒度。 它指定每个高程间隔的长度,例如 100 米、500 米或 1 公里。 高程间隔将最小高程和最大高程之间的高程范围划分为更小的段,以便进行密度计算。
通过指定最小高程、最大高程和高程间隔,该工具可以计算每个高程间隔内以及指定高程范围内的事件密度。
跨不同高程的核密度 (x,y)
为了计算 (x,y) 点跨高程的核密度,使用空间核 k(x,y) 和高程核 k(z)。 这得出了以下随时间变化的核密度公式:
其中:
- 对于 disti < radius,如果它们位于 (x,y) 位置的半径距离内,则仅包括总和中的点。
- 对于 zi < z_distance,仅当高程点位于用最小和最大高程定义的高程窗口内时,才将其包含在计算中。
- popi 是 i 点的 population 字段值。 这是可选参数。
- disti 是点 i 和 (x,y) 位置之间的距离。
- radius 是围绕 (x,y) 位置定义的搜索半径。
- zi 是在高程窗口内计算的每个间隔的高程。
- z_distance 是用最小和最大高程定义的高程窗口。
跨不同高程和时间的核密度 (x,y)
为了计算 (x,y) 点上不同高程和时间的核密度,使用以下公式:
其中:
- 对于 disti < radius,如果它们位于 (x,y) 位置的半径距离内,则仅包括总和中的点。
- 对于 zi < z_distance,仅当高程点位于用最小和最大高程定义的高程窗口内时,才将其包含在计算中。
- 对于 ti < t_window,仅当时间位于由开始时间和结束时间定义的时间窗口内时,才将时间包含在计算中。
- popi 是 i 点的 population 字段值。 这是可选参数。
- disti 是点 i 和 (x,y) 位置之间的距离。
- radius 是围绕 (x,y) 位置定义的搜索半径。
- zi 是在高程窗口内计算的每个间隔的高程。
- z_distance 是用最小和最大高程定义的高程窗口。
- ti 是时间窗口 (t_window) 内计算的每个间隔的时间。
- t_window 是用开始时间和结束时间定义的时间窗口。
搜索窗口参数
搜索半径(或核密度工具中所指的带宽)决定了每个事件对密度计算的影响程度或范围。 它在定义分析的空间和时间范围方面起着至关重要的作用。 有关详细信息,请参阅核密度工具帮助中的默认搜索半径(带宽)。
在时空核密度工具中,您可以分别为三种类型的维度指定搜索半径:(x, y)、高程 (z) 和时间 (t)。
x 和 y 的搜索半径
搜索半径(x 和 y)参数指定事件将影响 x 和 y 维度上的密度计算的距离。 搜索半径可以采用与输入数据相同的单位,也可以以米、公里或度等单位指定。
指定较大的搜索半径将产生更平滑的密度表面,因为距离特定位置较远的事件将对其密度值产生更大的影响。
高程的搜索半径
搜索半径 (z) 参数用于确定事件在高程维度上影响密度计算的垂直距离。 它可以以米、英尺等单位指定,也可以与输入数据的高程单位相同。
与 x 和 y 搜索半径类似,指定较大的高程搜索半径将产生更平滑的密度表面,因为距离特定位置垂直距离较大的事件将对其密度值产生更大的影响。
时间的搜索半径
搜索时间窗口 (t) 参数定义了事件影响密度计算的时间范围。 可以按小时、天或月等单位指定。 时间窗口为每个事件设置一个持续时间,在此持续时间内发生的事件将有助于特定位置和时间的密度计算。
结果的细节和平滑度
通过调整“核参数”选项卡下的搜索半径值,您可以控制生成的密度表面的细节和平滑度。 较小的搜索半径或带宽,捕获更加局部的趋势和模式;较大的搜索半径或带宽,捕获更加广泛的趋势和模式。
要选择合适的搜索半径或带宽值,需要仔细考虑数据的特点和分析目标。 尝试不同的值并评估得到的密度表面,可以帮助您找到最适合您特定分析的参数。
搜索半径计算
用于确定默认搜索半径的算法执行以下操作:
- 计算输入点的平均中心。 如果提供了 Population Field,则此字段和所有以下计算将按该字段中的值加权。
- 计算所有点的加权平均中心的距离。
- 计算这些距离的加权中值 Dm。
- 计算加权标准距离 SD。
注:
有关如何计算标准距离的详细信息,请参阅空间统计工具箱帮助中的标准距离的工作原理。
(x,y) 的默认搜索半径由以下公式确定:
其中:
- SD 是标准距离。
- Dm 是(加权)平均中心的(加权)中值距离。
- 如果未指定 Population Field 参数值,则 n 是点的数量。 如果提供了 Population Field 参数值,则 n 是字段值的总和。
高程 (z_distance) 和时间窗口 (t_window) 的默认搜索半径由以下公式确定:
其中:
- σz,t 是 z 和 t 维度分布的标准差。
- 如果未指定 Population Field 参数值,则 n 是点的数量。 如果提供了 Population Field 参数值,则 n 是字段值的总和。
- d 是分析维度。 默认值为 1。
标准距离计算
有两种计算标准距离的方法,即未加权和加权。
无加权距离由以下公式确定:
其中:
- xi、yi 和 zi 是要素 i 的坐标。
- {x̄, ȳ, z̄} 表示要素的平均中心。
- n 等于要素总数。
加权距离由以下公式确定:
其中:
- wi 是要素 i 的权重。
- xi、yi 和 zi 是要素 i 的坐标。
- {X̄w, Ȳw, Z̄w} 表示要素的加权平均中心。
多维栅格高程和时间间隔
时空核密度工具的输出是一个多维栅格,其中包含每个高程和时间间隔的单独切片。 如果同时提供高程和时间输入数据,则使用以下方程计算输出栅格中的切片总数:
其中:
- Zmax 是最大高程。
- Zmin 是最小高程。
- Tmax 是最长时间。
- Tmin 是最短时间。
平面和测地线方法对密度的影响
密度的计算将根据平面或测地空间参考系统的选择而有所不同。
如果要对投影可准确保留正确距离和面积的本地比例下执行分析,则可在方法参数中选择平面选项。 默认情况下,该工具使用平面距离。
如果要在区域或大范围内进行分析,则测地线选项是合适的,例如当使用 Web 墨卡托或任何地理坐标系时。 这种方法考虑到椭球体的曲率,并可以正确处理两极和国际日期变更线附近的数据。 测地线方法总是能产生更准确的结果,并且是推荐的方法。
平面距离和测地距离之间的差异随着与源的距离成比例增加。 如果您在较小的地理区域(例如城市或县)内工作,则平面和测地线之间的差异会比在整个国家范围内工作时要小。 受研究区域大小的影响,在地图投影畸变的作用下,导致畸变加剧。 对于诸如 Web 墨卡托之类的投影,距离极点越近,在相同距离畸变的情况下可以分析的区域就越小。
要了解距离计算中测地线距离和平面距离之间的区别,请参阅测地线与平面距离。
输出密度类型
结果值参数提供了两个选项来计算和可视化输出密度类型:密度和预期计数。
如果选择了密度设置,则输出栅格中的像元值表示计算出的每单位面积的密度值。
如果选择了预期计数设置,则这些值表示每个像元面积的预期事件数。 用于计算计数的公式如下:
- 仅使用 x,y 平面上的半径,计数 = 密度 × 面积。
- 对于高程,计数 = 密度 × 面积 × 高程间隔。
- 随时间变化,计数 = 密度 × 面积 × 时间间隔。
- 随时间和高程变化,计数 = 密度 × 面积 × 高程间隔 × 时间间隔。
需要强调的是,这些公式假设输出栅格单元、高程间隔和时间间隔内的密度恒定。 为了生成可靠的预期计数,应仔细考虑像元大小、高程间隔和时间间隔参数值的选择。
可能的应用
此工具的潜在应用包括:
- 通过高程和时间,了解海洋表面和水的成分。 例如,检查整个海洋的盐度、水温或溶解氧水平等参数随时间的变化。
- 了解大气状况。 例如,检查某个地理单元在一天或一年中的不同时间的 PM2.5 读数密度变化。
- 应用该工具的时间维度来了解不同时期的疾病爆发、犯罪密度或无家可归人口。
- 分析不同地点和高程的大气中悬浮空气颗粒的成分。 例如,检查 PM2.5 成分随时间的变化,深入了解空气污染模式并识别潜在的污染源。
其他资源
Härdle, W. K., Müller, M, Sperlich, S., and Werwatz, A. Nonparametric and semiparametric models (Vol. 1). Berlin: Springer, 2004.
Hu, Y., Wang, F., Guin, C., and Zhu, H. "A spatio-temporal kernel density estimation framework for predictive crime hotspot mapping and evaluation." Applied geography, 99, 2018, 89-97.
Nakaya, T., and Yano, K. "Visualising crime clusters in a space‐time cube: An exploratory data analysis approach using space time kernel density estimation and scan statistics." Transactions in GIS, 14(3), 2010, 223-239.
Silverman, B. W. Density Estimation for Statistics and Data Analysis. New York: Chapman and Hall, 1986.