测量一组点或区域的趋势的一种常用方法便是分别计算 x、y 和 z 维度上的标准距离。 这些测量值可用于定义一个包含所有要素分布的椭圆(或椭圆体)的轴。 由于该方法是由平均中心作为起点对 x 坐标和 y 坐标的标准差进行计算,从而定义椭圆的轴,因此该椭圆被称为标准差椭圆。 在 3D 中,还计算由平均中心作为起点 z 坐标的标准差,计算结果被称为标准差椭圆体。 利用该椭圆或椭圆体,您可以查看要素的分布是否为狭长形,且是否因此具有特定方向。
正如通过在地图上绘制要素您可以感受到要素的方向性一样,计算标准差椭圆则可使这种趋向变得更为明确。 您可以根据要素的位置点或受与要素关联的某个属性值影响的位置点来计算标准差椭圆。 后者称为加权标准差椭圆。
计算
标准差椭圆通过以下公式计算:

其中 x 和 y 是 i要素的坐标,{x̄, ȳ} 表示要素的平均中心,n 为要素总数。
样本协方差矩阵被分解为标准形式,使得矩阵可由本征值和特征向量来表示。 于是,x 和 y 轴的标准差为:

这些方程式也可扩展到三维数据的解。
输出和解释
标准差帮助您了解数据的分散或分布。 当处理一维正态分布数据时,68%、95% 和 99.7% 的数据值将分别处于一个、两个和三个标准差范围之内。 然而,当处理更高维数的空间数据(x、y 和 z 变量)时,这些百分比并不正确。 例如,对于二维正态分布数据,一个标准差椭圆将大约覆盖 63% 的要素;两个标准差椭圆将大约覆盖 98% 的要素;三个标准差椭圆将大约覆盖 99.9% 的要素。 同样,对于三维正态分布数据,数据值分别为 61%、99% 和 100%。
因此,标准差由调整因子进行衡量,以对于 2D 和 3D 数据,生成包含 68%、95% 和 99% 的要素的椭圆或椭球体(假设数据遵循空间正态分布)。 方差(标准差的平方)的这些调整因子如下表所示:
一维数据 | 二维数据 | 三维数据 | |
---|---|---|---|
1 个标准差 | 1.00 | 1.41 | 1.73 |
2 个标准差 | 2.00 | 2.83 | 3.46 |
3 个标准差 | 3.00 | 4.24 | 5.20 |
对于二维数据来说,方向分布(标准差椭圆)工具会创建一个新要素类,其中包含一个以所有要素的平均中心为中心的椭圆面(或如果为案例分组字段参数指定了值,则为所有案例)。 这些输出椭圆面的属性值包括两个标准距离(长轴和短轴)、椭圆的方向和案例分组字段(如指定)。 方向表示从顶点开始按顺时针进行测量的长轴的旋转。 您还可以指定要表示的标准差数(1、2 或 3),以覆盖不同百分比的要素。
对于三维点数据(您的数据启用了 z 值,且包含 3D 属性信息,如高程)来说,该工具会创建一个新要素类,其中包含一个以所有要素的平均中心为中心的椭圆多面体(或如果使用的是案例分组字段,则为所有案例)。 这些输出椭圆体的属性值包括三个标准距离(长轴、短轴和高度轴);有关椭圆体的角度、倾斜度和滚动的信息;以及案例字段(如指定)。 椭圆体的角度、倾斜度和滚动值,用来描述椭圆体在 3D 空间中的方位。 您还可以指定要表示的标准差数(1、2 或 3),以覆盖不同百分比的要素。
可能的应用
- 在地图上标示一组犯罪行为的分布趋势可以确定该行为与特定要素(一系列酒吧或餐馆、某条特定街道等)的关系。
- 在地图上标示地下水井样本的特定污染可以指示毒素的扩散方式,这在部署减灾策略时非常有用。
- 对各个种族或民族所在区域的椭圆的大小、形状和重叠部分进行比较可以提供与种族隔离或民族隔离相关的深入信息。
- 绘制一段时间内疾病爆发情况的椭圆可建立疾病传播的模型。
- 当调查大气状况和飞行事故间的关联时,检查某一类暴风的高程分布是需要考虑的一个有用因素。
其他资源
Chew, Victor. "Confidence, prediction, and tolerance regions for the multivariate normal distribution." Journal of the American Statistical Association. 61.315 (1966): 605-617. https://doi.org/10.1080/01621459.1966.10480892.
Fisher, N. I., T. Lewis, and B. J. J. Embleton. 1987. "Statistical Analysis of Spherical Data". First edition. Cambridge: Cambridge University Press. Cambridge Books Online. Web. 26 April 2016. https://doi.org/10.1017/CBO9780511623059.
Levine, Ned. "CrimeStat III: a spatial statistics program for the analysis of crime incident locations (version 3.0)." Houston (TX): Ned Levine & Associates/Washington, DC: National Institute of Justice (2004). https://doi.org/10.3886/ICPSR02824.v1.
Wang, Bin, Wenzhong Shi, and Zelang Miao. 2015. "Confidence Analysis of Standard Deviational Ellipse and Its Extension into Higher Dimensional Euclidean Space". PLoS ONE. 10(3), e0118537.https://doi.org/10.1371/journal.pone.0118537.