空间统计并不意味着将传统(非空间)统计方法应用于恰巧是空间数据(有 x 和 y 坐标)的数据。空间统计将空间和非空间关系直接整合到数学计算中(面积、距离、长度等)。对于许多空间统计,这些空间关系是通过空间权重矩阵文件或表正式指定。
空间权重矩阵是数据空间结构的一种表现形式。它是对数据集要素之间存在的空间关系的一种量化(或者,至少是对此类关系的概念化方法的一种量化)。因为空间权重矩阵要对数据强加一种结构,所以应选择可最恰当地反映要素彼此间实际交互方式的概念化(当然,还需考虑要尝试测量的对象)。例如,如果要测量森林中某种特定种类的种子繁殖树种的聚类,使用某种形式的反距离可能最适合。但是,如果要评估某一地区通勤者的地理分布,行程时间和行程成本可能是更好的选择。
虽然是依靠各种方法物理实现的,但从概念上讲,空间权重矩阵是 NxN 表(N 表示数据集中的要素数)。每个要素只有一行和一列。任意给定行/列组合的像元值即为权重,可用于量化这些行要素和列要素之间的空间关系。
在最基本的层面上,通过创建权重来量化数据要素之间的关系的策略有两种:二进制或可变权重。对于二进制策略(固定距离、K 最近邻域、Delaunay 三角测量、邻接或空间 - 时间窗口),要素或者是邻域 (1),或者不是 (0)。对于权重策略(反距离或无差别的区域),邻近要素有不同量级的作用(或影响),并通过计算权重来反映该变化。
根据您所指定的参数,生成空间权重矩阵工具可创建空间权重矩阵 (SWM) 文件。该文件中的空间关系值使用稀疏矩阵法进行存储,以便将磁盘空间和计算机内存的占用以及所需计算的次数降至最低。这些关系值用于多种空间统计工具的数学计算,包括空间自相关(Global Moran's I)、热点分析(Getis-Ord Gi*) 和聚类和异常值分析(Anselin Local Moran's I)。虽然空间权重矩阵文件或许可以存储 NxN 个空间关系,但在多数情况下,每个要素应仅与其他几个要素相关。稀疏方法通过只存储非零关系来利用此功能。
注:
使用 SWM 文件时可能会发生内存不足的情况。这通常发生在以下情况:您选择空间关系的概念化或距离范围或距离阈值,导致要素具有许多许多的相邻点,进而改变了 SWM 文件的稀疏本质。在每个要素都有成千上万个相邻点的情况下,您通常不想创建空间权重矩阵。您希望所有要素至少具有一个相邻点,几乎所有要素至少具有八个相邻点。可为相邻点的数目参数输入最小值,以确保每个要素都具有指定最小数目的相邻点。
抢先版本:
使用小字节二进制文件格式写入空间权重矩阵 (SWM) 文件。有关如何向磁盘读取和写入 SWM 文件的详细信息,请右键单击生成空间权重矩阵工具并选择编辑。将显示此工具的 Python 资源代码。
其他资源
Getis, Arthur 和 Jared Aldstadt。“使用本地统计数据构建空间权重矩阵。”地理分析 36(2):90–104,2004。
Mitchell, Andy.ESRI GIS 分析手册, 第 2 卷。ESRI 出版社,2005。