Iso 聚类的工作原理

需要 Spatial Analyst 许可。

Iso 聚类工具使用经过修改的迭代优化聚类过程,也称为迁移均值技术。 该算法将所有像元分成输入波段的多维空间中用户指定数量的不同单模式组。 该工具最常用于为非监督分类做准备。

isodata 聚类算法的 iso 前缀是执行聚类的迭代自组织方式的缩写。 此类型聚类使用的过程中,在每次迭代期间,所有样本均被分配到现有的聚类中心,并为每个类重新计算新的均值。 指定的最佳类数通常是未知的。 因此,建议输入一个保守的高值,分析生成的聚类,并使用减少的类数重新运行该函数。

iso 聚类算法是一个迭代过程,用于在将每个候选像元分配到一个聚类时计算最小欧氏距离。 该过程以软件分配的任意均值开始,每个集群一个(您指定集群的数量)。 每个像元均分配给这些均值中最接近的一个(均在多维属性空间中)。 在第一次迭代后,将根据属于该聚类的像元的属性距离为每个聚类重新计算新均值。 重复该过程:将每个像元分配给多维属性空间中最接近的均值,并根据迭代中像元的成员资格为每个聚类计算新的均值。 您可以通过迭代次数指定流程的迭代次数。 该值应足够大,以确保在运行指定次数的迭代后,像元从一个聚类到另一个聚类的迁移最小;从而使所有聚类都变得稳定。 当增加聚类数时,迭代次数也应增加。

指定的类数值是聚类过程可以生成的最大聚类数。 但是,输出特征文件中的聚类数可能与为类数指定的数不同。 这种情况发生在以下情况:

  • 数据值和初始聚类均值分布不均。 在某些像元值范围内,这些聚类的出现频率可能几乎为零。 因此,某些最初预定义的聚类均值可能没有机会吸收足够的像元成员。
  • 由比指定的最小类大小值更少的像元组成的聚类将在迭代结束时被消除。
  • 当聚类稳定后统计值相似时,聚类与相邻聚类合并。 某些聚类可能彼此非常接近并且具有相似统计数据,以至于将它们分开将是不必要的数据划分。

示例

以下是 Iso 聚类创建的示例特征文件。 该文件以标题开始,标题已设置为注释,显示执行 iso 聚类时使用的参数值。

类名称是可选的,在使用文本编辑器创建文件后进行输入。 如果输入类名称,则每个类名必须是长度不超过 14 个字母数字字符的单个字符串。

# Signatures Produced by Clustering of 
#    Stack redlands
#    number_of_classes=6   max_iterations=20   min_class_size=20
#    sampling interval=10
#    Number of selected grids
/*           3
#    Layer-Number   Grid-name
/*           1      redlands1
/*           2      redlands2
/*           3      redlands3

# Type  Number of Classes   Number of Layers  Number of Parametric
                                                   Layers
   1             4                 3                 3
# ===============================================================

# Class ID     Number of Cells      Class Name
       1              1843 
# Layers   1             2             3
# Means 
        22.8817       60.7656       34.8893
# Covariance
1      169.3975      -69.7444      179.0808
2      -69.7444      714.7072       10.7889
3      179.0808       10.7889      284.0931
# ---------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       2              2495 
# Layers   1             2             3
# Means 
         38.4894      132.9775       61.8104
# Covariance
1       414.9621      -19.0732      301.0267
2       -19.0732      510.8439      102.8931
3       301.0267      102.8931      376.5450
# ---------------------------------------------------------------
# Class ID     Number of Cells      Class Name
       3              2124 
# Layers   1             2             3
# Means 
         70.3983       82.9576       89.2472
# Covariance
1       264.2680      100.6966       39.3895
2       100.6966      523.9096       75.5573
3        39.3895       75.5573      279.7387
# ------------------------------------------------------------

# Class ID     Number of Cells      Class Name
       4              2438 
# Layers   1             2             3
# Means 105.8708      137.6645      130.0886
# Covariance
1       651.0465      175.1060      391.6028
2       175.1060      300.8853      143.2443
3       391.6028      143.2443      647.7345

参考资料

Ball, G. H., and D. J. Hall. 1965. A Novel Method of Data Analysis and Pattern Classification. Menlo Park, California: Stanford Research Institute.

Richards, J. A. 1986. Remote Sensing Digital Image Analysis: An Introduction.. Berlin: Springer–Verlag.

相关主题


在本主题中
  1. 示例
  2. 参考资料