hubert专题

聚类有效性检验（Hubert'Γ ）

问题的提出假设现在有N个样本需要聚类，根据某个聚类算法我们把这N个样本聚为K个簇，现在问题是怎么确定现在的聚类结果是有意义的，而不是仅仅通过随机得到的。下面我们将构造Hubert’Γ 统计量，通过假设检验的方法来解决这一问题。以下内容大部分出至Jain和Dubes的聚类教程《Algorithms for Clustering Data》。部分理解可能有误，欢迎指出错误。所需用到的定义在