集成聚类之EAC算法(证据积累数据聚类)附:单连接(SL)易理解详谈

2023-11-05 20:41

本文主要是介绍集成聚类之EAC算法(证据积累数据聚类)附:单连接(SL)易理解详谈,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       最近要写论文涉及到聚类集成,想先从EAC做起,集成方面做得还不是很好。如果有机会的话,希望也在研究集成聚类的大佬们和我联系,一起研究探讨集成聚类这方面的知识。感谢各位!

   

       证据积累的想法是这样的:将每个聚类结果作为数据组织独立的证据,把多个聚类的结果合并到一个分区中。

 

方法为拆分合并:

(1)拆分:把大型的多维数据分成小型的球型簇。

                    使用K-Means算法执行此步骤,因为通过K的随机初始化,可以获得各种聚类结果。

(2)结合:为将不同数目的聚类分区并到一块,使用“投票法”合并聚类的结果。

         那么肯定会有这么一种可能,“自然”产生的集群可能在不同集群下的统一集群(不同的划分,做出一个邻近度矩阵)          

         在同一个集群下模式对的同时出现做一个投票标记给关联上。做一个矩阵co-assocation(i,j)=\frac{votes_{ij}}{N}

         N是聚类的数目,votes_{ij}是ij对,被分配给N个聚类数中相同聚类的次数。

(3)合并:恢复自然簇,根据邻域关系,用MST算法(最小生成树),用t的阙值切断弱连接,这句话说的专业一点就是用阙值t在相似性矩阵上切割单连接(SL)生成的树状图,来合并拆分阶段生成的簇。

补充

          1.MST(最小生成树):学过数据结构的一定都会,包括解决方法两种,克鲁斯卡尔和普利姆算法,很简单,如果有忘记的朋友们可以自行复习一下。

          2.那么什么是单连接(SL)呢?:单连接和全连接都是由(2)的邻近度矩阵所出现的。

                                                                 单连接是作用于阙值图的

(阙值图是N个节点的无向图,每个节点都是一个对象,图中不存在环和多重边。用G(v)表示,v表示不相似的程度。给一个v,如果节点i和j之间的不相似度小于v,就在i和j之间插入一条边edge(i,j)。)

例:邻近度矩阵:D=\begin{Bmatrix} 0\, \, 0\, \, 0\, \, 2\, \,0\\ 0\, \, 0\, \, 1\, \, 5\, \, 3\\ 0\, \, 1\, \, 0\, \, 0\, \, 0\\ 2\, \, 5\, \, 0\, \, 0\, \, 4\\ 0\, \, 3\, \, 0\, \, 4\, \, 0 \end{Bmatrix}设定邻近度为5

(1)G(0):刚开始都是点,没有边,每个点都是一个簇,有n个点就是有n个簇。

(2)G(1):根据邻近度矩阵,找1,发现(2,3)满足条件

(3)G(2):找2,发现

(4)G(3):(2,5)

(5)G(4):设定不超过5,所以4是最后一个(4,5)

我们做聚类,最后把它拉成树状图:

总结

EAC步骤:

n ---维数    k---初始簇数   N---聚类数   t---阙值   邻近度矩阵设为空

(1)做N次:1.随机选择K聚类中心;2.初始化用K-Means,生成分区P;3.更新关联度矩阵,对P中同一集群中每对ij更新

(2)用SL找到一致性簇:1.投票法找到多数关联,对每对(i,j)合并到统一集群;2.没包含集群里剩下的做单个集群。

 

本人尚才疏学浅,如内容中有任何错误的地方,望告知,我会加以修改,之后会继续更新。

这篇关于集成聚类之EAC算法(证据积累数据聚类)附:单连接(SL)易理解详谈的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/352372

相关文章

SpringBoot使用GZIP压缩反回数据问题

《SpringBoot使用GZIP压缩反回数据问题》:本文主要介绍SpringBoot使用GZIP压缩反回数据问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录SpringBoot使用GZIP压缩反回数据1、初识gzip2、gzip是什么,可以干什么?3、Spr

Spring Boot 集成 Quartz并使用Cron 表达式实现定时任务

《SpringBoot集成Quartz并使用Cron表达式实现定时任务》本篇文章介绍了如何在SpringBoot中集成Quartz进行定时任务调度,并通过Cron表达式控制任务... 目录前言1. 添加 Quartz 依赖2. 创建 Quartz 任务3. 配置 Quartz 任务调度4. 启动 Sprin

SpringBoot集成Milvus实现数据增删改查功能

《SpringBoot集成Milvus实现数据增删改查功能》milvus支持的语言比较多,支持python,Java,Go,node等开发语言,本文主要介绍如何使用Java语言,采用springboo... 目录1、Milvus基本概念2、添加maven依赖3、配置yml文件4、创建MilvusClient

深入理解Apache Kafka(分布式流处理平台)

《深入理解ApacheKafka(分布式流处理平台)》ApacheKafka作为现代分布式系统中的核心中间件,为构建高吞吐量、低延迟的数据管道提供了强大支持,本文将深入探讨Kafka的核心概念、架构... 目录引言一、Apache Kafka概述1.1 什么是Kafka?1.2 Kafka的核心概念二、Ka

SpringValidation数据校验之约束注解与分组校验方式

《SpringValidation数据校验之约束注解与分组校验方式》本文将深入探讨SpringValidation的核心功能,帮助开发者掌握约束注解的使用技巧和分组校验的高级应用,从而构建更加健壮和可... 目录引言一、Spring Validation基础架构1.1 jsR-380标准与Spring整合1

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各

MySQL 中查询 VARCHAR 类型 JSON 数据的问题记录

《MySQL中查询VARCHAR类型JSON数据的问题记录》在数据库设计中,有时我们会将JSON数据存储在VARCHAR或TEXT类型字段中,本文将详细介绍如何在MySQL中有效查询存储为V... 目录一、问题背景二、mysql jsON 函数2.1 常用 JSON 函数三、查询示例3.1 基本查询3.2

SpringBatch数据写入实现

《SpringBatch数据写入实现》SpringBatch通过ItemWriter接口及其丰富的实现,提供了强大的数据写入能力,本文主要介绍了SpringBatch数据写入实现,具有一定的参考价值,... 目录python引言一、ItemWriter核心概念二、数据库写入实现三、文件写入实现四、多目标写入

使用Python将JSON,XML和YAML数据写入Excel文件

《使用Python将JSON,XML和YAML数据写入Excel文件》JSON、XML和YAML作为主流结构化数据格式,因其层次化表达能力和跨平台兼容性,已成为系统间数据交换的通用载体,本文将介绍如何... 目录如何使用python写入数据到Excel工作表用Python导入jsON数据到Excel工作表用

MySQL中的交叉连接、自然连接和内连接查询详解

《MySQL中的交叉连接、自然连接和内连接查询详解》:本文主要介绍MySQL中的交叉连接、自然连接和内连接查询,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、引入二、交php叉连接(cross join)三、自然连接(naturalandroid join)四