【作业】{r} :自编实现K-Means聚类算法的函数,且画出每一次迭代中每组中心点的变动情况

本文主要是介绍【作业】{r} :自编实现K-Means聚类算法的函数,且画出每一次迭代中每组中心点的变动情况,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作业要求:

        在本节中, 我们想要通过自己编写一个K-Means函数来更加深入的理解K-Means算法的流程. 并且在输出k个中心点位置和k个分组的基础上, 还想在每一次迭代中画出当前中心点的位置, 以便将这个算法动态的展示出来.

↓↓↓ 交作业点击下面链接 

链接失效了


 附上完整代码

(1)

# 定义函数
my_kmeans = function(data, k, err){# 导入数据dat = as.matrix(data)# 选取k个初始中心idx = sample(1:nrow(data),k)c = matrix(NA, nrow = k, ncol = ncol(dat))for(n in 1:k){c[n,] = dat[idx[n],]}# 保存每次迭代的中心点save = list(c)# 迭代次数count = 0 repeat{# 计算每一个样本对于聚类中心的距离,保存在一个150*k的矩阵中mat = matrix(NA, nrow = nrow(dat), ncol = k)for(i in 1:nrow(dat)){x = dat[i,]for(j in 1:k){mat[i,j] = sqrt(sum((x - c[j,])^2))        }}groups = apply(mat, 1,which.min)cnew = matrix(NA, nrow = k, ncol = ncol(dat))for(n in 1:k){cnew[n,] = apply(dat[groups == n,], 2, mean)}# 终止条件condition = c()for(n in 1:k){condition[n] = sqrt(sum((cnew[n,] - c[n,])^2)) < err}for(n in 1:k){c[n,] = cnew[n,]}save = c(save,list(c))count = count + 1 if( !(F %in% condition) ) break}result = list(groups,c)names(result) = c("Groups","Cluster_centers")return(c(result,list(save,count)))
}

(2) 

dat = iris[,1:2] # 数据
k = 3 # 分几类# 引用函数
re = my_kmeans(iris[,1:2], 3, 1e-10)# 提前设置好颜色
## install.packages("RColorBrewer")
library(RColorBrewer)
display.brewer.pal(12,"Paired")
co = brewer.pal(12,"Paired") # 配置的颜色数目不能超过k# 动图展示聚类中心的变化过程
## install.packages("animation")
library(animation)
saveGIF({for(i in c( 0:re[[4]], rep(re[[4]],5) )){  # rep这里是为了让最终的聚类中心停留更长时间# 底图部分plot(x=iris[,1], y=iris[,2], col=re$Groups,xlab='花萼长度', ylab='花萼宽度', asp=1, type="n",main="每次迭代中心点的变化")for(j in 1:k){points(dat[re$Groups == j,][,1:2],col=co[j])}# 变化部分points(re[[3]][[i+1]][,1:2],pch=22,cex=2,col=co[1:k],bg=co[1:k])# 增加部分if(i == re[[4]]){text(7.2,4.5,labels = "聚类中心", cex=1.5)}}}, interval=0.5, ani.width=400, ani.height=400, movie.name="娜可露露.gif"
)

结果展示:

这篇关于【作业】{r} :自编实现K-Means聚类算法的函数,且画出每一次迭代中每组中心点的变动情况的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/616020

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

作业提交过程之HDFSMapReduce

作业提交全过程详解 (1)作业提交 第1步:Client调用job.waitForCompletion方法,向整个集群提交MapReduce作业。 第2步:Client向RM申请一个作业id。 第3步:RM给Client返回该job资源的提交路径和作业id。 第4步:Client提交jar包、切片信息和配置文件到指定的资源提交路径。 第5步:Client提交完资源后,向RM申请运行MrAp

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

康拓展开(hash算法中会用到)

康拓展开是一个全排列到一个自然数的双射(也就是某个全排列与某个自然数一一对应) 公式: X=a[n]*(n-1)!+a[n-1]*(n-2)!+...+a[i]*(i-1)!+...+a[1]*0! 其中,a[i]为整数,并且0<=a[i]<i,1<=i<=n。(a[i]在不同应用中的含义不同); 典型应用: 计算当前排列在所有由小到大全排列中的顺序,也就是说求当前排列是第

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

hdu1171(母函数或多重背包)

题意:把物品分成两份,使得价值最接近 可以用背包,或者是母函数来解,母函数(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v) 其中指数为价值,每一项的数目为(该物品数+1)个 代码如下: #include<iostream>#include<algorithm>

【数据结构】——原来排序算法搞懂这些就行,轻松拿捏

前言:快速排序的实现最重要的是找基准值,下面让我们来了解如何实现找基准值 基准值的注释:在快排的过程中,每一次我们要取一个元素作为枢纽值,以这个数字来将序列划分为两部分。 在此我们采用三数取中法,也就是取左端、中间、右端三个数,然后进行排序,将中间数作为枢纽值。 快速排序实现主框架: //快速排序 void QuickSort(int* arr, int left, int rig

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi