模糊C均值聚类(FCM)python

2023-11-02 04:36
文章标签 python 模糊 聚类 均值 fcm

本文主要是介绍模糊C均值聚类(FCM)python,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、模糊C均值聚类的原理 

二、不使用skfuzzy的python代码

三、 使用skfuzzy的python代码


一、模糊C均值聚类的原理 

 

二、不使用skfuzzy的python代码

import numpy as np
import random
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False'''初始化隶属矩阵'''
def initial_u0(n,K):''':param n:样本数量:param K:簇的数量:return: 初始化的隶属矩阵'''u0=np.zeros((K,n))for i in range(K):for j in range(n):if i==0:u0[i][j]=random.uniform(0,1)elif i<K-1:s=0for k in range(i):s=s+u0[k][j]u0[i][j]=random.uniform(0,1-s)else:s=0for k in range(i):s=s+u0[k][j]u0[i][j]=1-sreturn u0'''聚类函数'''
def Cluster(U,n):''':param U:隶属度矩阵:param n: 样本数量:return: 聚类结果'''cluster=[]for i in range(n):A=U.T[i].tolist()a=A.index(max(A))cluster.append(int(a))return cluster'''计算隶属中心矩阵'''
def center(data,U,m,n,K,dim):''':param data:样本数据:param U: 隶属度矩阵:param m: 模糊加权参数,一般取2:param n: 样本数量:param K: 聚类数目:param dim: 维度:return: 隶属中心矩阵''''''进行初始聚类'''cluster=Cluster(U,n)'''初始化隶属中心矩阵'''Z=np.zeros((K,dim))'''计算隶属中心矩阵'''#初始化u_x=[np.zeros((1,dim)) for i in range(K)]u=[0 for i in range(K)]#计算for i in range(n):c=cluster[i]  #类别u[c]=u[c]+(U[c][i])**mu_x[c]=u_x[c]+((U[c][i])**m)*data[i]for i in range(K):Z[i]=u_x[i]/u[i]'''返回隶属中心矩阵'''return Z'''基于欧氏距离计算各点到聚类中心的距离矩阵'''
def distinct(data,n,dim,Z,K):''':param data:样本数据:param n: 样本数量:param dim: 数据维度:param Z: 隶属中心矩阵:param K: 聚类数目:return: 基于欧氏距离的距离矩阵''''''初始化距离矩阵'''D=np.zeros((K,n))'''计算欧式距离'''for i in range(K):for j in range(n):z=Z[i]   #隶属中心df=data[j]  #数据点df_z=df-zd=0for k in range(dim):d=d+(df_z[k])**2d=np.sqrt(d)D[i][j]=d'''返回距离矩阵'''return D'''定义目标函数并返回目标函数值'''
def function(data,Z,n,dim,K,U,m,D):''':param data:样本数据:param Z: 隶属中心矩阵:param n: 样本数量:param dim: 数据维度:param K: 聚类数目:param U: 隶属度矩阵:param m: 模糊加权参数:param D: 距离矩阵:return: 目标函数值''''''初始化聚类'''cluster=Cluster(U,n)'''计算目标函数值'''J=0    #目标函数值W=[0 for i in range(K)]for i in range(n):c=cluster[i]  #聚类类别df=data[i]    #数据点z=Z[c]        #聚类中心d=D[c][i]     #数据点到聚类中心的距离u=U[c][i]     #隶属度W[c]=W[c]+(u**m)*(d**2)J=sum(W)'''返回目标函数值'''return J'''更新隶属度矩阵'''
def update_U(data,Z,n,dim,K,D,m):''':param data:样本数据:param Z: 隶属中心矩阵:param n: 样本数量:param dim: 数据维度:param K: 聚类数目:param D: 距离矩阵:param m: 模糊加权参数:return: 更新后的隶属度矩阵''''''初始化隶属度矩阵'''U=np.zeros((K,n))'''更新隶属度矩阵'''for i in range(K):for j in range(n):r=0for k in range(K):r=r+(D[i][j]/D[k][j])**(2/(m-1))U[i][j]=1/r'''返回更新后的隶属度矩阵'''return U'''模糊C均值聚类函数'''
def FCM(data,K,Tmax,m,error):''':param data:样本数据:param K: 聚类数目:param Tmax: 最大迭代步数:param m: 模糊加权参数:param error: 迭代停止阈值,一般取0.001至0.01:return: 聚类结果''''''样本数量'''n=data.shape[0]'''数据维度'''dim=data.shape[1]'''初始化隶属度矩阵'''U0=initial_u0(n,K)U=U0.copy()'''存储目标函数值'''J=[]'''循环'''for i in range(Tmax):#计算隶属中心矩阵Z=center(data,U,m,n,K,dim)#基于欧氏距离计算各点到聚类中心的距离矩阵D=distinct(data,n,dim,Z,K)#计算目标函数的值J.append(function(data,Z,n,dim,K,U,m,D))#更新隶属度矩阵U=update_U(data,Z,n,dim,K,D,m)#判断阈值if i!=0 and abs(J[i-1]-J[i])<=error:break'''得到聚类结果'''cluster=Cluster(U,n)'''返回聚类结果(聚类类别,聚类中心,目标函数值)'''return cluster,Z,J[-1]'''主函数'''
if __name__=="__main__":'''随机产生400组在区间[0,1]上的二维数据'''data=np.array([[random.uniform(0, 1) for i in range(2)] for j in range(400)])'''聚类'''cluster,cntr,J=FCM(data,K=4,Tmax=1000,m=2,error=0.0001)print("聚类结果:\n{}".format(cluster))print("目标函数值:\n{}".format(J))#将数据分类fdata=data.tolist()X1=[]Y1=[]X2=[]Y2=[]X3=[]Y3=[]X4=[]Y4=[]for i in range(400):if cluster[i]==0:X1.append(fdata[i][0])Y1.append(fdata[i][1])if cluster[i]==1:X2.append(fdata[i][0])Y2.append(fdata[i][1])if cluster[i]==2:X3.append(fdata[i][0])Y3.append(fdata[i][1])if cluster[i]==3:X4.append(fdata[i][0])Y4.append(fdata[i][1])# 聚类图plt.scatter(X1, Y1, c='red', marker='o')plt.scatter([cntr[0][0]], [cntr[0][1]], marker='>', c="black", label='聚类中心1')plt.scatter(X2, Y2, c='blue', marker="o")plt.scatter([cntr[1][0]], [cntr[1][1]], marker='<', c="black", label="聚类中心2")plt.scatter(X3, Y3, c='green', marker="o")plt.scatter([cntr[2][0]], [cntr[2][1]], marker='^', c="black", label="聚类中心3")plt.scatter(X4, Y4, c='orange', marker="o")plt.scatter([cntr[3][0]], [cntr[3][1]], marker="D", c="black", label="聚类中心4")plt.legend()plt.xlabel("x")plt.ylabel("y")plt.title("聚类图")plt.show()

三、 使用skfuzzy的python代码

import numpy as np
import random
import skfuzzy as fuzz
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False'''随机产生400组在区间[0,1]上的二维数据'''
data = np.array([[random.uniform(0,1) for i in range(2)] for j in range(400)])'''初始化隶属度矩阵(聚成4类)'''
'''
cntr:聚类中心
u:最后的隶属度矩阵
u0:初始化的隶属度矩阵
d:是一个矩阵,记录每一个点到聚类中心的欧式距离
jm:是目标函数的优化历史
p:p是迭代的次数
fpc:全称是fuzzy partition coefficient, 是一个评价分类好坏的指标,它的范围是0到1, 1表示效果最好,后面可以通过它来选择聚类的个数。
'''
cntr, u, u0, d, jm, p, fpc = fuzz.cluster.cmeans(data.T, 4, 2, error=0.0001, maxiter=1000)'''迭代计算'''
cntr, u, u0, d, jm, p, fpc = fuzz.cluster.cmeans(data.T, 4,2, error=0.0001, maxiter=1000)'''获得聚类结果'''
cluster_membership = np.argmax(u, axis=0)'''绘制聚类结果'''
#将数据分类
fdata=data.tolist()
X1=[]
Y1=[]
X2=[]
Y2=[]
X3=[]
Y3=[]
X4=[]
Y4=[]
for i in range(400):if cluster_membership[i]==0:X1.append(fdata[i][0])Y1.append(fdata[i][1])if cluster_membership[i]==1:X2.append(fdata[i][0])Y2.append(fdata[i][1])if cluster_membership[i]==2:X3.append(fdata[i][0])Y3.append(fdata[i][1])if cluster_membership[i]==3:X4.append(fdata[i][0])Y4.append(fdata[i][1])#聚类图
plt.scatter(X1,Y1,c='red',marker='o')
plt.scatter([cntr[0][0]],[cntr[0][1]],marker='>',c="black",label='聚类中心1')
plt.scatter(X2,Y2,c='blue',marker="o")
plt.scatter([cntr[1][0]],[cntr[1][1]],marker='<',c="black",label="聚类中心2")
plt.scatter(X3,Y3,c='green',marker="o")
plt.scatter([cntr[2][0]],[cntr[2][1]],marker='^',c="black",label="聚类中心3")
plt.scatter(X4,Y4,c='orange',marker="o")
plt.scatter([cntr[3][0]],[cntr[3][1]],marker="D",c="black",label="聚类中心4")
plt.legend()
plt.xlabel("x")
plt.ylabel("y")
plt.title("聚类图")
plt.show()print(cluster_membership)
'''
print("cntr:\n{}".format(cntr))
print("u:\n{}".format(u))
print("u0:\n{}".format(u0))
print("d:\n{}".format(d))
print("jm:\n{}".format(jm))
print("p:\n{}".format(p))
print("fpc:\n{}".format(fpc))
'''

这篇关于模糊C均值聚类(FCM)python的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/328150

相关文章

使用Python删除Excel中的行列和单元格示例详解

《使用Python删除Excel中的行列和单元格示例详解》在处理Excel数据时,删除不需要的行、列或单元格是一项常见且必要的操作,本文将使用Python脚本实现对Excel表格的高效自动化处理,感兴... 目录开发环境准备使用 python 删除 Excphpel 表格中的行删除特定行删除空白行删除含指定

Python通用唯一标识符模块uuid使用案例详解

《Python通用唯一标识符模块uuid使用案例详解》Pythonuuid模块用于生成128位全局唯一标识符,支持UUID1-5版本,适用于分布式系统、数据库主键等场景,需注意隐私、碰撞概率及存储优... 目录简介核心功能1. UUID版本2. UUID属性3. 命名空间使用场景1. 生成唯一标识符2. 数

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

Python包管理工具pip的升级指南

《Python包管理工具pip的升级指南》本文全面探讨Python包管理工具pip的升级策略,从基础升级方法到高级技巧,涵盖不同操作系统环境下的最佳实践,我们将深入分析pip的工作原理,介绍多种升级方... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

Python中将嵌套列表扁平化的多种实现方法

《Python中将嵌套列表扁平化的多种实现方法》在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋... 目录python中将嵌套列表扁平化的方法技术背景实现步骤1. 使用嵌套列表推导式2. 使用itert

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核