《机器学习》 基于SVD的矩阵分解 推导、案例实现

2024-09-07 01:20

本文主要是介绍《机器学习》 基于SVD的矩阵分解 推导、案例实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一、SVD奇异值分解

1、什么是SVD

2、SVD的应用

        1)数据降维

        2)推荐算法

        3)自然语言处理

3、核心

        1)什么是酉矩阵

        2)什么是对角矩阵

4、分解过程

二、推导

1、如何求解这三个矩阵

        1)已知: 

        2)根据酉矩阵的特点即可得出:

        3)隐含条件:

        4)计算:

        5)结论

2、实例

        1)求U与V对应的协方差矩阵

        2)求各自协方差矩阵对应的特征值和特征向量

                • 求A^T A对应的特征值和特征向量

                • 求 A A^T 对应的特征值和特征向量

三、代码实现

1、导包

2、代码演示

运行结果为:

代码调试状态:


一、SVD奇异值分解

1、什么是SVD

        SVD就是奇异值分解。在机器学习中,SVD是一种常用的矩阵分解方法,用于将一个矩阵分解为三个矩阵的乘积。具体来说,对于一个m×n的实数矩阵A,SVD将其分解为以下形式:

                A = UΣV^T

        其中,U是一个m×m的正交矩阵Σ是一个m×n的对角矩阵V^T是一个n×n的正交矩阵。Σ的对角线上的元素称为奇异值,表示原始矩阵A在对应的奇异向量方向上的重要程度

2、SVD的应用

        1)数据降维

                可以通过保留最重要的奇异值和对应的奇异向量,将原始数据降维到一个较低维度的表示,以减少数据的冗余和计算复杂度。

        2)推荐算法

                SVD可以分解用户-项目评分矩阵,从而得到用户和项目在一个低维的潜在空间中的表示,进而进行推荐。

        3)自然语言处理

                SVD可以用于词向量的降维和表示,从而实现语义分析任务,如文本分类、情感分析、语义相似度计算,也可以用于对大规模文本数据进行降维和压缩,从而提高文本处理和存储的效率。

3、核心

        对于任意矩阵A,我们总能够将其分解位三个矩阵𝑈 𝛴 𝑉 𝑇 。
其中: \bigcup 为酉矩阵\sum 为对角阵V^{T} 为酉矩阵

        1)什么是酉矩阵

                酉矩阵是线性代数中的一种特殊类型的矩阵。一个n×n的复矩阵U被称为酉矩阵,如果它满足以下条件:

                1、U的共轭转置乘以U的结果等于单位矩阵I:U^H × U = I,其中U^H表示U的共轭转置。

                2、U的逆矩阵等于它的共轭转置:U^(-1) = U^H。

        2)什么是对角矩阵

                对角矩阵(diagonal matrix)是一个主对角线之外的元素皆为0的矩阵

4、分解过程

二、推导

1、如何求解这三个矩阵

        1)已知: 

        2)根据酉矩阵的特点即可得出:

        3)隐含条件:

        4)计算:

        5)结论

                        𝑈:𝐴𝐴^𝑇 的特征向量.
                        𝛴^2:𝐴𝐴^ 𝑇 的特征值.
                        𝑉:𝐴^𝑇 𝐴 的特征向量

2、实例

        1)求U与V对应的协方差矩阵

        2)求各自协方差矩阵对应的特征值和特征向量
                • 求A^T A对应的特征值和特征向量

                • 求 A A^T 对应的特征值和特征向量

三、代码实现

1、导包

pip install pillow

2、代码演示

import numpy as np
from PIL import Image   # 导入PIL库中的Image模块,用于处理图像文件
import matplotlib.pyplot as plt  # 导入绘图库def pic_compress(k,pic_array):   # k表示保留的奇异值数量,pic_array表示输入的图像数组global u,sigma,vt,sig,new_pic  # 定义全局变量u,sigma,vt = np.linalg.svd(pic_array)   # 使用np库中的linalg模块的svd方法,对图像的数值进行奇异值分解,得到三个矩阵U、Σ和V^T,其中U和V是正交矩阵,Σ是一个对角矩阵,对角线上的元素称为奇异值sig = np.eye(k) * sigma[:k]   # 使用np中的函数eye生成一个kxk的单位矩阵,上述生成的sigma为奇异值,现在取前k个值,将其转换成对角矩阵,即对角线上的值为奇异值,其余值为0new_pic = np.dot(np.dot(u[:,:k],sig),vt[:k,:]) # dot用于执行数组乘法size = u.shape[0] * k + sig.shape[0] * sig.shape[1] + k * vt.shape[1]  # 变换后的图像为u矩阵、sigma矩阵和vt矩阵,这里计算图像的大小return new_pic,size  # 返回压缩后的图像数值和尺寸大小img = Image.open('timg.jpg')  # 打开图像
ori_img = np.array(img)   # 将图像转换成numpy数组
new_img ,size = pic_compress(100,ori_img)  # 调用pic_compress函数对图像进行压缩,导入图片数组,100表示保留的前100个奇异值
print('original size:'+ str(ori_img.shape[0]*ori_img.shape[1]))  # 原始图片的大小,shape[0]和[1]分别表示行数和列数
print('compress size:' + str(size))  # 打印压缩后的像素大小fig,ax = plt.subplots(1,2)  # 设置画布有两张图,fig是整个图像的窗口对象,ax是两个图像的数组
ax[0].imshow(ori_img,cmap='gray')  # 展示第一个图形,为原始图像,cmp='gray'表示图像以灰度图展示
ax[0].set_title('before compress')   # 设置第一个图像的标题
ax[1].imshow(new_img,cmap='gray')   # 展示第二个图像,为压缩后的图像
ax[1].set_title("after compress")
plt.show()
运行结果为:

左侧为原始图像,右侧为压缩后图像,他们的大小为:

代码调试状态:

这篇关于《机器学习》 基于SVD的矩阵分解 推导、案例实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1143658

相关文章

Python xmltodict实现简化XML数据处理

《Pythonxmltodict实现简化XML数据处理》Python社区为提供了xmltodict库,它专为简化XML与Python数据结构的转换而设计,本文主要来为大家介绍一下如何使用xmltod... 目录一、引言二、XMLtodict介绍设计理念适用场景三、功能参数与属性1、parse函数2、unpa

C#实现获得某个枚举的所有名称

《C#实现获得某个枚举的所有名称》这篇文章主要为大家详细介绍了C#如何实现获得某个枚举的所有名称,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... C#中获得某个枚举的所有名称using System;using System.Collections.Generic;usi

Go语言实现将中文转化为拼音功能

《Go语言实现将中文转化为拼音功能》这篇文章主要为大家详细介绍了Go语言中如何实现将中文转化为拼音功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 有这么一个需求:新用户入职 创建一系列账号比较麻烦,打算通过接口传入姓名进行初始化。想把姓名转化成拼音。因为有些账号即需要中文也需要英

C# 读写ini文件操作实现

《C#读写ini文件操作实现》本文主要介绍了C#读写ini文件操作实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录一、INI文件结构二、读取INI文件中的数据在C#应用程序中,常将INI文件作为配置文件,用于存储应用程序的

C#实现获取电脑中的端口号和硬件信息

《C#实现获取电脑中的端口号和硬件信息》这篇文章主要为大家详细介绍了C#实现获取电脑中的端口号和硬件信息的相关方法,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 我们经常在使用一个串口软件的时候,发现软件中的端口号并不是普通的COM1,而是带有硬件信息的。那么如果我们使用C#编写软件时候,如

Python使用qrcode库实现生成二维码的操作指南

《Python使用qrcode库实现生成二维码的操作指南》二维码是一种广泛使用的二维条码,因其高效的数据存储能力和易于扫描的特点,广泛应用于支付、身份验证、营销推广等领域,Pythonqrcode库是... 目录一、安装 python qrcode 库二、基本使用方法1. 生成简单二维码2. 生成带 Log

Go语言使用Buffer实现高性能处理字节和字符

《Go语言使用Buffer实现高性能处理字节和字符》在Go中,bytes.Buffer是一个非常高效的类型,用于处理字节数据的读写操作,本文将详细介绍一下如何使用Buffer实现高性能处理字节和... 目录1. bytes.Buffer 的基本用法1.1. 创建和初始化 Buffer1.2. 使用 Writ

基于WinForm+Halcon实现图像缩放与交互功能

《基于WinForm+Halcon实现图像缩放与交互功能》本文主要讲述在WinForm中结合Halcon实现图像缩放、平移及实时显示灰度值等交互功能,包括初始化窗口的不同方式,以及通过特定事件添加相应... 目录前言初始化窗口添加图像缩放功能添加图像平移功能添加实时显示灰度值功能示例代码总结最后前言本文将

Redis延迟队列的实现示例

《Redis延迟队列的实现示例》Redis延迟队列是一种使用Redis实现的消息队列,本文主要介绍了Redis延迟队列的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习... 目录一、什么是 Redis 延迟队列二、实现原理三、Java 代码示例四、注意事项五、使用 Redi

C#实现WinForm控件焦点的获取与失去

《C#实现WinForm控件焦点的获取与失去》在一个数据输入表单中,当用户从一个文本框切换到另一个文本框时,需要准确地判断焦点的转移,以便进行数据验证、提示信息显示等操作,本文将探讨Winform控件... 目录前言获取焦点改变TabIndex属性值调用Focus方法失去焦点总结最后前言在一个数据输入表单