偏最小二乘模板

2024-06-15 13:48
文章标签 模板 最小 二乘

本文主要是介绍偏最小二乘模板,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

考虑到在分析酿酒葡萄理化指标与葡萄酒的理化指标之间联系时,理化指标的个数过多,并且各成分之间可能存在相互依赖的关系,比如各类氨基酸等,所以要想找出酿制前后成分的联系,可以采用偏最小二乘回归分析的方法,下面对该方法进行简要介绍。

偏最小二乘回归分析法集中了主成分分析、典型相关分析和线性回归分析方法的特点,主要研究两组多重相关变量间的相互依赖关系,并可以研究用一组变量去预测另一组变量,特别是当两组变量的个数很多,且都存在多重相关性而观测数据的数量较少时,用该方法建立的具有传统的经典回归分析等方法所没有的优点。

对于个因变量个自变量的建模问题,最小偏二乘回归的基本做法是首先在自变量集中提出第一成分的线性组合,且尽可能多地提取原自变量集中的变异信息);同时在因变量集中也提取第一成分,并要求相关程度达到最大。然后建立因变量的回归,如果回归方程已达到满意的精度,则算法终止。否则继续第二对成分的提取,直至能达到满意的精度为止。若最终对自变量集提取个成分,偏最小二乘回归将通过建立的回归式,然后再将表示为原自变量的回归方程式,即偏最小二乘法回归方程式。

 

 

 

数据标准化

将各指标值转换成标准化指标,有

其中,。对应地,称

为标准化指标变量。

 

求解框图

 

 

 

 

 

 

 

 

 

 

案列分析:

 

 

191 36 50 5 162 60

189 37 52 2 110 60

193 38 58 12 101 101

162 35 62 12 105 37

189 35 46 13 155 58

182 36 56 4 101 42

211 38 56 8 101 38

167 34 60 6 125 40

176 31 74 15 200 40

154 33 56 17 251 250

169 34 50 17 120 38

166 33 52 13 210 115

154 34 64 14 215 105

247 46 50 1 50 50

193 36 46 6 70 31

202 37 62 12 210 120

 

 

 

clc,clear

load pz.txt %原始数据存放在纯文本文件pz.txt中

mu=mean(pz);sig=std(pz); %求均值和标准差

rr=corrcoef(pz); %求相关系数矩阵

data=zscore(pz); %数据标准化

%只要更改这里确定自变量和因变量即可

n=3;m=3; %n是自变量的个数,m是因变量的个数

x0=pz(:,1:n);y0=pz(:,n+1:end);

e0=data(:,1:n);f0=data(:,n+1:end);

num=size(e0,1);%求样本点的个数

chg=eye(n); %w到w*变换矩阵的初始化

for i=1:n

%以下计算w,w*和t的得分向量,

matrix=e0'*f0*f0'*e0;

[vec,val]=eig(matrix); %求特征值和特征向量

val=diag(val); %提出对角线元素

[val,ind]=sort(val,'descend');

w(:,i)=vec(:,ind(1)); %提出最大特征值对应的特征向量

w_star(:,i)=chg*w(:,i); %计算w*的取值

t(:,i)=e0*w(:,i); %计算成分ti的得分

alpha=e0'*t(:,i)/(t(:,i)'*t(:,i)); %计算alpha_i

chg=chg*(eye(n)-w(:,i)*alpha'); %计算w到w*的变换矩阵

e=e0-t(:,i)*alpha'; %计算残差矩阵

e0=e;

%以下计算ss(i)的值

beta=[t(:,1:i),ones(num,1)]\f0; %求回归方程的系数

beta(end,:)=[]; %删除回归分析的常数项

cancha=f0-t(:,1:i)*beta; %求残差矩阵

ss(i)=sum(sum(cancha.^2)); %求误差平方和

%以下计算press(i)

for j=1:num

t1=t(:,1:i);f1=f0;

she_t=t1(j,:);she_f=f1(j,:); %把舍去的第j个样本点保存起来

t1(j,:)=[];f1(j,:)=[]; %删除第j个观测值

beta1=[t1,ones(num-1,1)]\f1; %求回归分析的系数

beta1(end,:)=[]; %删除回归分析的常数项

cancha=she_f-she_t*beta1; %求残差向量

press_i(j)=sum(cancha.^2);

end

press(i)=sum(press_i);

if i>1

Q_h2(i)=1-press(i)/ss(i-1);

else

Q_h2(1)=1;

end

if Q_h2(i)<0.0975

fprintf('提出的成分个数r=%d',i);

r=i;

break

end

end

beta_z=[t(:,1:r),ones(num,1)]\f0; %求Y关于t的回归系数

beta_z(end,:)=[]; %删除常数项

xishu=w_star(:,1:r)*beta_z; %求Y关于X的回归系数,且是针对标准数据的回归系

%数,每一列是一个回归方程

mu_x=mu(1:n);mu_y=mu(n+1:end);

sig_x=sig(1:n);sig_y=sig(n+1:end);

for i=1:m

ch0(i)=mu_y(i)-mu_x./sig_x*sig_y(i)*xishu(:,i); %计算原始数据的回归方程的常数项

end

for i=1:m

xish(:,i)=xishu(:,i)./sig_x'*sig_y(i); %计算原始数据的回归方程的系数,每一列是一个回归方程

end

sol=[ch0;xish] %显示回归方程的系数,每一列是一个方程,每一列的第一个数是常数项

这篇关于偏最小二乘模板的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1063632

相关文章

IDEA自动生成注释模板的配置教程

《IDEA自动生成注释模板的配置教程》本文介绍了如何在IntelliJIDEA中配置类和方法的注释模板,包括自动生成项目名称、包名、日期和时间等内容,以及如何定制参数和返回值的注释格式,需要的朋友可以... 目录项目场景配置方法类注释模板定义类开头的注释步骤类注释效果方法注释模板定义方法开头的注释步骤方法注

C++中函数模板与类模板的简单使用及区别介绍

《C++中函数模板与类模板的简单使用及区别介绍》这篇文章介绍了C++中的模板机制,包括函数模板和类模板的概念、语法和实际应用,函数模板通过类型参数实现泛型操作,而类模板允许创建可处理多种数据类型的类,... 目录一、函数模板定义语法真实示例二、类模板三、关键区别四、注意事项 ‌在C++中,模板是实现泛型编程

基于Java实现模板填充Word

《基于Java实现模板填充Word》这篇文章主要为大家详细介绍了如何用Java实现按产品经理提供的Word模板填充数据,并以word或pdf形式导出,有需要的小伙伴可以参考一下... Java实现按模板填充wor编程d本文讲解的需求是:我们需要把数据库中的某些数据按照 产品经理提供的 word模板,把数据

poj3468(线段树成段更新模板题)

题意:包括两个操作:1、将[a.b]上的数字加上v;2、查询区间[a,b]上的和 下面的介绍是下解题思路: 首先介绍  lazy-tag思想:用一个变量记录每一个线段树节点的变化值,当这部分线段的一致性被破坏我们就将这个变化值传递给子区间,大大增加了线段树的效率。 比如现在需要对[a,b]区间值进行加c操作,那么就从根节点[1,n]开始调用update函数进行操作,如果刚好执行到一个子节点,

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

poj 1734 (floyd求最小环并打印路径)

题意: 求图中的一个最小环,并打印路径。 解析: ans 保存最小环长度。 一直wa,最后终于找到原因,inf开太大爆掉了。。。 虽然0x3f3f3f3f用memset好用,但是还是有局限性。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#incl

hdu 1102 uva 10397(最小生成树prim)

hdu 1102: 题意: 给一个邻接矩阵,给一些村庄间已经修的路,问最小生成树。 解析: 把已经修的路的权值改为0,套个prim()。 注意prim 最外层循坏为n-1。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstri