线性代数 --- 最小二乘在直线拟合上的应用与Gram-Schmidt正交化(上)

2023-12-20 16:50

本文主要是介绍线性代数 --- 最小二乘在直线拟合上的应用与Gram-Schmidt正交化(上),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最小二乘在直线拟合上的应用

在前一篇最小二乘的文章中:

线性代数 --- 投影与最小二乘 下(多元方程组的最小二乘解与向量在多维子空间上的投影)_松下J27的博客-CSDN博客多变量方程组的最小二乘,向量到多维子空间上的投影。https://blog.csdn.net/daduzimama/article/details/129559433?spm=1001.2014.3001.5501

我们知道了:1,正规方程, 2,计算最优解的方法,3,计算投影的方法

        在这篇文章中,我会从最小二乘在拟合直线上的应用开始,先是用实例来说明最小二乘的实际应用。紧接着,我会从这个例子出发,循序渐进的引出为什么我们希望A的列向量不仅仅是相互独立的,更希望他们是相互正交的。从而导出,如何令A的列向量彼此正交,这就是著名的Gram-Schmidt正交化。(需要再次重申的是,学习不是为了考试,不是为了背公式,更不需要题海战术,而是“知其(Gram-Schmidt)然,知其(Gram-Schmidt)所以然”)


拟合直线

        拟合直线可以说是最小二乘最好的应用之一。简而言之,就是用m>2个点(也可以说是m个观测点,及其所对应的m个数据)去拟合一条直线。

        对某个实验而言,如果他的实验结果是线性的,且没有任何实验误差,则两次实验的结果就能确定一条符合这一实验规律的直线b=C+Dt,而且后续所有的实验结果都应当落在这条直线上。假定现有m个实验结果,他们在横坐标上的值为t_{1},t_{2},...,t_{m},他们在纵坐标中所对应的值分别是b_{1},b_{2},...,b_{m}。现在我们用方程b_{i}=C+Dt_{i}表示一条穿过这些点的直线,得到如下方程组:

        如果m个实验结果都没有误差,则,上述方程组有解,且有唯一解C,D。但,如果实验结果有误差,则不可能找到一个完美的C,D,让这条直线穿过所有的点。这是一个(overdetermined system)超定方程组,m>2个方程,2个未知数,方程组无解。用矩阵来表示为:

        因实验结果的误差导致方程组无解,因此,我们只能找一条尽可能贴近所有点的直线。对于矩阵A而言,他有两个列向量,方程组无解,所以无法通过线性组合得到等式右端的列向量。在维持A的两个列向量不变的情况下,我们通过新的线性组合\hat{C}\hat{D},在A的列空间中找到了最接近向量b的向量p,即,b在A的列空间C(A)上的投影。

        同时,也最小化了每个点与直线之间的纵向误差e_{i},即,最小化E={e_{1}}^{2}+{e_{2}}^{2}+...+{e_{m}}^{2}。其中,e_{i}=b_{i}-C-Dt_{i}。(但这不是我推崇的思维,应该优先考虑用投影的角度思考!)

方程左右两边同时乘以A^{T},得到“正规方程(Normal Equation)”:

A^{T}A\hat{x}=A^{T}b(或A^{T}A\hat{x}=Pb,其中P为投影矩阵)

其中等式左边A^{T}A等于:

 等式右边A^{T}b等于:

最终得到A^{T}A\hat{x}=A^{T}b


 Example 1:

 如图(a),在一个实验中的不同时刻t1,t2,t3下,得到三组测量值b1,b3,b3,分别是(注意,他们并不是等间隔的):

 对应的方程组为:

        方程组无解,因为这三点不在一条直线上。通过求解最小二乘方程组,联立正规方程A^{T}A\hat{x}=A^{T}b

\large A=\begin{bmatrix} 1 &-1 \\ 1 &1 \\ 1 &2 \end{bmatrix}                \large \hat{x}=\begin{bmatrix} \hat{C}\\ \hat{D} \end{bmatrix}                \large b=\begin{bmatrix} 1\\ 1\\ 3 \end{bmatrix}

左边A^{T}A

\large \mathbf{A^{T}A=\begin{bmatrix} 1 & 1 &1 \\ -1& 1 & 2 \end{bmatrix} \begin{bmatrix} 1 &-1 \\ 1 &1 \\ 1 &2 \end{bmatrix} = \begin{bmatrix} 3 & 2\\ 2 & 6 \end{bmatrix}}

右边A^{T}b

\large A^{T}b=\begin{bmatrix} 1 &1 &1 \\ -1&1 & 2 \end{bmatrix}\begin{bmatrix} 1\\ 1\\ 3 \end{bmatrix} = \begin{bmatrix} 5\\ 6 \end{bmatrix}

得到:

 最终得到最优解为,\hat{C}=9/7,\hat{D}=4/7。 

 \large \hat{x}=(A^{T}A)^{-1}A^{T}b=\begin{bmatrix} 6 &-2 \\ -2& 3 \end{bmatrix} \begin{bmatrix} 5 \\ 6 \end{bmatrix} = \begin{bmatrix} 9/7\\ 4/7 \end{bmatrix}

对应的最佳拟合直线为:

\large f(x)=9/7+4/7t

投影p为:

\large p=A(A^{T}A)^{-1}A^{T}b=A\hat{x}=\begin{bmatrix} 1 & -1\\ 1 & 1\\ 1 & 2 \end{bmatrix}\begin{bmatrix} 9/7\\ 4/7 \end{bmatrix}=\begin{bmatrix} 5/7\\ 13/7\\ 17/7 \end{bmatrix}

        现在我们结合下图(b),从投影的角度来回顾一下这个问题。 向量b无法通过矩阵A的两个列向量[1,1,1]和[-1,1,2]通过线性组合得到,因为,b不在A的列空间内。通过把向量b投影到A的列空间上,在A的列空间上找到了一个离向量b最近的向量p,这个投影向量p可以通过A的两个列向量的线性组合得到,线性组合的权重为 \hat{C}=9/7,\hat{D}=4/7 。

 Attention:

        现在,我们已经得到了最优拟合的直线方程f(t)=9/7+4/7t,我们把t=(-1, 1, 2)时在直线上所对应的点求出来,看看有什么神奇的事发生!

当t=-1时,f(t=-1)=9/7-4/7=5/7,当t=1时,f(t=1)=9/7+4/7=13/7,当t=2时,f(t=2)=9/7+8/7=17/7。然后把这些点绘制到图(a)上,并且把图(a)和图(b)放在一起看。

        接下来我们会看到,这两幅图以不同的艺术形式描述了同一个数学问题, 且, 他们是密切相关的

关联1:投影向量p

        最开始,我们在图(a)中,描绘了三个不在同一直线上的数据点(t1=-1,b1=1),(t2=1,b2=1),(t3=2,b3=3)。然后,我们用投影的方式/求解正规方程的方式求得了最小二乘解\large \hat{x},同时也求出了向量b在A的列空间C(A)上的投影向量p=[5/7, 13/7, 17/7],这些都体现在了图(b)中。最后,我们根据最优拟合直线的函数,算出了t=(t1,t2,t3)时在直线上所对应的数据点(t1=-1,p1=5/7),(t2=1,p2=13/7),(t3=2,p3=17/7),并绘制到图(a)中。

        可见,投影向量p中三个元素的值,正好是拟合直线上t所对应的点。对于图(b)而言,用线性代数的语言说,是把b拉到了子空间C(A)上。对于图(a)而言,通过最小化每个点到最优拟合直线上的距离e1,e2,e3,把本不在同一直线上的三个点b1,b2,b3拉到了同一条直线上。且p1,p2,p3正好等于投影向量p中元素的值。

        换句话说,“把b投影到A的列空间上”和“把三个原始数据点(t1,b1),(t2,b2),(t3,b3)移到了同一条直线上”,这两个概念是等同的。

关联2:误差向量e

向量b减去投影向量p,就能得到误差向量e(他垂直于C(A)):

\large e=b-p=\begin{bmatrix} 1\\ 1\\ 3 \end{bmatrix} - \begin{bmatrix} 5/7\\ 13/7\\ 17/7 \end{bmatrix} = \begin{bmatrix} 2/7\\ -6/7\\ 4/7 \end{bmatrix}

向量e中的每个元素值的含义是什么? 实际上就是图(a)中,每个b与p之间的误差


(全文完)

作者 --- 松下J27

参考文献(鸣谢)

1,线性代数及其应用,侯自新,南开大学出版社,1990.

2,Linear Algebra and Its Applications(Fourth Edition) - Gilbert Strang(文中大部分插图来自于这本书)

3,Introduction to Linear Algebra,Fifth Edition - Gilbert Strang

格言摘抄:

        吾尝终日而思矣,不如须臾之所学也;吾尝跂而望矣,不如登高之博见也。---《劝学》

(配图与本文无关)

版权声明:文中的部分图片,文字或者其他素材,可能来自很多不同的网站和说明,在此没法一一列出,如有侵权,请告知,立即删除。欢迎大家转载,但是,如果有人引用或者COPY我的文章,必须在你的文章中注明你所使用的图片或者文字来自于我的文章,否则,侵权必究。 ----松下J27

这篇关于线性代数 --- 最小二乘在直线拟合上的应用与Gram-Schmidt正交化(上)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/516746

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

poj 1734 (floyd求最小环并打印路径)

题意: 求图中的一个最小环,并打印路径。 解析: ans 保存最小环长度。 一直wa,最后终于找到原因,inf开太大爆掉了。。。 虽然0x3f3f3f3f用memset好用,但是还是有局限性。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#incl