MIT18.06课程笔记16:最小二乘法,线性回归

2023-12-15 23:32

本文主要是介绍MIT18.06课程笔记16:最小二乘法,线性回归,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

课程简介

18.06是Gilbert Strang教授在MIT开的线性代数公开课,课程视频以及相关资料请见https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/index.htm。
自己思考的部分使用斜体表示

课程笔记

关于投射矩阵的内容请参考MIT18.06课程笔记15:Projection Matrix投射矩阵。此部分是投射矩阵的具体应用。

1. 线性回归问题简介

简单叙述:给定一系列的数据点(例如{ (x1,y1),(x2,y2)... },其中x表示特征向量,y表示目标值),求取一个线性函数(例如一维直线就是 y=cx+d )拟合数据点,即使得函数值的误差的平方和最小。
具体到一维情况就是最小二乘法:
数据集是{ (x1,y1),(x2,y2)...(xm,ym) }。
线性函数为 y=cx+d
argminc,d((cx1+dy1)2+(cx2+dy2)2+...+(cxm+dym)2)

2. 换个角度看问题

最后需要最小化的目标函数其实是误差的平方和,此目标等效于最小化误差的距离(平方和开方)。
具体地设

e=[e1,e2,...,em]Tei=cxi+dyi,0<im

则目标函数为 argminc,d(eTe) ,等价于 argminc,d||e||
进一步,如果设
A=x1x2...xm121,b=y1y2...ym

则有
e=A[cd]b

目标则为
argminc,d||A[cd]b||

上诉公式都是非常直观的,就不多做介绍。
经过上诉转换之后,就可以把投射矩阵应用进来了。具体的,最小化 ||e|| ,其实就是要找到 b̂ C(A) ,使得 ||b̂ b|| 最小。(C(A)是A的column space,具体定义请见 MIT18.06课程笔记15:Projection Matrix投射矩阵)。而且这里的问题更简单,就只需要求 x=[c,d]T 即可(不需要求取投射后的向量 b̂  了)。
使用投射矩阵中的公式
[c,d]T=x=(ATA)1Ab

3. ATA 的可逆性

我自己的思考:
1. 对于任意矩阵 A,B ,有 range(AB)range(A) , range(AB)range(B) 。因为新生成的矩阵的每一列都在A的column space里面(例如 AB 的第一列就是A与B的第一列相乘的结果。同样因为 (AB)T=BTAT ,所以新生成矩阵的每一行都在 BT 的column space里面。
2. range(AB) 可以小于 min{range(A),range(B)} 。例如A的column不是线性无关的,那么可以通过两种不同的方式生成同一个向量。那么有 range(B)=2 , range(A)>2 , 而 range(AB)=1

3.1. 命题

A 是column independent的 ⇒ ATA是可逆的。

3.2. 反证法

ATA 是不可逆的 <=> x0,ATAx=0
两边同时乘以 xT ,则有
x0,xTATAx=(Ax)T(Ax)=0 ,
进而 x0,Ax=0 。而已知A是column independent的,所以不存在x使得 Ax=0 。从而假设不成立。
从几何的角度也知假设不成立, Ax 位于A的column space内,而 ATAx=0 则是再说 Ax AT 的null space里面。具体地,就是说几个线性无关基向量的线性组合要和每个基向量都垂直。而满足这种情况的只有 Ax=0

4. 线性代数求导的角度

对于2中转换为矩阵相乘的问题表述形式,可以通过对其求导求解。两个方法角度不同,结果相同。
具体地,目标是

argminc,deTe=argminc,d(Axb)T(Axb)error=(Axb)T(Axb)

error x 求导,可得AT2(Axb)=0, 进而 x=(ATA)1Ab

这篇关于MIT18.06课程笔记16:最小二乘法,线性回归的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/498305

相关文章

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D

poj 1734 (floyd求最小环并打印路径)

题意: 求图中的一个最小环,并打印路径。 解析: ans 保存最小环长度。 一直wa,最后终于找到原因,inf开太大爆掉了。。。 虽然0x3f3f3f3f用memset好用,但是还是有局限性。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#incl

hdu 1102 uva 10397(最小生成树prim)

hdu 1102: 题意: 给一个邻接矩阵,给一些村庄间已经修的路,问最小生成树。 解析: 把已经修的路的权值改为0,套个prim()。 注意prim 最外层循坏为n-1。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstri

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

poj 2175 最小费用最大流TLE

题意: 一条街上有n个大楼,坐标为xi,yi,bi个人在里面工作。 然后防空洞的坐标为pj,qj,可以容纳cj个人。 从大楼i中的人到防空洞j去避难所需的时间为 abs(xi - pi) + (yi - qi) + 1。 现在设计了一个避难计划,指定从大楼i到防空洞j避难的人数 eij。 判断如果按照原计划进行,所有人避难所用的时间总和是不是最小的。 若是,输出“OPETIMAL",若

poj 2135 有流量限制的最小费用最大流

题意: 农场里有n块地,其中约翰的家在1号地,二n号地有个很大的仓库。 农场有M条道路(双向),道路i连接着ai号地和bi号地,长度为ci。 约翰希望按照从家里出发,经过若干块地后到达仓库,然后再返回家中的顺序带朋友参观。 如果要求往返不能经过同一条路两次,求参观路线总长度的最小值。 解析: 如果只考虑去或者回的情况,问题只不过是无向图中两点之间的最短路问题。 但是现在要去要回

poj 3422 有流量限制的最小费用流 反用求最大 + 拆点

题意: 给一个n*n(50 * 50) 的数字迷宫,从左上点开始走,走到右下点。 每次只能往右移一格,或者往下移一格。 每个格子,第一次到达时可以获得格子对应的数字作为奖励,再次到达则没有奖励。 问走k次这个迷宫,最大能获得多少奖励。 解析: 拆点,拿样例来说明: 3 2 1 2 3 0 2 1 1 4 2 3*3的数字迷宫,走两次最大能获得多少奖励。 将每个点拆成两个