【小白学机器学习3】关于最简单的线性回归，和用最小二次法评估线性回归效果, 最速下降法求函数的最小值

2024-01-23 15:04

文章标签 简单学习机器最小效果评估回归线性下降最小值二次最速小白学求函数

本文主要是介绍【小白学机器学习3】关于最简单的线性回归，和用最小二次法评估线性回归效果, 最速下降法求函数的最小值，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

目录

1 什么是回归分析

1.1 什么是线性回归

1.2非线性回归

2 数据和判断方法

2.1 原始数据

2.2 判断方法：最小二乘法

3 关于线性回归的实测

3.1 用直线模拟

3.2 怎么判断哪个线性模拟拟合更好呢？

3.2.1 判断标准

3.2.2 最小二乘法

3.2.3 高维度数据

3.3 用python来算下?（暂缺，用plot画图?）

4 关于误差和 E(θ)=1/2*(f(xi)-yi)^2 这个函数本身

4.0 注意新手错误

4.1 E(θ)这个函数本身

4.2 E(θ) 是否有最小值？

4.3 但是如何获得这个最小值呢？

4.3.1 方法1，直接求导数

4.3.2 如果找到E(θ)的最小值，就能找到对应的参数

5 用最速下降方法找到一个函数的最小值

5.1 最速下降法

5.2 假设 f(x) 如下，且从图像上看是有最小值的

5.3 最速下降方法的详细计算过程

5.3.0 最速下降方法公式

5.3.2 先分析函数f(x) 和其导函数 f(x)'

5.3.3 最速下降方法的迭代过程

5.3.4 可以看到2个结论

1 什么是回归分析

从时序数据来看，从过去数据去分析，生成1个模拟曲线。
然后用这个模拟曲线去，用新的 x 去预测新的数据

1.1 什么是线性回归

线性，就是指直线
从线性代数的角度来看，就是这些向量是否线性相关，如果线性无关就是共线。
线性回归，就是回归分析的模拟曲线是直线

1.2非线性回归

如果用曲线模拟，也就是用非一次函数/非直线去模拟
这样就是非线性回归了把
等会儿试试

2 数据和判断方法

2.1 原始数据

构造的原始数据
故意构造了一个类二维曲线数据，这样用直线去模拟就一定有较大的误差
ROUND(0.5*C10^1.8+0.5*C10+2,0)

2.2 判断方法：最小二乘法

均方误差 MSE=1/n*(f(xi)-yi)^2
误差和：E(θ)1/2*(f(xi)-yi)^2 ,类似MSE

3 关于线性回归的实测

3.1 用直线模拟

做了3个线性模拟

f(x)=1+2x
f(x)=1+3x
f(x)=1+2.8x

3.2 怎么判断哪个线性模拟拟合更好呢？

3.2.1 判断标准

E(θ)=1/2*(f(xi)-yi)^2
判断标准就是用 E(θ),哪个E(θ)更小，哪个的拟合效果更好。
配合图形上曲线的对比，也可以看到这个结论

3.2.2 最小二乘法

用E(θ)的大小可以判断不同的拟合曲线的优劣
理论上E(θ)趋近于0，就可以找出拟合最好的曲线

3.2.3 高维度数据

实际上即使不是二维数据，不能用图形化的形式直观的看到。

仍然还是可以用E(θ)=1/2*(f(xi)-yi)^2来判断，比较，模拟曲线的拟合程度

上帝视角的 y=ROUND(0.5*C10^1.8+0.5*C10+2,0)
f(x)=1+2x ， E(θ)=352
f(x)=1+3x， E(θ)=60.5
f(x)=1+2.8x，E(θ)=48.4
从图形看，f(x)=1+2.8x , E(θ)=48.4 ,这个直线模拟的效果也确实相对更好

3.3 用python来算下?（暂缺，用plot画图?）

4 关于误差和 E(θ)=1/2*(f(xi)-yi)^2 这个函数本身

4.0 注意新手错误

要分析得是 E(θ) 是否有最小值，从而找到误差最小得模拟曲线--以及模拟曲线的参数。
而不是分析f(x) 这个模拟函数是否有最小值！！

4.1 E(θ)这个函数本身

一般来说是多元函数曲线
这样很可能就有最小值

4.2 E(θ) 是否有最小值？

首先说明
如果E(θ)=1/2*(f(xi)-yi)^2 这个函数本身是直线，哪是无法找到最小值的
如果E(θ)是一个开头向下，向上凹的曲线，也是没有最小值的
只有E(θ)是一个开头向上，向下凹的曲线，即使有多个波段，也应该是有最小值的

例子：如果E(θ)=1/2*(f(xi)-yi)^2 这个函数本身是直线，哪是无法找到最小值的

4.3 但是如何获得这个最小值呢？

方法1，直接求导数
方法2，用最速下降法来逐步达到最小值

4.3.1 方法1，直接求导数

知道函数形式后，求导函数
但是后面的函数可能很复杂，导函数不好求

4.3.2 如果找到E(θ)的最小值，就能找到对应的参数

后面说明怎么求这样E(θ)函数的最小值
只有E(θ)是一个开头向上，向下凹的曲线，即使有多个波段，也应该是有最小值的

求E(θ)的最小值的目的，就是为了判断这个模拟曲线的拟合程度最好
而前提是，曲线足够通用，
比如 E(θ)=θ0+θ1x+θ2x^2+....
函数是通用形式，哪剩下的就是去用求E(θ)的最小值得过程，去找到合适得参数(θ0,θ1,θ2...)

5 用最速下降方法找到一个函数的最小值

5.1 最速下降法

最速下降方法：x=x-rate*f(x)'
用学习率找到 f(x)取最小值时的x
学习率一般要取小点，比如0.1，0.01 等等

学习率太大可能无法收敛
学习率太小收敛速度会慢

5.2 假设 f(x) 如下，且从图像上看是有最小值的

5.3 最速下降方法的详细计算过程

5.3.0 最速下降方法公式

最速下降方法：x=x-rate*f(x)'
用学习率找到 f(x)取最小值时的x

5.3.2 先分析函数f(x) 和其导函数 f(x)'

x=1时取最小值
函数 f(x)=x^2-2x+1
导函数 f(x)'=2x-2 （那么x=1时，f(x)'=0就是f(x)取到最小值）

5.3.3 最速下降方法的迭代过程(不断迭代取新的x)

比如取 x=0为初始，rate=0.1
第1轮：new x= x-rate*f(x)' =0-0.1*(2*0-2)=0-0.1*(-2)=0.2，新增了0.2
第2轮：new x= x-rate*f(x)' =0.2-0.1*(2*0.2-2)=0.2-0.1*(-1.6)=0.2+0.16=0.36，新增了0.16
第2轮：new x= x-rate*f(x)' =0.36-0.1*(2*0.36-2)=0.36-0.1*(-1.28)=0.36+0.128=0.488，新增了0.128

5.3.4 可以看到几个结论

1）通过x=x-rate*f(x)' 公式迭代算出来的新的x, 每次增加的幅度再减小：0.2→0.16→0.128
2）只有增加值逐渐减小，这样计算多次后，x会收敛。
3）收敛在x=1与x的初始值无关，
可以看到无论x的初始值取多少，比如初始x=0 或者x=5，经过这个算法，计算20次后，都趋近了x=1这个值。
4）EXCEL里计算的数列是符合的，x=0时，这1行新x数据0.2 0.36 0.488 0.5904 0.67232 0.737856

5.3.5如果学习率rate=1 取值过大，导致永远无法收敛。见下图

这篇关于【小白学机器学习3】关于最简单的线性回归，和用最小二次法评估线性回归效果, 最速下降法求函数的最小值的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/636714。 23002807@qq.com

相关文章

使用Python开发一个简单的本地图片服务器

使用Python开发一个简单的本地图片服务器

《使用Python开发一个简单的本地图片服务器》本文介绍了如何结合wxPython构建的图形用户界面GUI和Python内建的Web服务器功能,在本地网络中搭建一个私人的,即开即用的网页相册,文中的示... 目录项目目标核心技术栈代码深度解析完整代码工作流程主要功能与优势潜在改进与思考运行结果总结你是否曾经

阅读更多...

Mysql表的简单操作(基本技能)

Mysql表的简单操作(基本技能)

《Mysql表的简单操作(基本技能)》在数据库中,表的操作主要包括表的创建、查看、修改、删除等,了解如何操作这些表是数据库管理和开发的基本技能,本文给大家介绍Mysql表的简单操作,感兴趣的朋友一起看... 目录3.1 创建表 3.2 查看表结构3.3 修改表3.4 实践案例：修改表在数据库中，表的操作主要

阅读更多...

springboot简单集成Security配置的教程

springboot简单集成Security配置的教程

《springboot简单集成Security配置的教程》：本文主要介绍springboot简单集成Security配置的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录集成Security安全框架引入依赖编写配置类WebSecurityConfig（自定义资源权限规则

阅读更多...

如何使用Python实现一个简单的window任务管理器

如何使用Python实现一个简单的window任务管理器

《如何使用Python实现一个简单的window任务管理器》这篇文章主要为大家详细介绍了如何使用Python实现一个简单的window任务管理器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起... 任务管理器效果图完整代码import tkinter as tkfrom tkinter i

阅读更多...

C++中函数模板与类模板的简单使用及区别介绍

C++中函数模板与类模板的简单使用及区别介绍

《C++中函数模板与类模板的简单使用及区别介绍》这篇文章介绍了C++中的模板机制,包括函数模板和类模板的概念、语法和实际应用,函数模板通过类型参数实现泛型操作,而类模板允许创建可处理多种数据类型的类,... 目录一、函数模板定义语法真实示例二、类模板三、关键区别四、注意事项 ‌在C++中，模板是实现泛型编程

阅读更多...

使用EasyExcel实现简单的Excel表格解析操作

使用EasyExcel实现简单的Excel表格解析操作

《使用EasyExcel实现简单的Excel表格解析操作》：本文主要介绍如何使用EasyExcel完成简单的表格解析操作,同时实现了大量数据情况下数据的分次批量入库,并记录每条数据入库的状态,感兴... 目录前言固定模板及表数据格式的解析实现Excel模板内容对应的实体类实现AnalysisEventLis

阅读更多...

Java进阶学习之如何开启远程调式

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,：本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

阅读更多...

Java中数组转换为列表的两种实现方式(超简单)

Java中数组转换为列表的两种实现方式(超简单)

《Java中数组转换为列表的两种实现方式(超简单)》本文介绍了在Java中将数组转换为列表的两种常见方法使用Arrays.asList和Java8的StreamAPI,Arrays.asList方法简... 目录1. 使用Java Collections框架（Arrays.asList）1.1 示例代码1.

阅读更多...

Java8需要知道的4个函数式接口简单教程

Java8需要知道的4个函数式接口简单教程

《Java8需要知道的4个函数式接口简单教程》：本文主要介绍Java8中引入的函数式接口,包括Consumer、Supplier、Predicate和Function,以及它们的用法和特点,文中... 目录什么是函数是接口？Consumer接口定义核心特点注意事项常见用法1.基本用法2.结合andThen链

阅读更多...

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

《Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)》文章介绍了如何使用dhtmlx-gantt组件来实现公司的甘特图需求,并提供了一个简单的Vue组件示例,文章还分享了一... 目录一、首先 npm 安装插件二、创建一个vue组件三、业务页面内引用自定义组件：四、dhtmlx

阅读更多...