Scikit-Learn支持向量机回归

2024-06-19 04:28

文章标签 支持回归 scikit learn 向量

本文主要是介绍Scikit-Learn支持向量机回归，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Scikit-Learn支持向量机回归

- 1、支持向量机回归
- - 1.1、最大间隔与SVM的分类
  - 1.2、软间隔最大化
  - 1.3、支持向量机回归
  - 1.4、支持向量机回归的优缺点
- 2、Scikit-Learn支持向量机回归
- - 2.1、Scikit-Learn支持向量机回归API
  - 2.2、支持向量机回归初体验
  - 2.3、支持向量机回归实践（加州房价预测）

1、支持向量机回归

支持向量机（Support Vector Machine，SVM）算法既可以用于回归问题（SVR），也可以用于分类问题（SVC）。通常情况下，SVM用于分类问题，但后来也被扩展用于回归问题。SVM（回归）在机器学习知识结构中的位置如下：

1.1、最大间隔与SVM的分类

SVM是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，他的学习策略就是间隔最大化

如图所示，三条直线分别代表三个SVM分类器，请问哪一个分类器比较好？

在这里插入图片描述
凭直观感受答案应该是H3。首先H1不能把类别分开；H2可以，但分割线与最近的数据点只有很小的间隔，如果测试数据有一些噪声的话可能就会被H2错误分类（即对噪声敏感、泛化能力弱）。H3以较大间隔将它们分开，这样就能容忍测试数据的一些噪声，是一个泛化能力不错的分类器

对于支持向量机来说，数据点若是p维向量，我们用p−1维的超平面来分开这些点。但是可能有许多超平面可以把数据分类。最佳超平面的一个合理选择就是以最大间隔把两个类分开的超平面。因此，SVM选择能够使离超平面最近的数据点的到超平面距离最大的超平面

以上介绍的SVM只能解决线性可分的问题，为了解决更加复杂的问题，支持向量机学习方法由简至繁可分为三类：

线性可分SVM

当训练数据线性可分时，通过硬间隔（Hard Margin）最大化学习一个线性的分类器，即线性可分支持向量机（亦称作硬间隔支持向量机）
线性SVM

当训练数据不能线性可分但是可以近似线性可分时，通过软间隔（Soft Margin）最大化学习一个线性的分类器，即线性支持向量机（又称作软间隔支持向量机）
非线性SVM

当训练数据线性不可分时，通过使用核技巧（Kernel Trick）及软间隔最大化可以学习非线性支持向量机，等价于隐式地在高维特征空间中学习线性支持向量机

1.2、软间隔最大化

在实际应用中，完全线性可分（硬间隔）的情况非常少见。例如下面的分类图，我们没有办法找到一条直线，把空间划分为2个区域，因此，要对其进行切分，有以下两种方案：

1）仍然使用直线，不过不追求完全可分，适当包容一些分错的情况（线性SVM）

在这里插入图片描述
在这个过程中，我们会在模型中加入惩罚函数，尽量让分错的点不要太多。对分错点的惩罚函数就是这个点到其正确位置的距离

如上图所示，黄色、蓝色的直线分别为支持向量所在的边界，黑色的线为决策函数，那些绿色的线表示分错的点到其相应的决策面的距离，这样我们可以在原函数上面加上一个惩罚函数，并且带上其限制条件为：

在这里插入图片描述
上式为在线性可分问题的基础上加上的惩罚函数部分，当 $x_i$ 在正确一边的时候， $\varepsilon_i$ =0，R为全部的样本点的数目，C是惩罚系数

当C很大的时候，分错的点就会更少，但是过拟合的情况可能会比较严重
当C很小的时候，分错的点可能会很多，不过可能由此得到的模型也会不太正确

C越小对误分类的惩罚越小，C越大对误分类的惩罚越大，当C取正无穷时就变成了硬间隔优化。C越小越容易欠拟合，C越大越容易过拟合。实际应用中我们也会调整和选择合适的C值

2）用曲线将其完全分开，即非线性的决策边界（非线性SVM）

在这里插入图片描述
如果我们要处理的分类问题更加复杂，甚至不能像上面一样近似线性可分，这种情况下找到的超平面分错的程度太高，是不可接受的

对于这样的问题，解决的方案是将样本从原始空间映射到一个更高维的特征空间，使得样本在这个特征空间内线性可分，然后再运用SVM求解。这个映射的函数称为核函数

在这里插入图片描述
更多关于软间隔与硬间隔、SVM的损失函数、核函数以及SVM分类的介绍详见文章：传送门

1.3、支持向量机回归

支持向量机回归的核心思想是通过最小化预测误差来拟合数据，并且在拟合过程中保持一个边界（间隔），使得大部分数据点都落在这个边界之内。SVR与分类问题中的支持向量机（SVC）类似，但其目标是拟合数据而不是分离数据

在SVC中，在数据集线性可分的情况下，训练数据集的样本点中与分离超平面距离最近的数据点称为支持向量（Support Vector）

在这里插入图片描述
即所有在直线 $\omega X$ + $b$ = $1$ 和直线 $\omega X$ + $b$ = $- 1$ 上的点。在决定最佳超平面时只有支持向量起作用，而其他数据点并不起作用

与SVC类似，在SVR中，我们同样定义一个边界，由一个中心线和两个平行的边界线组成。这些边界线之间的距离称为间隔，它由用户预先设定。SVR的目标是找到一个函数，使得大部分数据点都落在间隔内，并

这篇关于Scikit-Learn支持向量机回归的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1074000。 23002807@qq.com

相关文章

k8s上运行的mysql、mariadb数据库的备份记录(支持x86和arm两种架构)

k8s上运行的mysql、mariadb数据库的备份记录(支持x86和arm两种架构)

《k8s上运行的mysql、mariadb数据库的备份记录(支持x86和arm两种架构)》本文记录在K8s上运行的MySQL/MariaDB备份方案,通过工具容器执行mysqldump,结合定时任务实... 目录前言一、获取需要备份的数据库的信息二、备份步骤1.准备工作（X86）1.准备工作（arm）2.手

阅读更多...

华为鸿蒙HarmonyOS 5.1官宣7月开启升级! 首批支持名单公布

华为鸿蒙HarmonyOS 5.1官宣7月开启升级! 首批支持名单公布

《华为鸿蒙HarmonyOS5.1官宣7月开启升级!首批支持名单公布》在刚刚结束的华为Pura80系列及全场景新品发布会上，除了众多新品的发布，还有一个消息也点燃了所有鸿蒙用户的期待，那就是Ha... 在今日的华为 Pura 80 系列及全场景新品发布会上，华为宣布鸿蒙 HarmonyOS 5.1 将于 7

阅读更多...

SpringKafka消息发布之KafkaTemplate与事务支持功能

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优

阅读更多...

一文教你解决Python不支持中文路径的问题

一文教你解决Python不支持中文路径的问题

《一文教你解决Python不支持中文路径的问题》Python是一种广泛使用的高级编程语言,然而在处理包含中文字符的文件路径时,Python有时会表现出一些不友好的行为,下面小编就来为大家介绍一下具体的... 目录问题背景解决方案1. 设置正确的文件编码2. 使用pathlib模块3. 转换路径为Unicod

阅读更多...

定价129元!支持双频 Wi-Fi 5的华为AX1路由器发布

定价129元!支持双频 Wi-Fi 5的华为AX1路由器发布

《定价129元!支持双频Wi-Fi5的华为AX1路由器发布》华为上周推出了其最新的入门级Wi-Fi5路由器——华为路由AX1，建议零售价129元，这款路由器配置如何？详细请看下文介... 华为 Wi-Fi 5 路由 AX1 已正式开售，新品支持双频 1200 兆、配有四个千兆网口、提供可视化智能诊断功能，建

阅读更多...

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯，先赞后看哦~🎈🎈 🏆 作者简介：景天科技苑 🏆《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。 🏆《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi

阅读更多...

Vector3 三维向量

Vector3 三维向量

Vector3 三维向量 Struct Representation of 3D vectors and points. 表示3D的向量和点。 This structure is used throughout Unity to pass 3D positions and directions around. It also contains functions for doin

阅读更多...

8. 自然语言处理中的深度学习：从词向量到BERT

8. 自然语言处理中的深度学习：从词向量到BERT

引言深度学习在自然语言处理（NLP）领域的应用极大地推动了语言理解和生成技术的发展。通过从词向量到预训练模型（如BERT）的演进，NLP技术在机器翻译、情感分析、问答系统等任务中取得了显著成果。本篇博文将探讨深度学习在NLP中的核心技术，包括词向量、序列模型（如RNN、LSTM），以及BERT等预训练模型的崛起及其实际应用。 1. 词向量的生成与应用词向量（Word Embedding）

阅读更多...

✨机器学习笔记（二）—— 线性回归、代价函数、梯度下降

✨机器学习笔记（二）—— 线性回归、代价函数、梯度下降

1️⃣线性回归（linear regression） f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b(x)=wx+b 🎈A linear regression model predicting house prices：如图是机器学习通过监督学习运用线性回归模型来预测房价的例子，当房屋大小为1250 f e e t 2 feet^

阅读更多...

Golang支持平滑升级的HTTP服务

Golang支持平滑升级的HTTP服务

前段时间用Golang在做一个HTTP的接口，因编译型语言的特性，修改了代码需要重新编译可执行文件，关闭正在运行的老程序，并启动新程序。对于访问量较大的面向用户的产品，关闭、重启的过程中势必会出现无法访问的情况，从而影响用户体验。使用Golang的系统包开发HTTP服务，是无法支持平滑升级（优雅重启）的，本文将探讨如何解决该问题。一、平滑升级（优雅重启）的一般思路一般情况下，要实现平滑

阅读更多...