第十一章 一元线性回归

2024-04-22 19:32

本文主要是介绍第十一章 一元线性回归,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

主要分析数值型自变量与数值型自变量之间的关系。
从变量个数上看,可分为简单相关与简单回归分析和多元相关与多元回归分析;从变量之间的关系形态上看,有线性相关与线性回归分析和非线性相关与非线性回归分析。

1 变量间关系的度量

1 变量间的关系

变量之间的关系可分为函数关系和相关关系
函数关系:一 一对应的确定关系
相关关系:变量之间存在的不确定的数量关系

2 相关关系的描述与测度

假设:(1)两个变量之间是线性关系 (2)两个变量是随机变量
步骤:(1)绘制散点图来判断变量之间的关系形态
(2)如果是线性关系,则利用相关系数来测度两个变量之间的关系强度
(3)对相关系数进行显著性检验,以判断样本所反映的关系能否用来代表两个变量总体上的关系
样本相关系数计算公式:
r=nxyxynx 2 (x) 2  − − − − − − − − − − − − −   ny 2 (y) 2  − − − − − − − − − − − − −     
上述相关系数也称为线性相关系数,或Pearson相关系数

3 相关关系的显著性检验

一般情况下,总体相关系数 ρ  是未知的,通常是根据样本相关系数 r  作为ρ 的近似估计值。但 r  是根据样本数据计算得到到,受到抽样波动的影响。能否根据样本系数说明总体的相关程度?就需考察样本相关系数的可靠性,即显著性检验。
当样本数据来自正态总体时,随着n 的增大, r  的抽样分布趋于正态分布,尤其当总体相关系数ρ 很小或接近0时,趋于正态分布的趋势非常明显。而当 ρ  远离0时,除非 n  非常大,否则r 的抽样分布呈现一定的偏离。因此对 r  的显著性检验采用费希尔提出的t 分布检验,不仅可以用于小样本,也可以用于大样本。
检验的步骤为:
第一步:提出假设
H 0 :ρ=0;ρ0 
第二步:计算检验的统计量
t=|r|n21r 2   − − − − − −   t(n2) 
第三布:进行决策。根据给出的显著性水平 α  和自由度计算出临界值。若 |t|>t α/2   ,则拒绝原假设 H 0   ,表明总体的两个变量间存在显著的线性关系

2 一元线性回归

1 一元线性回归模型

回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程
一元线性回归模型: y=β 0 +β 1 x+ε 
回归方程:描述因变量y的期望值如何依赖于自变量x的方程
一元线性回归方程: E(y)=β 0 +β 1 x 
估计的回归方程:用样本统计量代替回归方程中的未知参数
对于一元线性回归,估计的回归方程形式为:
y ^ 

这篇关于第十一章 一元线性回归的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/926671

相关文章

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

✨机器学习笔记(二)—— 线性回归、代价函数、梯度下降

1️⃣线性回归(linear regression) f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b​(x)=wx+b 🎈A linear regression model predicting house prices: 如图是机器学习通过监督学习运用线性回归模型来预测房价的例子,当房屋大小为1250 f e e t 2 feet^

【高等代数笔记】线性空间(一到四)

3. 线性空间 令 K n : = { ( a 1 , a 2 , . . . , a n ) ∣ a i ∈ K , i = 1 , 2 , . . . , n } \textbf{K}^{n}:=\{(a_{1},a_{2},...,a_{n})|a_{i}\in\textbf{K},i=1,2,...,n\} Kn:={(a1​,a2​,...,an​)∣ai​∈K,i=1,2,...,n

用Python实现时间序列模型实战——Day 14: 向量自回归模型 (VAR) 与向量误差修正模型 (VECM)

一、学习内容 1. 向量自回归模型 (VAR) 的基本概念与应用 向量自回归模型 (VAR) 是多元时间序列分析中的一种模型,用于捕捉多个变量之间的相互依赖关系。与单变量自回归模型不同,VAR 模型将多个时间序列作为向量输入,同时对这些变量进行回归分析。 VAR 模型的一般形式为: 其中: ​ 是时间  的变量向量。 是常数向量。​ 是每个时间滞后的回归系数矩阵。​ 是误差项向量,假

一些数学经验总结——关于将原一元二次函数增加一些限制条件后最优结果的对比(主要针对公平关切相关的建模)

1.没有分段的情况 原函数为一元二次凹函数(开口向下),如下: 因为要使得其存在正解,必须满足,那么。 上述函数的最优结果为:,。 对应的mathematica代码如下: Clear["Global`*"]f0[x_, a_, b_, c_, d_] := (a*x - b)*(d - c*x);(*(b c+a d)/(2 a c)*)Maximize[{f0[x, a, b,

带头结点的线性链表的基本操作

持续了好久,终于有了这篇博客,链表的操作需要借助图像模型进行反复学习,这里尽可能的整理并记录下自己的思考,以备后面复习,和大家分享。需要说明的是,我们从实际应用角度出发重新定义了线性表。 一. 定义 从上一篇文章可以看到,由于链表在空间的合理利用上和插入、删除时不需要移动等优点,因此在很多场合下,它是线性表的首选存储结构。然而,它也存在某些实现的缺点,如求线性表的长度时不如顺序存储结构的

浙大数据结构:02-线性结构4 Pop Sequence

这道题我们采用数组来模拟堆栈和队列。 简单说一下大致思路,我们用栈来存1234.....,队列来存输入的一组数据,栈与队列进行匹配,相同就pop 机翻 1、条件准备 stk是栈,que是队列。 tt指向的是栈中下标,front指向队头,rear指向队尾。 初始化栈顶为0,队头为0,队尾为-1 #include<iostream>using namespace std;#defi

深度学习与大模型第3课:线性回归模型的构建与训练

文章目录 使用Python实现线性回归:从基础到scikit-learn1. 环境准备2. 数据准备和可视化3. 使用numpy实现线性回归4. 使用模型进行预测5. 可视化预测结果6. 使用scikit-learn实现线性回归7. 梯度下降法8. 随机梯度下降和小批量梯度下降9. 比较不同的梯度下降方法总结 使用Python实现线性回归:从基础到scikit-learn 线性

C#中的各种画刷, PathGradientBrush、线性渐变(LinearGradientBrush)和径向渐变的区别

在C#中,画刷(Brush)是用来填充图形(如形状或文本)内部区域的对象。在.NET框架中,画刷是System.Drawing命名空间的一部分,通常用于GDI+绘图操作。以下是一些常用的画刷类型: SolidBrush:用于创建单色填充的画刷。HatchBrush:用于创建具有图案填充的画刷。TextureBrush:用于创建具有图像纹理填充的画刷。LinearGradientBrush:用于创

【python因果推断库11】工具变量回归与使用 pymc 验证工具变量4

目录  Wald 估计与简单控制回归的比较 CausalPy 和 多变量模型 感兴趣的系数 复杂化工具变量公式  Wald 估计与简单控制回归的比较 但现在我们可以将这个估计与仅包含教育作为控制变量的简单回归进行比较。 naive_reg_model, idata_reg = make_reg_model(covariate_df.assign(education=df[