【minitab】--logistic回归

2023-10-22 11:31
文章标签 logistic 回归 minitab

本文主要是介绍【minitab】--logistic回归,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

系列文章目录

文章目录

  • 系列文章目录
  • 前言
  • 一、回归
  • 二、二值logistics回归
    • 1.示例
    • 2.minitab分析
  • 三、名义值logistics回归
    • 1.示例:
  • 四、顺序logistics回归
    • 1.示例:
    • 2.minitab分析
  • 四、回归数据
  • 总结


前言

一、回归

在研究Y与X之间的因果关系时,如果Y不是一个定比或定距变量时,就需要进行logistic回归。logistic回归是一种广义线性回归(generalized linear model)。logistic回归根据Y的取值分为三类:

  • 二值logistics回归
  • 名义值logistics回归
  • 顺序logistics回归

二、二值logistics回归

我们将响应变量只有“是”或“否”两类,我们把这类只取两值的响应变量对于单个或多个自变量的回归问题称作二值logistics回归。

1.示例

代码如下(示例):
研究肥胖是否与患心血管疾病有关的问题。上海某高校对于3983名参加体检者,记录了体重超重者(BWI大于等于25)患有心血管疾病的人数。其数据列于表9-9(数据文件是:REG_心血管疾病.MTW)。希望分析体重指数(BWD与心血管疾病患病率的关系。

表1
在这里插入图片描述
解释:从上表最后一行看出,患病率有随BW1增加而增长的趋势,但这是否为规律性的结果?更具体地,对于给定的BWI,估计其患心血管病率为多少?因此要对这种数据进行回归分析。显然,用患病率p直接作为因变量y效果肯定不好,因为p的变化范围是从0到1,拟合线性回归肯定不行,要对p进行变换才好。
定义两种结果出现的概率之比为“优势比”或“差异比”(odds ratio),其定义是:

2.minitab分析

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

三、名义值logistics回归

1.示例:

第一节讨论了响应变量取值只有“是”或“否”两类的二进制Logistic回归。实际工作中,我们还会见到响应变量取名义值的情形,这个响应变量可以取多个值,但这些值又不存在顺序关系。例如响应变量是手机品牌,它有A,B,C,D共4种,4种品牌间不存在顺序关系;又如响应变量是某车间的“车床”、某工厂的“工人”、生产某产品的“方法”等,这些响应变量都是名义值。当响应变量是名义值类别变量(即离散型变量),自变量中有数值变量和类别变量,求出这些变量之间的关系之数学模型就是名义值Logistic回归问题。常用的名义值Logistic回归数学模型是:从响应变量取的值中选一个为参考事件,例如选取最后一个,即第k个事件,设响应变量取它的概率为pa,响应变量取其余事件概率为p…,p;;名义值Logistic回归模型为:

四、顺序logistics回归

1.示例:

第一1节讨论了响应变量取值只有“是”或“否”两类的二进制Logistic回归;第二节讨论了离散型变量取名义值的情形。在实际工作中,我们还会见到离散型变量取有序值的情形,例如空气污染等级分为I,Ⅱ,Ⅲ,V共四个级别,这里V级污染最重,Ⅲ级次之,Ⅱ级更好些,I级最好,它们之间可以排出顺序。这就提供了比二值回归或取多个名义值这两种情况更多的信息。与响应变量有关的自变量可以是离散型变量,也可以是连续型变量,我们要建立回归方程,主要的工具仍然是二进制Logistic回归分析。以空气污染状况为例,我们可以先比较I与Ⅱ,Ⅲ,Ⅳ;再比I,Ⅱ与Ⅲ,IⅣ;最后比I,Ⅱ,Ⅲ与Ⅳ。这样比较了三次,就把所有可以配对的状况都比较清楚了。更详细点说是这样:在每次比较时,In2,中的分子p代表的是“累积事件”出现的可能性,例如,第一次比较中,p代表的是出现I级污染状况的概率与出现Ⅱ,Ⅲ,IV三级污染状况的概率1一p的比较;第二次比较中,p代表的是出现I,Ⅱ两级累积污染状况的概率与出现Ⅲ,IⅣ两级污染状况的概率1-p的比较;第三次比较中,p代表的是出现I,Ⅱ,Ⅲ三级累积污染状况的概率与出现IⅣ级污染状况的概率1-p的比较。将p理解为“累积事件”出现的可能性则可以更容易地理解有序状况的二进制Logistic回归分析。
一般说来,如果有序观测值分为k级,则可以比较的共有k一1对。还应注意的是:这k一1对回归方程中,自变量的系数一定是相同的。

荣螺生活在北半球温暖潮湿的淡水或沼泽地带,对环境要求很苛刻,在被污染的水中寿命会大大缩短。将嫌娠的寿命分为三级;1级是短于10天;2级是介于10~30天;3级是31天以上。收集到的73只嫌嫄来自1区或2区,而且记录了水中的毒性水平(见表)试分析嫌频生存时间与水中的毒性水平及区域间的关系。

在这里插入图片描述

2.minitab分析

在这里插入图片描述
在这里插入图片描述

  • 响应信息(值、计数):每种满意度的样本个数;
  • 各X与回归方程的P值都要小于0.05;
  • 拟合优度的P值都大于0.05;
  • 相关性度量值越接近1模型预测能力越强;

四、回归数据

数据传送门

回归数据


总结

分享:
当我坐在书桌前边收到一本寄来的书,我就把它放在桌上。如果在阅读时有客来访,我就把书带到客厅,去和来客谈谈这本书的内容。客人告别以后,如果我把书遗忘在客厅,我就让它摆在那里。有时话谈得开心,我还不感倦意,只是想休息一会,我就把它带到楼上,在床上去阅读。如果书中兴趣浓厚,我就继续读了下去,如果兴趣减低,就把它用作枕头而睡,这就是我所谓的自然的方法,也可以说是“使书籍任其所在的方法”。我甚至不能说哪一处是我喜欢放书的地方。

这篇关于【minitab】--logistic回归的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/261162

相关文章

✨机器学习笔记(二)—— 线性回归、代价函数、梯度下降

1️⃣线性回归(linear regression) f w , b ( x ) = w x + b f_{w,b}(x) = wx + b fw,b​(x)=wx+b 🎈A linear regression model predicting house prices: 如图是机器学习通过监督学习运用线性回归模型来预测房价的例子,当房屋大小为1250 f e e t 2 feet^

用Python实现时间序列模型实战——Day 14: 向量自回归模型 (VAR) 与向量误差修正模型 (VECM)

一、学习内容 1. 向量自回归模型 (VAR) 的基本概念与应用 向量自回归模型 (VAR) 是多元时间序列分析中的一种模型,用于捕捉多个变量之间的相互依赖关系。与单变量自回归模型不同,VAR 模型将多个时间序列作为向量输入,同时对这些变量进行回归分析。 VAR 模型的一般形式为: 其中: ​ 是时间  的变量向量。 是常数向量。​ 是每个时间滞后的回归系数矩阵。​ 是误差项向量,假

深度学习与大模型第3课:线性回归模型的构建与训练

文章目录 使用Python实现线性回归:从基础到scikit-learn1. 环境准备2. 数据准备和可视化3. 使用numpy实现线性回归4. 使用模型进行预测5. 可视化预测结果6. 使用scikit-learn实现线性回归7. 梯度下降法8. 随机梯度下降和小批量梯度下降9. 比较不同的梯度下降方法总结 使用Python实现线性回归:从基础到scikit-learn 线性

【python因果推断库11】工具变量回归与使用 pymc 验证工具变量4

目录  Wald 估计与简单控制回归的比较 CausalPy 和 多变量模型 感兴趣的系数 复杂化工具变量公式  Wald 估计与简单控制回归的比较 但现在我们可以将这个估计与仅包含教育作为控制变量的简单回归进行比较。 naive_reg_model, idata_reg = make_reg_model(covariate_df.assign(education=df[

什么是GPT-3的自回归架构?为什么GPT-3无需梯度更新和微调

文章目录 知识回顾GPT-3的自回归架构何为自回归架构为什么架构会影响任务表现自回归架构的局限性与双向模型的对比小结 为何无需梯度更新和微调为什么不需要怎么做到不需要 🍃作者介绍:双非本科大四网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发,目前开始人工智能领域相关知识的学习 🦅个人主页:@逐梦苍穹 📕所属专栏:人工智能 🌻gitee地址:x

回归预测 | MATLAB实现PSO-LSTM(粒子群优化长短期记忆神经网络)多输入单输出

回归预测 | MATLAB实现PSO-LSTM(粒子群优化长短期记忆神经网络)多输入单输出 目录 回归预测 | MATLAB实现PSO-LSTM(粒子群优化长短期记忆神经网络)多输入单输出预测效果基本介绍模型介绍PSO模型LSTM模型PSO-LSTM模型 程序设计参考资料致谢 预测效果 Matlab实现PSO-LSTM多变量回归预测 1.input和outpu

【ML--04】第四课 logistic回归

1、什么是逻辑回归? 当要预测的y值不是连续的实数(连续变量),而是定性变量(离散变量),例如某个客户是否购买某件商品,这时线性回归模型不能直接作用,我们就需要用到logistic模型。 逻辑回归是一种分类的算法,它用给定的输入变量(X)来预测二元的结果(Y)(1/0,是/不是,真/假)。我们一般用虚拟变量来表示二元/类别结果。你可以把逻辑回归看成一种特殊的线性回归,只是因为最后的结果是类别变

逻辑回归与线性回归的目标函数和应用场景比较

概述 逻辑回归和线性回归是两种常用的预测模型,它们在目标函数和应用场景上存在显著差异。本文将详细比较这两种回归模型,并提供相应的代码示例。 线性回归 线性回归是一种预测连续数值的模型,其目标是找到特征( X )和目标变量( Y )之间的线性关系。线性回归的目标函数是最小化预测值和实际值之间的平方差,即均方误差(MSE)。 目标函数 线性回归的损失函数是均方误差: [ J(\theta)

【python pytorch】Pytorch实现逻辑回归

pytorch 逻辑回归学习demo: import torchimport torch.nn as nnimport torchvision.datasets as dsetsimport torchvision.transforms as transformsfrom torch.autograd import Variable# Hyper Parameters input_si

回归预测 | Matlab基于贝叶斯算法优化XGBoost(BO-XGBoost/Bayes-XGBoost)的数据回归预测+交叉验证

回归预测 | Matlab基于贝叶斯算法优化XGBoost(BO-XGBoost/Bayes-XGBoost)的数据回归预测+交叉验证 目录 回归预测 | Matlab基于贝叶斯算法优化XGBoost(BO-XGBoost/Bayes-XGBoost)的数据回归预测+交叉验证效果一览基本介绍程序设计参考资料 效果一览 基本介绍 Matlab实现基于贝叶斯算法优化X