统计学习方法——逻辑斯蒂回归与最大熵模型

2023-12-26 21:58

本文主要是介绍统计学习方法——逻辑斯蒂回归与最大熵模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

逻辑斯蒂回归(LR)是统计学习中的经典分类方法。最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型。逻辑斯蒂回归模型与最大熵模型都属于对数线性模型。

1、逻辑斯蒂回归模型

线性回归与逻辑回归关系:

在学习逻辑回归时,常常会联想到线性回归。线性回归一般预测解决连续值预测的问题,对已有的数据进行线性拟合,运用最小二乘法等,找到最佳拟合曲线,然后得到线性模型,来进行预测,是一个线性模型。而逻辑回归时一个非线性模型,sigmoid函数,又称逻辑回归函数。用于解决分类问题,输出某个类别的概率。如果把逻辑回归拆开,其本质也是线性回归模型。因为除了sigmoid映射函数外,其他步骤都是线性回归。sigmoid能轻松出列0、1分类问题。

逻辑斯蒂回归模型定义及来源

(1)一阶逻辑斯蒂回归

逻辑斯蒂回归模型主要是来源于逻辑斯蒂分布与逻辑斯蒂函数。当然,如果换一个名字,你对它应当相当熟悉,那就是sigmoid函数。它的形式如下:

                                                                                        f(x) = \frac{1}{1+e^{-x}}

而逻辑斯蒂回归模型的另一个则来源于线性回归:

                                                                    

把两者组合起来,就形成了大名鼎鼎的十大数据挖掘算法(LR):

                                                                   

f(x)的值是一个0到1之间的数。

(2)二项逻辑斯蒂回归模型

二项回归模型是如下的条件概率分布:

                                                                          P(Y=1|X) = \frac{e^{\omega · x+b}}{1+e^{\omega · x+b}}

                                                                         P(Y=0|X) = \frac{1}{1+e^{\omega · x+b}}

这里,x\in R^{n}是输入,Y\in 0 to 1是输出,w,b是参数,wx是w,x的内积。

在学习逻辑斯蒂回归模型的特点是,要涉及到一个名词“几率”。一个事件的几率是指该时间发生的概率与该事件不发生的概率的比值。如果发生的概率是p,那么,该事件的几率是:\frac{P}{1-P},对事件的对数几率或logit函数是

                                                                              

所以,对逻辑斯蒂回归而言,综合可得式子:

                                                                     

这里可以看出,输出y=1的对数几率是输入x的线性函数

 

(3)模型参数估计

现在大致模型已经知道了,参数未知。只要计算得出模型的参数就可得到具体模型。

这里采用极大似然估计法作为参数估计,把问题变成以似然函数为目标函数的最优化问题

                                                

     这样,问题就变成了以对数似然函数为目标函数的最优化问题。逻辑斯蒂回归学习中通常采用的方法是梯度下降法及拟牛顿法。

                                         

 

 

似然函数可以看做是条件概率的逆反

例子:

一枚硬币,已知正反面朝上的概率各自是pH = 0.5。若投两次都正面朝上的概率是0.25,用条件概率表示,就是:

P(HH | pH = 0.5) = 0.5^{2} = 0.25        H表示正面朝上

在统计学中,我们关心的是在已知一系列投掷的结果时,关于硬币投掷时正面朝上的可能性的信息。我们可以建立一个统计模型:假设硬币投出时会有pH 的概率正面朝上,而有1 − pH 的概率反面朝上。这时,条件概率可以改写成似然函数:

L(pH = 0.5|HH ) = P(HH | pH = 0.5) = 0.25

也就是说,对于取定的似然函数,在观测到两次投掷都是正面朝上时,pH = 0.5 的似然性是0.25(这并不表示当观测到两次正面朝上时pH = 0.5 的概率是0.25)

如果pH=0.6 ,那么似然函数的值也会变化成0.36

注意到似然函数的值变大了。这说明,如果参数pH 的取值变成0.6的话,结果观测到连续两次正面朝上的概率要比假设pH = 0.5时更大。也就是说,参数pH 取成0.6 要比取成0.5 更有说服力,更为“合理”。总之,似然函数的重要性不是它的具体取值,而是当参数变化时函数到底变小还是变大。对同一个似然函数,如果存在一个参数值,使得它的函数值达到最大的话,那么这个值就是最为“合理”的参数值。

在这个例子中,似然函数实际上等于:

(4)多项逻辑斯蒂回归

逻辑斯蒂回归模型可以是二分类模型,用于二分类问题。也可以推广为多项逻辑斯蒂回归模型,用于多分类问题。

                           

 

2、最大熵模型

先了解什么是最大熵原理

 最大熵原理 是 学习概率模型时,在所有可能的概率模型(分布)中,熵最大的模型是最好的模型。

计算最大熵根据两个前提去解决问题:

1. 解决问题要满足一定约束 

2. 不做任何假设,就是在约束外的事件发生概率为等概率

直观地,最大熵原理认为要选择的概率模型首先必须满足已有的事实,即约束条件。在没有更多信息的情况下,哪些不确定的部分都是“等可能的”。最大熵原理通过熵的最大化来表示等可能性。

简而言之,除了约束条件外,其他发生概率都是相等的。

 

模型的定义,即找到模型集合中熵最大的模型。

最大熵模型的学习

最大熵的学习形式可以化为约束最优化问题。

先将最大值问题等价成一个最小值问题。再将最优化原始问题转换成无约束最优化的对偶问题。通过对偶问题求解原始问题。这个方法在支持向量机的推导过程中也有涉及。对偶问题的概述后续再补充

 

Note:

逻辑斯蒂回归模型、最大熵模型学习归结为以似然函数为目标函数的最优化问题,通常通过迭代算法求解。从最优化的观点看,这时的目标函数具有很好的性质。它是光滑的凸函数,因此多种最优化的方法都适用,保证能找到全局最优解。

逻辑斯蒂回归模型与最大熵模型都属于对数线性模型。
逻辑斯蒂回归模型及最大熵模型学习一般采用极大似然估计,或正则化的极大似然估计。逻辑斯蒂回归模型及最大熵模型学习可以形式化为无约束最优化问题。求解该最优化问题的算法由改进的迭代尺度法、梯度下降法、拟牛顿法

 

reference:

https://blog.csdn.net/weixin_40499753/article/details/82977623

这篇关于统计学习方法——逻辑斯蒂回归与最大熵模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/540913

相关文章

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

Windows 上如果忘记了 MySQL 密码 重置密码的两种方法

《Windows上如果忘记了MySQL密码重置密码的两种方法》:本文主要介绍Windows上如果忘记了MySQL密码重置密码的两种方法,本文通过两种方法结合实例代码给大家介绍的非常详细,感... 目录方法 1:以跳过权限验证模式启动 mysql 并重置密码方法 2:使用 my.ini 文件的临时配置在 Wi

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

最详细安装 PostgreSQL方法及常见问题解决

《最详细安装PostgreSQL方法及常见问题解决》:本文主要介绍最详细安装PostgreSQL方法及常见问题解决,介绍了在Windows系统上安装PostgreSQL及Linux系统上安装Po... 目录一、在 Windows 系统上安装 PostgreSQL1. 下载 PostgreSQL 安装包2.

SQL中redo log 刷⼊磁盘的常见方法

《SQL中redolog刷⼊磁盘的常见方法》本文主要介绍了SQL中redolog刷⼊磁盘的常见方法,将redolog刷入磁盘的方法确保了数据的持久性和一致性,下面就来具体介绍一下,感兴趣的可以了解... 目录Redo Log 刷入磁盘的方法Redo Log 刷入磁盘的过程代码示例(伪代码)在数据库系统中,r

Python实现图片分割的多种方法总结

《Python实现图片分割的多种方法总结》图片分割是图像处理中的一个重要任务,它的目标是将图像划分为多个区域或者对象,本文为大家整理了一些常用的分割方法,大家可以根据需求自行选择... 目录1. 基于传统图像处理的分割方法(1) 使用固定阈值分割图片(2) 自适应阈值分割(3) 使用图像边缘检测分割(4)

Java中Switch Case多个条件处理方法举例

《Java中SwitchCase多个条件处理方法举例》Java中switch语句用于根据变量值执行不同代码块,适用于多个条件的处理,:本文主要介绍Java中SwitchCase多个条件处理的相... 目录前言基本语法处理多个条件示例1:合并相同代码的多个case示例2:通过字符串合并多个case进阶用法使用

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

html5的响应式布局的方法示例详解

《html5的响应式布局的方法示例详解》:本文主要介绍了HTML5中使用媒体查询和Flexbox进行响应式布局的方法,简要介绍了CSSGrid布局的基础知识和如何实现自动换行的网格布局,详细内容请阅读本文,希望能对你有所帮助... 一 使用媒体查询响应式布局        使用的参数@media这是常用的