逻辑斯特回归与最大熵模型

2024-01-10 05:59

本文主要是介绍逻辑斯特回归与最大熵模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 概述

逻辑回归(logistic regression)是统计学习中的经典分类方法。最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型(maximum entropy model)。

逻辑回归模型与最大熵模型都属于对数线性模型

 

逻辑斯蒂回归模型

1、逻辑斯蒂分布

定义6.1(逻辑分布):设X是连续随机变量,X服从逻辑斯谛分布是指X具有下列分布函数和密度函数

式中,u为位置参数,r>0为形状参数。

逻辑分布的密度函数f(x)和分布函数F(x)的图形如图所示。曲线在中心附近增长速度较快,在两端增长速度较慢形状参数Y的值越小,曲线在中心附近增长得越快.
分布函数属于逻辑函数,其图形是一条S形曲线(sigmoid curve)。该曲线以点(u, 1/2)为中心对称,即满足
2、二项逻辑斯蒂回归模型

二项逻辑回归模型(binomial logistic regression model)是一种分类模型,用于二类分类。由条件概率分布P(Y|X)表示,形式为参数化的逻辑分布。这里,随机变量X取值为实数,随机变量Y取值为1或0。

定义6.2 (逻辑回归模型):二项逻辑回归模型是如下的条件概率分布:

w称为权值向量,b称为偏置,w.x为w和x的内积。将权值向量和输入向量加以扩充为 w=(w, b), x =(x,1),逻辑回归模型如下

 

一个事件的几率(odds)是指该事件发生的概率与该事件不发生的概率的比值,如果事件发生的概率是p,那么该事件的对数几率(log odds)或logit函数是

对逻辑回归而言,这就是说,在逻辑回归模型中,输出Y=1的对数几率是由输入x的线性函数表示的模型。

3、模型参数估计

这样,问题就变成了以对数似然函数为目标函数的最优化问题。逻辑回归学习中诵常采用梯度下降法及拟牛顿法。

4、多项逻辑斯蒂回归模型

 

最大熵模型

1、最大熵原理

最大熵原理是概率模型学习的一个准则。

最大熵原理认为,学习概率模型时,在所有可能的概率模型(分布)中,熵最大的模型是最好的模型。通常用约束条件来确定概率模型的集合,所以,最大熵原理也可以表述为在满足约束条件的模型集合中选取熵最大的模型。均匀分布时,熵最大。

最大熵原理认为要选择的概率模型首先必须满足约束条件。在没有更多信息的情况下,那些不确定的部分都是“等可能的”。最大熵原理通过熵的最大化来表示等可能性.“等可能”不容易操作,而熵则是一个可优化的数值指标.

2、最大熵模型的定义

 (1)特征函数

(2)联合和边缘经验分布

(3)约束条件

其中特征函数f(x,y)关于经验分布P~(X,Y)的期望值,用EP~(f)表示:

特征函数f(x,y)关于模型P(Y|X)与经验分布P ~(X)的期望值,用E P(f)表示:
(4)最大熵模型

定义6.3(最大熵模型):假设满足所有约束条件的模型集合为:

定义在条件概率分布P(Y|X)上的条件熵为:

则模型集合C中条件熵H(P)最大的模型称为最大熵模型。

3、最大熵模型的学习

最大熵模型的学习过程就是求解最大熵模型的过程,可以形式化为约束最优化问题:

求解流程图如下,详细公式推导可见书或者博客https://blog.csdn.net/tina_ttl/article/details/53542004或者https://blog.csdn.net/dashuye4/article/details/38032843

 

4、极大似然估计

(1)条件概率的似然函数

(2)在求解对偶问题的第一步中,我们已经得到P如下,即模型已经有了,缺的是其中参数w的值。

接下来使用A对偶函数和B极大使然估计中的对数似然函数是一样的

A、对偶函数

B、极大使然估计中的对数似然函数

也就是说,最大熵模型学习中的对偶函数极大化等价于最大熵模型的极大似然估计,最大熵模型的学习问题就转换为具体求解对数似然函数极大化或对偶函数极大化的问题。此时可用最优化的算法求解。

 

模型学习的最优化算法

逻辑斯谛回归模型、最大熵模型学习归结为以似然函数为目标函数的最优化问题,通常通过迭代算法求解.从最优化的观点看,这时的目标函数具有很好的性质.它是光滑的凸函数,因此多种最优化的方法都适用.保证能找到全局最优解.

常用的方法有改进的迭代尺度法、梯度下降法、牛顿法或拟牛顿法.牛顿法或拟牛顿法一般收敛速度更快.

(才疏学浅。。这一块内容理解有限,不敢妄言)

转载于:https://www.cnblogs.com/CJT-blog/p/10135077.html

这篇关于逻辑斯特回归与最大熵模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/589791

相关文章

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

最新Spring Security实战教程之表单登录定制到处理逻辑的深度改造(最新推荐)

《最新SpringSecurity实战教程之表单登录定制到处理逻辑的深度改造(最新推荐)》本章节介绍了如何通过SpringSecurity实现从配置自定义登录页面、表单登录处理逻辑的配置,并简单模拟... 目录前言改造准备开始登录页改造自定义用户名密码登陆成功失败跳转问题自定义登出前后端分离适配方案结语前言

Java逻辑运算符之&&、|| 与&、 |的区别及应用

《Java逻辑运算符之&&、||与&、|的区别及应用》:本文主要介绍Java逻辑运算符之&&、||与&、|的区别及应用的相关资料,分别是&&、||与&、|,并探讨了它们在不同应用场景中... 目录前言一、基本概念与运算符介绍二、短路与与非短路与:&& 与 & 的区别1. &&:短路与(AND)2. &:非短

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首