朴素贝叶斯(NBM)之后验概率最大化的含义 | 统计学习方法

本文主要是介绍朴素贝叶斯(NBM)之后验概率最大化的含义 | 统计学习方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

朴素贝叶斯 - 贝叶斯估计Python复现:

[舟晓南:朴素贝叶斯(Bayes)模型python复现 - 贝叶斯估计;下溢出问题]

在《统计学习方法》一书中,详细说明了后验概率最大化与期望风险最小化之间的关系,深入地说明了后验概率最大化的含义,但其中的推导过程有所省略,这篇文章作为补充说明。

后验概率最大化的含义:

书中提到,朴素贝叶斯法将实例分到后验概率最大的类中,这等价于期望风险最小化。

要明白什么是期望风险最小化,首先要明白什么是期望。

期望是指某件事大量发生后的平均结果,反应了随机变量平均取值的大小。计算期望的公式:

 
其中x为X的取值,p为在X为该取值的概率,K为x可取值的数量。

期望与平均值之间的关系:

ter)

 
其中N是实例总数,n是X为x取值时的实例数量。

举个例子,在10户人家中有3户拥有1个孩子,有3户拥有2个孩子,有4户拥有3个孩子,则其期望为:


即对家庭的期望是每个家庭有2.1个孩子。

说回期望风险,按照书中的定义,期望风险的含义是:模型关于联合分布的期望损失,学习的目标就是选择期望风险最小的模型。

既然期望风险就是期望损失,那么我们需要定义一个损失函数,用来判断模型的好坏。

假设我们在朴素贝叶斯分类器中使用0-1损失函数:

 
其中f(X)就是习得的朴素贝叶斯模型。

那么期望风险代表的就是损失的平均值,函数为:


因为期望的定义是值出现的概率乘以具体值之和,所以上式可转换为损失函数与联合概率之积的积分:


在上式的转换中运用了联合概率,边缘概率和条件概率的关系。
我们设 为H(x)。

H(x)中损失函数大于等于0,条件概率P(y|x)大于0,因此H(x)大于0。同时P(x)也大于0,且当X=x时P(x)(先验概率)为常数,因此期望风险最小化可转换为条件期望最小化,即argminH(x)

 
上式的第二个等式成立,是因为损失函数表示当分类错误时取1,那么我们只需要最小化分类错误的概率,也就是最小化 。

上式最后推导出在朴素贝叶斯分类器中,期望风险最小化等价于后验概率最大化。

  


同名公众号和知乎:舟晓南

对机器学习,深度学习,python感兴趣,欢迎关注专栏,学习笔记已原创70+篇,持续更新中~ ^_^

学习笔记:数据分析,机器学习,深度学习​https://www.zhihu.com/column/c_1274454587772915712

专栏文章举例:

【机器学习】关于逻辑斯蒂回归,看这一篇就够了!解答绝大部分关于逻辑斯蒂回归的常见问题,以及代码实现 - 知乎 (zhihu.com)

关于 python 二三事​https://www.zhihu.com/column/c_1484952401395941377

专栏文章举例:

记录一下工作中用到的少有人知的pandas骚操作,提升工作效率 - 知乎 (zhihu.com)

关于切片时不考虑最后一个元素以及为什么从0开始计数的问题 - 知乎 (zhihu.com)

关于转行:

舟晓南:如何转行和学习数据分析 | 工科生三个月成功转行数据分析心得浅谈

舟晓南:求职数据分析师岗位,简历应该如何写?|工科生三个月成功转行数据分析心得浅谈


我建了个数据分析,机器学习,深度学习的群~ 需要学习资料,想要加入社群均可私信~

在群里我会不定期分享各种数据分析相关资源,技能学习技巧和经验等等~

详情私信,一起进步吧!

这篇关于朴素贝叶斯(NBM)之后验概率最大化的含义 | 统计学习方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/411080

相关文章

SpringBoot使用Jasypt对YML文件配置内容加密的方法(数据库密码加密)

《SpringBoot使用Jasypt对YML文件配置内容加密的方法(数据库密码加密)》本文介绍了如何在SpringBoot项目中使用Jasypt对application.yml文件中的敏感信息(如数... 目录SpringBoot使用Jasypt对YML文件配置内容进行加密(例:数据库密码加密)前言一、J

Spring Boot 中正确地在异步线程中使用 HttpServletRequest的方法

《SpringBoot中正确地在异步线程中使用HttpServletRequest的方法》文章讨论了在SpringBoot中如何在异步线程中正确使用HttpServletRequest的问题,... 目录前言一、问题的来源:为什么异步线程中无法访问 HttpServletRequest?1. 请求上下文与线

解读为什么@Autowired在属性上被警告,在setter方法上不被警告问题

《解读为什么@Autowired在属性上被警告,在setter方法上不被警告问题》在Spring开发中,@Autowired注解常用于实现依赖注入,它可以应用于类的属性、构造器或setter方法上,然... 目录1. 为什么 @Autowired 在属性上被警告?1.1 隐式依赖注入1.2 IDE 的警告:

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

Android开发中gradle下载缓慢的问题级解决方法

《Android开发中gradle下载缓慢的问题级解决方法》本文介绍了解决Android开发中Gradle下载缓慢问题的几种方法,本文给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、网络环境优化二、Gradle版本与配置优化三、其他优化措施针对android开发中Gradle下载缓慢的问

python 3.8 的anaconda下载方法

《python3.8的anaconda下载方法》本文详细介绍了如何下载和安装带有Python3.8的Anaconda发行版,包括Anaconda简介、下载步骤、安装指南以及验证安装结果,此外,还介... 目录python3.8 版本的 Anaconda 下载与安装指南一、Anaconda 简介二、下载 An

Java中将异步调用转为同步的五种实现方法

《Java中将异步调用转为同步的五种实现方法》本文介绍了将异步调用转为同步阻塞模式的五种方法:wait/notify、ReentrantLock+Condition、Future、CountDownL... 目录异步与同步的核心区别方法一:使用wait/notify + synchronized代码示例关键

Python使用Pandas对比两列数据取最大值的五种方法

《Python使用Pandas对比两列数据取最大值的五种方法》本文主要介绍使用Pandas对比两列数据取最大值的五种方法,包括使用max方法、apply方法结合lambda函数、函数、clip方法、w... 目录引言一、使用max方法二、使用apply方法结合lambda函数三、使用np.maximum函数

Qt 中集成mqtt协议的使用方法

《Qt中集成mqtt协议的使用方法》文章介绍了如何在工程中引入qmqtt库,并通过声明一个单例类来暴露订阅到的主题数据,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录一,引入qmqtt 库二,使用一,引入qmqtt 库我是将整个头文件/源文件都添加到了工程中进行编译,这样 跨平台

Nginx设置连接超时并进行测试的方法步骤

《Nginx设置连接超时并进行测试的方法步骤》在高并发场景下,如果客户端与服务器的连接长时间未响应,会占用大量的系统资源,影响其他正常请求的处理效率,为了解决这个问题,可以通过设置Nginx的连接... 目录设置连接超时目的操作步骤测试连接超时测试方法:总结:设置连接超时目的设置客户端与服务器之间的连接