先验概率 后验概率 似然 极大似然估计 极大后验估计 共轭 概念

2024-01-25 19:18

本文主要是介绍先验概率 后验概率 似然 极大似然估计 极大后验估计 共轭 概念,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

http://blog.csdn.net/hxxiaopei/article/details/8034184

 

最近在看LDA,里面涉及到 狄利克雷的概念,为了把这个事情搞明白,查了一些相关概率知识,

 

举个例子,掷硬币,伯努利实验 中随机变量x={正面,背面},正面的概率μ为模型参数,假定做了N次试验,Data 中观察序列为X={正面,正面。。。。反面},正面的次数为k,服从二项分布:p(X|μ)pk(1P)(Nk)
P(X|μ) 则成为似然函数
针对观察到的随机变量(也就是Data)X,以及模型参数μ:
P(X|μ)为μ的似然函数,描述的是该观察集合以多大的概率由μ产生
P(μ)为μ的先验概率,这个概率是经验的总结,和实验无关
P(μ|α)为μ的先验概率,依赖于模型参数α,刻画了在α的情况下,参数(概率)μ出现的概率
P(μ|X)为μ的后验概率,描述给定数据X的情况下,模型参数=μ的概率,μ可以有很多取值。
我们现在的问题是,根据实验Data X,估计模型参数μ,很显然,我们想到极大似然估计:
P(X|μ),求解参数μ,使得观察data的概率最大,也就是说找到最有可能产生Data的模型参数。

p(X|μ)xip(xi|μ)=pk(1p)Nk

求其一阶导数,采用梯度下降法,令其导数为0,可以求出p= k/n,符合我们的期望。这就是似然函数以及极大似然估计的概念。

'现在有一个问题: 如果N的次数不够大,比如我就做了1次试验,碰巧是正面,结果就是p=1,得出正面概率为1的谬论。很显然,对抛硬币,我们有一定的先验,比如抛10次,应该有5次,或者4-6次是正面,也就是有先验概率p=0.4~0.6.

所以我们在似然函数的基础上加上先验概率,估计的会更准确,P(μ|α)表示μ的先验概率,也可以理解为抛硬币时,正面概率为μ的概率是多少,具体概率大小依赖于参数。
在PRML中提到后验概率 ~ 似然函数*先验概率,也就是
p(μ|X)p(μ|α)p(X|μ)=xip(μ|α)μk(1μ)Nk
参数估计变为MAP极大后验估计.对于二项分布,它的概率分布为 p(X|μ)pk(1p)Nk

我们不禁想,如果先验概率p(μ|α)和似然函数的形式一样,也是 p(μ|α)=μa(1μ)b,那么后验概率的形式也是是这个形式:p(μ|X)μa+k(1μ)b+Nk,看起来非常简洁,简洁就是美:)。
这就是共轭先验,不对其概念做很准确的描述,直白一点,就是先验和似然有相同的分布,从而后验也有相同的分布。

补充一句,prml所言,共轭先验,是分布的分布,概率的概率,如下:
假设我们有一个骰子,其有六面,分别为{1,2,3,4,5,6}。现在我们做了10000次投掷的实验,得到的实验结果是六面分别出现了{2000,2000,2000,2000,1000,1000}次,如果用每一面出现的次数与试验总数的比值估计这个面出现的概率,则我们得到六面出现的概率,分别为{0.2,0.2,0.2,0.2,0.1,0.1}。现在,我们还不满足,我们想要做10000次试验,每次试验中我们都投掷骰子10000次。我们想知道,出现这样的情况使得我们认为,骰子六面出现概率为{0.2,0.2,0.2,0.2,0.1,0.1}的概率是多少(说不定下次试验统计得到的概率为{0.1, 0.1, 0.2, 0.2, 0.2, 0.2}这样了)。这样我们就在思考骰子六面出现概率分布这样的分布之上的分布。而这样一个分布就是Dirichlet分布 From : http://www.xperseverance.net/blogs/2012/03/510/

二项分布的共轭先验就是beta 分布。形式是Beta(μ|a,b)=Γ(a+b)Γ(a)Γ(b)μa1(1μ)b1
采用MAP极大后验计算后μ=(k+a )/(N + a + b),加上了平滑因子 a b,如果 a=5, b=5,k=1, N=1,对应的μ=0.45,更接近我们理解上的u=0.5
所以beta分布式二项分布的共轭先验分布

LDA中提到的 狄利克雷分布,其实就是就是 多项分布的共轭先验分布。
多项分布和二项分布类似,只是参数有多个, P(X|μ)=μn11μn22μn33....μnkk其共轭先验分布狄利克雷分布 P(μ|α)μα111μα212μα311....μαk1

这篇关于先验概率 后验概率 似然 极大似然估计 极大后验估计 共轭 概念的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/644338

相关文章

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

【VUE】跨域问题的概念,以及解决方法。

目录 1.跨域概念 2.解决方法 2.1 配置网络请求代理 2.2 使用@CrossOrigin 注解 2.3 通过配置文件实现跨域 2.4 添加 CorsWebFilter 来解决跨域问题 1.跨域概念 跨域问题是由于浏览器实施了同源策略,该策略要求请求的域名、协议和端口必须与提供资源的服务相同。如果不相同,则需要服务器显式地允许这种跨域请求。一般在springbo

【MRI基础】TR 和 TE 时间概念

重复时间 (TR) 磁共振成像 (MRI) 中的 TR(重复时间,repetition time)是施加于同一切片的连续脉冲序列之间的时间间隔。具体而言,TR 是施加一个 RF(射频)脉冲与施加下一个 RF 脉冲之间的持续时间。TR 以毫秒 (ms) 为单位,主要控制后续脉冲之前的纵向弛豫程度(T1 弛豫),使其成为显著影响 MRI 中的图像对比度和信号特性的重要参数。 回声时间 (TE)

计算机网络基础概念 交换机、路由器、网关、TBOX

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、VLAN是什么?二 、交换机三、路由器四、网关五、TBOXTelematics BOX,简称车载T-BOX,车联网系统包含四部分,主机、车载T-BOX、手机APP及后台系统。主机主要用于车内的影音娱乐,以及车辆信息显示;车载T-BOX主要用于和后台系统/手机APP通信,实现手机APP的车辆信息显示与控

01 Docker概念和部署

目录 1.1 Docker 概述 1.1.1 Docker 的优势 1.1.2 镜像 1.1.3 容器 1.1.4 仓库 1.2 安装 Docker 1.2.1 配置和安装依赖环境 1.3镜像操作 1.3.1 搜索镜像 1.3.2 获取镜像 1.3.3 查看镜像 1.3.4 给镜像重命名 1.3.5 存储,载入镜像和删除镜像 1.4 Doecker容器操作 1.4

【机器学习-一-基础概念篇】

机器学习 定义分类算法 应用 定义 机器学习最早是被Arthur Samuel 提出的一个概念,指计算机无需明确编程即可学习的研究领域。1950年他发明的跳棋程序,这个人机对弈游戏让他的声名鹊起,机器学习这个概念才进入大众的是视线。 在这个跳棋程序里,他编程了一种算法,这个程序与Arthur下了数万次跳棋,计算机逐渐学会了下在哪里有更大的可能会赢得比赛,哪里会输,通过这种方法,最

【吊打面试官系列-Redis面试题】说说 Redis 哈希槽的概念?

大家好,我是锋哥。今天分享关于 【说说 Redis 哈希槽的概念?】面试题,希望对大家有帮助; 说说 Redis 哈希槽的概念? Redis 集群没有使用一致性 hash,而是引入了哈希槽的概念,Redis 集群有 16384 个哈希槽,每个 key 通过 CRC16 校验后对 16384 取模来决定放置哪个槽, 集群的每个节点负责一部分 hash 槽。

AI辅助编程里的 Atom Group 的概念和使用

背景 在我们实际的开发当中,一个需求往往会涉及到多个文件修改,而需求也往往有相似性。 举个例子,我经常需要在 auto-coder中需要添加命令行参数,通常是这样的: /coding 添加一个新的命令行参数 --chat_model 默认值为空 实际上这个需求涉及到以下文件列表: /Users/allwefantasy/projects/auto-coder/src/autocoder/auto

读软件设计的要素04概念的关系

1. 概念的关系 1.1. 概念是独立的,彼此间无须相互依赖 1.1.1. 一个概念是应该独立地被理解、设计和实现的 1.1.2. 独立性是概念的简单性和可重用性的关键 1.2. 软件存在依赖性 1.2.1. 不是说一个概念需要依赖另一个概念才能正确运行 1.2.2. 只有当一个概念存在时,包含另一个概念才有意义 1.3. 概念依赖关系图简要概括了软件的概念和概念存在的理

数据集 3DPW-开源户外三维人体建模-姿态估计-人体关键点-人体mesh建模 >> DataBall

3DPW 3DPW-开源户外三维人体建模数据集-姿态估计-人体关键点-人体mesh建模 开源户外三维人体数据集 @inproceedings{vonMarcard2018, title = {Recovering Accurate 3D Human Pose in The Wild Using IMUs and a Moving Camera}, author = {von Marc