先验概率、最大释然估计(MLE)与最大后验估计(MAP)

2024-01-19 22:58

本文主要是介绍先验概率、最大释然估计(MLE)与最大后验估计(MAP),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

在数据分析和机器学习中,估计是一个很重要的内容,这里着重介绍下极大似然估计与极大后验估计。

最大似然估计(MLE)

    最大似然估计是模型已定,参数未定时的一种估计方法。比如说对于抛硬币而言,模型已定,可以看做是多个伯努利实验,我们所不知道的是这个硬币正面朝上的概率 p ,所以我们的任务就是估计p的值。极大似然估计的思想是,对于已经给定的一些观测数据,参数 p 的取值应使得取得这些观测数据的概率最大。
    再以上面抛硬币为例,假设10次实验,7次正面朝上,此时根据极大似然估计p的取值应该为 710 ,具体计算过程一会给出。
    OK,这里总结出极大似然估计的一般过程。首先极大似然估计的前提是样本的采样是独立同分布的,假设现在得到的采样结果是 x1 , x2 , x3 , x4 , x5 ……,给定参数 θ ,则取得该采样结果的联合概率为:

f(x1,x2,x3,xn;θ)=f(x1;θ)×f(x2;θ)××f(xn;θ)

L(θ|x1,x2,,xn)=i=1nf(xi|θ)

为了求得 θ 的值使得 L(θ|x1,x2,,xn) 取得极大值,而连乘形式通常很难求值,因此一般情况下会把连乘转化成连加,即会求 L 的对数,如下所示:
lnL(θ|x1,x2,,xn)=i=1nlnf(xi|θ)

此时 xi 是已知量,只有参数 θ 是未知量,因此对 θ 求导。
dlnL(θ)dθ=0

求出 θ 的值即可。

特殊情况下, L(θ) 是一个递增函数或者其它比较简单的形式,我们无需进行求对数,只需直接判断即可。

现在对开头的抛硬币例子进行解释,我们可以判定每次抛硬币正面朝上的概率为 f(x=1|p)=px×(1p)(1x) ,则10次实验做完联合概率为
L(x1,x2,x10|p)=px1px2px10(1p)(1x1)(1p)(1x10)=10i=1pxi×(1p)(1xi)
对其进行求对数

lnL(x1,x2,x10|p)=7lnp+ln(1p)

再对 p 进行求导:
dlnL(θ)dp=7p3(1p)=0

求解得到 p=710

最大后验估计(MAP)

    最大后验估计与最大似然估计是类似的,只是这里加入了先验概率,我们在计算上述的抛硬币的试验时,并没有考虑硬币本身的因素,即 p 可能也是符合一个分布的。根据贝叶斯理论:

p(θ|X)=p(X|θ)×p(θ)θip(X|θi)×p(θi)

这里的 p(θ) 是参数 θ 的先验概率, p(θ|X) 是后验概率,而 p(X|θ) 就是我们上面提到的似然函数。在最大似然估计中,我们并没有考虑 p(θ) ,即我们假设 p 是一个固定值,但实际上,参数p可能并不是固定的,它只是取某些值可能性比较大。因此我们只要将似然函数乘以先验概率然后取最大即可。
    仍以上面抛硬币来举例,这里以 Beta 分布来估计参数 p 的值,Beta分布是一个使用率非常高的分布,它根据 α β 的值可以使 Beta(α,β) 取不同的值,如下图所示。
这里写图片描述
所以根据先验概率的要求,我们要求 p(p|α,β) ,即:

p(p|α,β)=1B(α,β)pα1(1p)β1

B(α,β)=Γ(α)Γ(β)Γ(α+β)

根据图中的概率分布,我们假设这个硬币是均匀的,这里取 α=β=4 ,通过这个假设来给我们最大似然估计求出的结果进行修正。
θ^map=ln((i=110pxi(1p)(1xi))×1B(4,4)p3(1p)3)

dθ^mapdp=7p31p+3p31p=0

p=0.5

这里比较凑巧, p=0.5 ,与我们的假设是比较相似的,准确度相比较最大似然估计似乎有一定提高。

参考

http://blog.csdn.net/yangliuy/article/details/8296481
http://www.cnblogs.com/liliu/archive/2010/11/24/1886110.html

这篇关于先验概率、最大释然估计(MLE)与最大后验估计(MAP)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/623967

相关文章

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系

poj 3258 二分最小值最大

题意: 有一些石头排成一条线,第一个和最后一个不能去掉。 其余的共可以去掉m块,要使去掉后石头间距的最小值最大。 解析: 二分石头,最小值最大。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <c

poj 2175 最小费用最大流TLE

题意: 一条街上有n个大楼,坐标为xi,yi,bi个人在里面工作。 然后防空洞的坐标为pj,qj,可以容纳cj个人。 从大楼i中的人到防空洞j去避难所需的时间为 abs(xi - pi) + (yi - qi) + 1。 现在设计了一个避难计划,指定从大楼i到防空洞j避难的人数 eij。 判断如果按照原计划进行,所有人避难所用的时间总和是不是最小的。 若是,输出“OPETIMAL",若

poj 2135 有流量限制的最小费用最大流

题意: 农场里有n块地,其中约翰的家在1号地,二n号地有个很大的仓库。 农场有M条道路(双向),道路i连接着ai号地和bi号地,长度为ci。 约翰希望按照从家里出发,经过若干块地后到达仓库,然后再返回家中的顺序带朋友参观。 如果要求往返不能经过同一条路两次,求参观路线总长度的最小值。 解析: 如果只考虑去或者回的情况,问题只不过是无向图中两点之间的最短路问题。 但是现在要去要回

poj 2594 二分图最大独立集

题意: 求一张图的最大独立集,这题不同的地方在于,间接相邻的点也可以有一条边,所以用floyd来把间接相邻的边也连起来。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <sta

poj 3422 有流量限制的最小费用流 反用求最大 + 拆点

题意: 给一个n*n(50 * 50) 的数字迷宫,从左上点开始走,走到右下点。 每次只能往右移一格,或者往下移一格。 每个格子,第一次到达时可以获得格子对应的数字作为奖励,再次到达则没有奖励。 问走k次这个迷宫,最大能获得多少奖励。 解析: 拆点,拿样例来说明: 3 2 1 2 3 0 2 1 1 4 2 3*3的数字迷宫,走两次最大能获得多少奖励。 将每个点拆成两个

poj 3692 二分图最大独立集

题意: 幼儿园里,有G个女生和B个男生。 他们中间有女生和女生认识,男生男生认识,也有男生和女生认识的。 现在要选出一些人,使得这里面的人都认识,问最多能选多少人。 解析: 反过来建边,将不认识的男生和女生相连,然后求一个二分图的最大独立集就行了。 下图很直观: 点击打开链接 原图: 现图: 、 代码: #pragma comment(

最大流、 最小费用最大流终极版模板

最大流  const int inf = 1000000000 ;const int maxn = 20000 , maxm = 500000 ;struct Edge{int v , f ,next ;Edge(){}Edge(int _v , int _f , int _next):v(_v) ,f(_f),next(_next){}};int sourse , mee

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

最大流=最小割=最小点权覆盖集=sum-最大点权独立集

二分图最小点覆盖和最大独立集都可以转化为最大匹配求解。 在这个基础上,把每个点赋予一个非负的权值,这两个问题就转化为:二分图最小点权覆盖和二分图最大点权独立集。   二分图最小点权覆盖     从x或者y集合中选取一些点,使这些点覆盖所有的边,并且选出来的点的权值尽可能小。 建模:     原二分图中的边(u,v)替换为容量为INF的有向边(u,v),设立源点s和汇点t