本文主要是介绍先验概率、最大释然估计(MLE)与最大后验估计(MAP),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
前言
在数据分析和机器学习中,估计是一个很重要的内容,这里着重介绍下极大似然估计与极大后验估计。
最大似然估计(MLE)
最大似然估计是模型已定,参数未定时的一种估计方法。比如说对于抛硬币而言,模型已定,可以看做是多个伯努利实验,我们所不知道的是这个硬币正面朝上的概率 p ,所以我们的任务就是估计
再以上面抛硬币为例,假设10次实验,7次正面朝上,此时根据极大似然估计
OK,这里总结出极大似然估计的一般过程。首先极大似然估计的前提是样本的采样是独立同分布的,假设现在得到的采样结果是 x1 , x2 , x3 , x4 , x5 ……,给定参数 θ ,则取得该采样结果的联合概率为:
为了求得 θ 的值使得 L(θ|x1,x2,…,xn) 取得极大值,而连乘形式通常很难求值,因此一般情况下会把连乘转化成连加,即会求 L 的对数,如下所示:
此时 xi 是已知量,只有参数 θ 是未知量,因此对 θ 求导。
求出 θ 的值即可。
特殊情况下, L(θ) 是一个递增函数或者其它比较简单的形式,我们无需进行求对数,只需直接判断即可。
现在对开头的抛硬币例子进行解释,我们可以判定每次抛硬币正面朝上的概率为 f(x=1|p)=px×(1−p)(1−x) ,则10次实验做完联合概率为
L(x1,x2,…,x10|p)=px1∗px2∗…px10∗(1−p)(1−x1)∗…(1−p)(1−x10)=∏10i=1pxi×(1−p)(1−xi)
对其进行求对数
再对 p 进行求导:
求解得到 p=710
最大后验估计(MAP)
最大后验估计与最大似然估计是类似的,只是这里加入了先验概率,我们在计算上述的抛硬币的试验时,并没有考虑硬币本身的因素,即 p 可能也是符合一个分布的。根据贝叶斯理论:
这里的 p(θ) 是参数 θ 的先验概率, p(θ|X) 是后验概率,而 p(X|θ) 就是我们上面提到的似然函数。在最大似然估计中,我们并没有考虑 p(θ) ,即我们假设 p 是一个固定值,但实际上,参数
仍以上面抛硬币来举例,这里以 Beta 分布来估计参数 p 的值,
所以根据先验概率的要求,我们要求 p(p|α,β) ,即:
根据图中的概率分布,我们假设这个硬币是均匀的,这里取 α=β=4 ,通过这个假设来给我们最大似然估计求出的结果进行修正。
这里比较凑巧, p=0.5 ,与我们的假设是比较相似的,准确度相比较最大似然估计似乎有一定提高。
参考
http://blog.csdn.net/yangliuy/article/details/8296481
http://www.cnblogs.com/liliu/archive/2010/11/24/1886110.html
这篇关于先验概率、最大释然估计(MLE)与最大后验估计(MAP)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!