最大似然估计法(MLE)

2023-12-12 08:08
文章标签 最大 估计 似然 mle

本文主要是介绍最大似然估计法(MLE),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最大似然估计(Maximum Likelihood Estimation),是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。最大似然估计中采样需满足一个很重要的假设,就是所有的采样都是独立同分布的。

一、最大似然估计法的基本思想

  最大似然估计法的思想很简单:在已经得到试验结果的情况下,我们应该寻找使这个结果出现的可能性最大的那个  作为真  的估计。
  我们分两种情进行分析:

1.离散型总体 

     为离散型随机变量,其概率分布的形式为  ,则样本  的概率分布为  ,在  固定时,上式表示  取值  的概率;当  固定时,它是  的函数,我们把它记为  并称为似然函数。似然函数  的值的大小意味着该样本值出现的可能性的大小。既然已经得到了样本值  ,那它出现的可能性应该是大的,即似然函数的值应该是大的。因而我们选择使  达到最大值的那个  作为真  的估计。

2.连续总体 

     为连续型随机变量,其概率密度函数为    为从该总体抽出的样本。因为  相互独立且同分布,于是,样本的联合概率密度函数为
   ,在  是固定时,它是   处的 密度,它的大小与  落在  附近的概率的大小成正比,而当样本值  固定时,它是 的函数。我们仍把它记为  并称为似然函数。类似于刚才的讨论,我们选择使  最大的那个  作为真  的估计。

总之,在有了试验结果即样本值  时,似然函数  反映了  的各个不同值导出这个结果的可能性的大小。 我们选择使  达到最大值的那个 作为真  的估计。这种求点估计的方法就叫作最大似然法。

二、 最大似然估计的求法

假定现在我们已经观测到一组样本  要去估计未知参数  。一种直观的想法是,哪一组能数值使现在的样本  出现的可能性最大,哪一组参数可能就是真正的参数,我们就要用它作为参数的估计值。这里,假定我们有一组样本  .如果对参数的两组不同的值  和 ,似然函数有如下关系
    ,
  那么,从  又是概率密度函数的角度来看,上式的意义就是参数  使 出现的可能性比参数  使  出现的可能性大,当然参数  比 更像是真正的参数.这样的分析就导致了参数估计的一种方法,即用使似然函数达到最大值的点 ,作为未知参数的估计,这就是所谓的最大似然估计。 现在我们讨论求最大似然估计的具体方.为简单起见,以下记  ,求θ的极大似然估计就归结为求  的最大值点.由于对数函数是单调增函数,所以
                     (2.1)

 与  有相同的最大值点。而在许多情况下,求  的最大值点比较简单,于是,我们就将求  的最大值点改为求  的最大值点.  关于 求导数,并命其等于零,得到方程组 
           ,                  (2.2)
  称为似然方程组。解这个方程组,又能验证它是一个极大值点,则它必是  ,也就是  的最大值点,即为所求的最大似然估计。大多常用的重要例子多属于这种情况。然而在一些情况下,问题比较复杂,似然方程组的解可能不唯一,这时就需要进一步判定哪一个是最大值点。
  还需要指出,若函数  关于  的导数不存在时,我们就无法得到似然方程组 (7.2.2),这时就必须根据最大似然估计的定义直接去  的最大值点。
  在一些情况下,我们需要估计  。如果  分别是  的最大似然估计,则称  为  的最大似然估计。 


三、实例

1.  正态分布估计

设从正态总体  抽出样本  ,这里未知参数为mm    (注意我们把  看作一个参数)。似然函数为
                    
                     = 
  它的对数为
   
  似然方程组为 
            
  由第一式解得
                         
     代入第二式得
            .         
  似然方程组有唯一解(    ),而且它一定是最大值点,这是因为当   或∞时,非负函数  。于是    的最大似然估计为
            .         (7.2.53.3) 
  这里,我们用大写字母表示所有涉及的样本,因为最大似然估计    都是统计量,离开了具体的一次试验或观测,它们都是随机的。

2.泊松分布估计

设总体  服从参数为的泊松分布,它的分布律为
           
  有了样本  之后,参数λ的似然函数为 
            

  似然方程为 
            
  解得
              
  因为  的二阶导数总是负值,可见,似然函数在  处达到最大值。所以,  是λ的最大似然估计。

3.均匀分布估计

设总体    上的均匀分布,求  的最大似然估计。
   的概率密度函数为
          
  对样本  
         

  很显然,L(ab)作为ab的二元函数是不连续的。这时我们不能用似然方程组(7.2.2)来求最大似然估计,而必须从最大似然估计的定义出发,求L(ab)的最大值。为使L(ab)达到最大,ba应该尽量地小,但b又不能小于  ,否则,L(ab)=0
  类似地,a不能大过  。因此,ab的最大似然估计为
            , 
             . 

现在为止,我们以正态分布,泊松分布,均匀分布的参数以及事件发生的概率的估计为例子讨论了矩估计和最大似然估计。在我们所举的例子中,除了均匀分布外,两种估计都是一致的。矩估计的优点是简单,只需知道总体的矩,总体的分布形式不必知道。而最大似然估计则必须知道总体分布形式,并且在一般情况下,似然方程组的求解较复杂,往往需要在计算机上通过迭代运算才能计算出其近似解。


转自:http://blog.sciencenet.cn/home.php?mod=space&uid=491809&do=blog&id=400893

这篇关于最大似然估计法(MLE)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/483864

相关文章

poj 3723 kruscal,反边取最大生成树。

题意: 需要征募女兵N人,男兵M人。 每征募一个人需要花费10000美元,但是如果已经招募的人中有一些关系亲密的人,那么可以少花一些钱。 给出若干的男女之间的1~9999之间的亲密关系度,征募某个人的费用是10000 - (已经征募的人中和自己的亲密度的最大值)。 要求通过适当的招募顺序使得征募所有人的费用最小。 解析: 先设想无向图,在征募某个人a时,如果使用了a和b之间的关系

poj 3258 二分最小值最大

题意: 有一些石头排成一条线,第一个和最后一个不能去掉。 其余的共可以去掉m块,要使去掉后石头间距的最小值最大。 解析: 二分石头,最小值最大。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <c

poj 2175 最小费用最大流TLE

题意: 一条街上有n个大楼,坐标为xi,yi,bi个人在里面工作。 然后防空洞的坐标为pj,qj,可以容纳cj个人。 从大楼i中的人到防空洞j去避难所需的时间为 abs(xi - pi) + (yi - qi) + 1。 现在设计了一个避难计划,指定从大楼i到防空洞j避难的人数 eij。 判断如果按照原计划进行,所有人避难所用的时间总和是不是最小的。 若是,输出“OPETIMAL",若

poj 2135 有流量限制的最小费用最大流

题意: 农场里有n块地,其中约翰的家在1号地,二n号地有个很大的仓库。 农场有M条道路(双向),道路i连接着ai号地和bi号地,长度为ci。 约翰希望按照从家里出发,经过若干块地后到达仓库,然后再返回家中的顺序带朋友参观。 如果要求往返不能经过同一条路两次,求参观路线总长度的最小值。 解析: 如果只考虑去或者回的情况,问题只不过是无向图中两点之间的最短路问题。 但是现在要去要回

poj 2594 二分图最大独立集

题意: 求一张图的最大独立集,这题不同的地方在于,间接相邻的点也可以有一条边,所以用floyd来把间接相邻的边也连起来。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <sta

poj 3422 有流量限制的最小费用流 反用求最大 + 拆点

题意: 给一个n*n(50 * 50) 的数字迷宫,从左上点开始走,走到右下点。 每次只能往右移一格,或者往下移一格。 每个格子,第一次到达时可以获得格子对应的数字作为奖励,再次到达则没有奖励。 问走k次这个迷宫,最大能获得多少奖励。 解析: 拆点,拿样例来说明: 3 2 1 2 3 0 2 1 1 4 2 3*3的数字迷宫,走两次最大能获得多少奖励。 将每个点拆成两个

poj 3692 二分图最大独立集

题意: 幼儿园里,有G个女生和B个男生。 他们中间有女生和女生认识,男生男生认识,也有男生和女生认识的。 现在要选出一些人,使得这里面的人都认识,问最多能选多少人。 解析: 反过来建边,将不认识的男生和女生相连,然后求一个二分图的最大独立集就行了。 下图很直观: 点击打开链接 原图: 现图: 、 代码: #pragma comment(

最大流、 最小费用最大流终极版模板

最大流  const int inf = 1000000000 ;const int maxn = 20000 , maxm = 500000 ;struct Edge{int v , f ,next ;Edge(){}Edge(int _v , int _f , int _next):v(_v) ,f(_f),next(_next){}};int sourse , mee

二分最大匹配总结

HDU 2444  黑白染色 ,二分图判定 const int maxn = 208 ;vector<int> g[maxn] ;int n ;bool vis[maxn] ;int match[maxn] ;;int color[maxn] ;int setcolor(int u , int c){color[u] = c ;for(vector<int>::iter

最大流=最小割=最小点权覆盖集=sum-最大点权独立集

二分图最小点覆盖和最大独立集都可以转化为最大匹配求解。 在这个基础上,把每个点赋予一个非负的权值,这两个问题就转化为:二分图最小点权覆盖和二分图最大点权独立集。   二分图最小点权覆盖     从x或者y集合中选取一些点,使这些点覆盖所有的边,并且选出来的点的权值尽可能小。 建模:     原二分图中的边(u,v)替换为容量为INF的有向边(u,v),设立源点s和汇点t