概率论中的重要不等式(Markov/Chebyshev/Jensen)

2023-11-03 19:48

本文主要是介绍概率论中的重要不等式(Markov/Chebyshev/Jensen),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.Schwarz 不等式

对于任意的随机变量\small X 和 \small Y均有

                                        \large (E[XY])^2\leq E[X^2] E[Y^2]

证明:假设\small E[Y^2]\neq 0,否则\small P(Y=0)=1,有\small E(XY)=0,所以不等式成立。我们有

                                \large \begin{align} 0 & \leq E[(X-\frac{E[XY]}{E[Y^2]}Y)^2] \nonumber \\ & = E[X^2-2\frac{E[XY]}{E[Y^2]}XY+\frac{(E[XY])^2}{(E[Y^2])^2}Y^2] \nonumber \\ & = E[X^2]-2\frac{E[XY]}{E[Y^2]}E[XY]+\frac{(E[XY])^2}{(E[Y^2])^2}E[Y^2]\nonumber \\ & = E[X^2]-\frac{(E[XY])^2}{E[Y^2]}\nonumber \end{align}

即  \large (E[XY])^2\leq E[X^2] E[Y^2].

2. Markov不等式

设随机变量 \small X 只取非负值,则对任意的 \small a> 0,

                                                \large P(X\geq a)\leq \frac{E[X] }{a}

证明:固定正数\small a,定义一个随机变量\small Y_a

                                                \large Y_a= \left\{\begin{matrix} 0, \quad if \quad X< a \\ a, \quad if \quad X\geq a \end{matrix}\right.

易知,\small Y_a\leq X 总成立,从而有

                                                \large E[Y_a]\leq E[X]

另一方面

                                        \large E[Y_a]=aP(Y_a=a)=aP(X\geq a)  ,

所以

                                                \large aP(X\geq a)\leq E[X]

粗略的讲,该不等式是指,一个非负随机变量,如果均值很小,则该随机变量取大值的概率也非常小.

3.Chebyshev不等式

设随机变量\small X 的均值为\small \mu,方差为\small \sigma ^2,则对任意的\small c> 0

        ​​​​​​​        ​​​​​​​        ​​​​​​​                \large P(|X- \mu|\geq c)\leq \frac{\sigma ^2}{c^2}

证明:考虑非负随机变量\small (X-\mu)^2,令\small a=c^2,使用上述马尔可夫不等式,可得

        ​​​​​​​        ​​​​​​​        ​​​​​​​        \large P(|X- \mu|^2\geq c^2)\leq\frac{E[(X-\mu)^2]}{c^2} =\frac{\sigma ^2}{c^2}

注意,事件\small |X- \mu|^2\geq c^2 等价于事件\small |X- \mu|\geq c,所以

                                \large P(|X- \mu|\geq c)=P(|X- \mu|^2\geq c^2)\leq\frac{\sigma ^2}{c^2}

也可不使用马尔可夫不等式,证明如下.

设​​​​​​​\small X 是连续型随机变量,定义函数

                                                \large g(x)= \left\{\begin{matrix} 0, \quad if \quad |x -\mu|< c \\ c^2, \quad if \quad |x -\mu|\geq c \end{matrix}\right.

注意,对于任意的\small x, \small \small (x-\mu)^2\geq g(x),所以

        ​​​​​​​        ​​​​​​​\sigma ^2=\int_{-\infty}^{+\infty}(x-\mu)^2f_X(x)dx\geq \int_{-\infty}^{+\infty}g(x)f_X(x)dx=c^2P(|x-\mu|\geq c)

\small c=k\sigma,其中 \small k 是正数,则得到切比雪夫不等式的另一个版本:

                                \large P(|X- \mu|\geq k\sigma)\leq \frac{\sigma ^2}{k^2\sigma^2}=\frac{1}{k^2}

所以一个随机变量的取值偏离其均值 \large k 倍标准差的概率最多是\small 1/k^2.

粗略的讲,切比雪夫不等式是指,如果一个随机变量的方差非常小,那么该随机变量则远离均值\mu的概率也非常小.需要注意的是,切比雪夫不等式并不要求所涉及的随机变量非负.

4.Jensen不等式

如果 f 是一个凸函数,X 是随机变量,则

                                E[f(X)]\geq f(E[X])

证明:因为f是凸函数,那么它的二阶导在 x 的定义域内是非负的,所以它的一阶导一定是非降,应用积分原理可得

        ​​​​​​​        \small f(x)=f(a)+\int_{a}^{x}\frac{\mathrm{d} f}{\mathrm{d} t}(t)dt\geq f(a)+\int_{a}^{x}\frac{\mathrm{d} f}{\mathrm{d} t}(a)dt\geq f(a)=f(a)+(x-a)\frac{\mathrm{d} f}{\mathrm{d} x}a

由于上述不等式对随机变量X的所有的可能取值x都成立,所以

        ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​        \small f(a)+(X-a)\frac{\mathrm{d} f}{\mathrm{d} x}a\leq f(X)

\small a=E[X],并在上式两边取期望,可得

                                \small f(E[X])+(E[X]-E[X])\frac{\mathrm{d} f}{\mathrm{d} x}(E[X])\leq E[f(X)]

                                                \small f(E[X])\leq E[f(X)]

另外一种证明方法采用数学归纳法证明如下.

这篇关于概率论中的重要不等式(Markov/Chebyshev/Jensen)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/340480

相关文章

Cmake之3.0版本重要特性及用法实例(十三)

简介: CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏: 多媒体系统工程师系列【原创干货持续更新中……】🚀 优质视频课程:AAOS车载系统+AOSP14系统攻城狮入门视频实战课 🚀 人生格言: 人生从来没有捷径,只有行动才是治疗恐惧

研究生生涯中一些比较重要的网址

Mali GPU相关: 1.http://malideveloper.arm.com/resources/sdks/opengl-es-sdk-for-linux/ 2.http://malideveloper.arm.com/resources/tools/arm-development-studio-5/ 3.https://www.khronos.org/opengles/sdk/do

平时工作学习重要注意的问题

总体原则:抓住重点,条理清晰,可回溯,过程都清楚。 1 要有问题跟踪表,有什么问题,怎么解决的,解决方案。 2 要有常用操作的手册,比如怎么连sqlplus,一些常用的信息,保存好,备查。

机械学习—零基础学习日志(概率论总笔记5)

引言——“黑天鹅” 要获得95%以上置信度的统计结果,需要被统计的对象出现上千次,但是如果整个样本只有几千字,被统计的对象能出现几次就不错了。这样得到的数据可能和真实的概率相差很远。怎么避免“黑天鹅”? 古德-图灵折扣估计法 在词语统计中,有点词语虽然是出现0次,但是实际的出现概率并不是永远不可能的零。 那需要把一些概率转移给到这些词语。 古德的做法实际上就是把出现1次的单词的总量,给了

matlab一些基本重要的指令

重点内容 运行MATLAB的帮助demo,在Command Window 输入 “demo”,或在Launch Pad 选项卡“demos” 任何时候都可以: 清除Command Window内容:clc 清除Figure Window(图形窗口) clf 清除workspace 变量内容: clear 注意:M脚本文件和输入指令中的变量都在workspace中,为避免变量冲突,一般在

Post-Training有多重要?一文带你了解全部细节

1. 简介 随着LLM学界和工业界日新月异的发展,不仅预训练所用的算力和数据正在疯狂内卷,后训练(post-training)的对齐和微调方法也在不断更新。InstructGPT、WebGPT等较早发布的模型使用标准RLHF方法,其中的数据管理风格和规模似乎已经过时。近来,Meta、谷歌和英伟达等AI巨头纷纷发布开源模型,附带发布详尽的论文或报告,包括Llama 3.1、Nemotron 340

C++数据结构重要知识点(5)(哈希表、unordered_map和unordered_set封装)

1.哈希思想和哈希表 (1)哈希思想和哈希表的区别 哈希(散列、hash)是一种映射思想,本质上是值和值建立映射关系,key-value就使用了这种思想。哈希表(散列表,数据结构),主要功能是值和存储位置建立映射关系,它通过key-value模型中的key来定位数组的下标,将value存进该位置。 哈希思想和哈希表数据结构这两个概念要分清,哈希是哈希表的核心思想。 (2)unordered

C++重要知识点拾忆

一:内联函数 函数调用也会带来降低效率的问题,因为调用函数实际上将程序执行顺序转移到函数所存放在内存中某个地址,将函数的程序内容执行完后,再返回到转去执行该函数前的地方。这种转移操作要求在转去前要保护现场并记忆执行的地址,转回后先要恢复现场,并按原来保存地址继续执行。 因此,函数调用要有一定的时间和空间方面的开销,于是将影响其效率。特别是对于一些函数体代码不是很大,但又频繁地被调用的函数

Google play最新政策更新和重要提醒

我们都知道,谷歌会定期更新其政策,而政策的变更通常对开发者及其团队的要求会更为严格,也会增加应用上架的一些限制条件,以此提高应用在谷歌商店的质量。 一起来看看Google play最近的一些政策更新和需要注意的地方。 新政策要求 对于提供金融产品和服务、健康服务、VPN、政府相关服务的开发者,需要注册为“企业”开发者账号才能提审上架应用。 Google play这个举措主要

网站品牌为何对于SEO排名如此重要?

为什么你网站没有排名,因为你网站的品牌不够,你想一下,同样一个产品关键词,你要是百度,你会给京东,还是给一个不知名的小公司,所以品牌是决定百度SEO排名最重要的因素之一。 你可能还是不能够理解,为何还有很多不知名的网站排名一样非常好,百度排名是根据综合因素给出排名的,只是品牌是排名的重要因素之一。而判断品牌,百度也是根据综合因素来判断,我们还是从头说起。 医疗行业为什么难做排名 我想医