统计学2:随机变量分布规律(二项分布、泊松分布、正态分布)

本文主要是介绍统计学2:随机变量分布规律(二项分布、泊松分布、正态分布),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、离散型随机变量的分布规律:二项分布、泊松分布(Binomial Distribution, Poisson Distribution)

-二项分布(Binomial Distribution)泊松分布(Poisson Distribution)
怎么计算? X ∼ B ( n , p ) P ( X = k ) = C n k p k q n − k X\sim B\left(n,p\right)\ \ \ P\left(X=k\right)=C_n^kp^kq^{n-k} XB(n,p)   P(X=k)=Cnkpkqnk X ∼ B ( λ ) P ( X = k ) = λ k k ! e − λ E ( X ) = V a r ( X ) = λ X\sim B\left(\lambda\right)\ \ \ P\left(X=k\right)=\frac{\lambda^k}{k!}e^{-\lambda}\\E\left(X\right) =Var\left(X\right) =\lambda XB(λ)   P(X=k)=k!λkeλE(X)=Var(X)=λ
如何判断是否适用? 1 ) 做 某 件 事 的 次 数 固 定 , 为 n 2 ) 每 件 事 有 两 种 结 果 3 ) 每 次 成 功 的 概 率 相 等 , 为 p 4 ) 在 n 次 试 验 中 , 计 算 成 功 k 次 的 概 率 1) 做某件事的次数固定,为n \\2)每件事有两种结果\\3)每次成功的概率相等,为p\\4)在n次试验中,计算成功k次的概率 1)n2)3)p4)nk 1 ) 事 件 是 独 立 事 件 2 ) 任 意 相 同 的 时 间 范 围 内 或 任 意 相 同 的 区 域 范 围 内 , 事 件 发 生 的 概 率 相 同 , 为 λ 3 ) 在 某 个 时 间 范 围 内 , 计 算 发 生 某 件 事 k 次 的 概 率 1)事件是独立事件\\2)任意相同的时间范围内或任意相同的区域范围内,事件发生的概率相同,为\lambda\\3)在某个时间范围内,计算发生某件事k次的概率 12)λ3)k
举个栗子 1 ) 抛 5 次 硬 币 , 求 2 次 正 面 朝 上 的 概 率 1) 抛5次硬币,求2次正面朝上的概率 1)52 1 ) 求 一 个 月 内 某 机 器 损 坏 10 次 的 概 率 2 ) 求 一 个 路 段 一 小 时 内 经 过 9 辆 车 的 概 率 1)求一个月内某机器损坏10次的概率\\2)求一个路段一小时内经过9辆车的概率 1102)9

X:随机变量

期望值和均值
在总体样本量未知时使用期望值计算总体样本均值
二项分布的期望值: E ( x ) = n p E\left(x\right) =np E(x)=np

二项分布
二项式系数公式
( n k ) = C n k = n ! k ! ( n − k ) ! \binom{n}{k}=C^k_n=\frac{n!}{k!\left(n-k\right)!} (kn)=Cnk=k!(nk)!n!

二项分布与泊松分布
泊松分布公式的推导就是将一段时间范围无限等分,使得每次事件发生都在一个等分的时间范围内,这时这些时间段内发生事件与否就遵循二项分布

泊松分布的推导过程(摘自https://jentchang.github.io/2019/01/01/stats-25/)

在这里插入图片描述
在这里插入图片描述

2、连续型随机变量的分布规律:概率密度函数、正态分布(Normal Distribution/ Gaussian Distribution/Bell Curve)

1)正态分布密度函数
X ∼ N ( μ , σ 2 ) P ( X ) = 1 σ 2 π e − 1 2 ( x − μ σ ) 2 X\sim N\left({\mu,\sigma^2}\right)\ \ \ P\left(X\right)=\frac{1}{\sigma\sqrt{2\pi}}^{e^{-\frac{1}{2}}\left(\frac{x-\mu}{\sigma}\right)^2} XN(μ,σ2)   P(X)=σ2π 1e21(σxμ)2
其中标准z分数: z = x − μ σ z=\frac{x-\mu}{\sigma} z=σxμ
在这里插入图片描述
X ∼ N ( 0 , 1 ) X\sim N\left({0,1}\right) XN(0,1)为标准正态分布
在概率密度函数的图像中,纵轴为概率密度,概率是对应的面积

2)正态分布密度函数的特点

  • 均值μ为对称轴。
  • 标准差σ表示图形的宽窄,标准差越小,数值越向平均值靠拢(可以理解为标准差是到均值的平均距离)
  • 二项分布是有限的,正态分布在整个实轴上都有定义,即概率密度不会等于0。(尽管延伸出去概率极小,但也是存在的)

3)经验法则
P ( μ − σ &lt; X &lt; μ + σ ) = 68 % P\left(\mu-\sigma&lt;X&lt;\mu+\sigma\right)=68\% P(μσ<X<μ+σ)=68%
P ( μ − 2 σ &lt; X &lt; μ + 2 σ ) = 95 % P\left(\mu-2\sigma&lt;X&lt;\mu+2\sigma\right)=95\% P(μ2σ<X<μ+2σ)=95%
P ( μ − 3 σ &lt; X &lt; μ + 3 σ ) = 99.7 % P\left(\mu-3\sigma&lt;X&lt;\mu+3\sigma\right)=99.7\% P(μ3σ<X<μ+3σ)=99.7%

在这里插入图片描述
4)正态分布的近似
在这里插入图片描述

3、 python实现正态分布(待补充)

参考资料:

可汗学院统计学:https://www.bilibili.com/video/av7199273/?p=73
简客:https://jentchang.github.io/contents/math/statistical.html
《深入浅出统计学》

这篇关于统计学2:随机变量分布规律(二项分布、泊松分布、正态分布)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/236292

相关文章

计蒜客 Half-consecutive Numbers 暴力打表找规律

The numbers 11, 33, 66, 1010, 1515, 2121, 2828, 3636, 4545 and t_i=\frac{1}{2}i(i+1)t​i​​=​2​​1​​i(i+1), are called half-consecutive. For given NN, find the smallest rr which is no smaller than NN

hdu 6198 dfs枚举找规律+矩阵乘法

number number number Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Problem Description We define a sequence  F : ⋅   F0=0,F1=1 ; ⋅   Fn=Fn

全英文地图/天地图和谷歌瓦片地图杂交/设备分布和轨迹回放/无需翻墙离线使用

一、前言说明 随着风云局势的剧烈变化,对我们搞软件开发的人员来说,影响也是越发明显,比如之前对美对欧的软件居多,现在慢慢的变成了对大鹅和中东以及非洲的居多,这两年明显问有没有俄语或者阿拉伯语的输入法的增多,这要是放在2019年以前,一年也遇不到一个人问这种需求场景的。 地图应用这块也是,之前的应用主要在国内,现在慢慢的多了一些外国的应用场景,这就遇到一个大问题,我们平时主要开发用的都是国内的地

CF#284 (Div. 2) C.(几何规律)

题目链接:http://codeforces.com/contest/499/problem/C 解题思路: 把两个点的坐标分别带入方程组,如果最后两个值相乘为负,即异号,计数器++。其中有一个有趣的现象,从A到B的最短步数,可以变化为求A和B之间夹了多少条直线,那么最后只要求出直线数,即可求出最小步数。 如果一条直线夹在A和B中间,那么把A和B的坐标带入后,所得值相乘一定为负。数据很

HDU2524(规律推导)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2524 解题思路: 暴力推出矩阵,以n = 2 , m = 4为例: 1 3  6  10 3 9 18 30 可以发现第一行和第一列都是有规律的,彼此相差2、3、4·····,其他元素为相应行第一个元素乘以第一列元素的积。预处理之后,我们O(1)就可以输出g[n][m]的值。 另外,

HDU 1097 A hard puzzle(规律)

题目: http://acm.hdu.edu.cn/showproblem.php?pid=1097 题意: 求a的b次方的最后一位。 题解: 直接从例子入手, 第一组数据 7 66,结果如下(只要最后一位所以模10) 7 9 3 1 7 9··· 循环节为4,即结果在4个数值内循环出现。 第二组数据 6 800,结果如下 6 6 6 6··· 循环节为1 ···

统计学(贾俊平)学习笔记--第三章、 数据预处理

数据预处理无论是从数据分类分析、数据信息抽取、数据挖掘、模型建立等方面都是需要的,也是数据工作者最开始招手做的,而统计学(贾俊平)中从理论的角度讲解了数据预处理的概念和方法吗,在此将主要要点列举如下,供有心人参考学些。       数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。          审核就是检查数据中是否有错误。从完整性和准

【科普知识】一体化电机掉电后“位置精准复位“机制与规律

在工业自动化、机器人技术及精密控制领域,电机作为核心执行元件,其稳定运行和精确控制对于整个系统的性能至关重要。 然而,电机在运行过程中可能会遭遇突然断电的情况,这会导致电机失去驱动力并停止在当前位置,甚至在某些情况下发生位置偏移。 因此,电机掉电后的位置恢复机制成为了一个关键技术问题。本文将探讨电机掉电后位置恢复的原理机制,以期为相关领域的研究与应用提供参考。 一、电机掉电后的位置偏移现象

密码(规律题)

链接: https://www.nowcoder.com/acm/contest/90/K 来源:牛客网 题目描述 ZiZi登录各种账号的时候,总是会忘记密码,所以他把密码都记录在一个记事本上。其中第一个密码就是牛客网的密码。 牛客网专注于程序员的学习、成长及职位发展,连接C端程序员及B端招聘方,通过IT笔试面试题库、在线社区、在线课程等提高候选人的求职效率,通过在线笔试