本文主要是介绍概率统计Python计算:连续型随机变量分布(norm),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
scipy.stats的norm对象表示正态分布,下表说明norm的几个常用函数。
函数名 | 参数 | 功能 |
---|---|---|
rvs(loc, scale, size) | loc,scale:分布参数 μ \mu μ和 σ \sigma σ,缺省值分别为0和1,size:产生的随机数个数,缺省值为1 | 产生size个随机数 |
pdf(x, loc, scale) | x:自变量取值,loc,scale:与上同 | 概率密度函数 f ( x ) f(x) f(x) |
cdf(x, loc, scale) | x,loc,scale:与上同 | 累积概率函数(分布函数) F ( x ) F(x) F(x) |
ppf(q, loc, scale) | q:分位点函数自变量,loc,scale:与上同 | 分布函数的反函数 F − 1 ( q ) F^{-1}(q) F−1(q) |
sf(x, loc, scale) | x:自变量取值,loc,scale:与上同 | 残存函数 1 − F ( x ) 1-F(x) 1−F(x) |
isf(q, loc, scale) | q:分位点函数自变量,loc,scale:与上同 | 残存函数的反函数 S − 1 ( q ) S^{-1}(q) S−1(q) |
注意norm对象的各函数的参数loc表示对称轴位置,此参数对应正态分布的参数 μ \mu μ,缺省值为0。scale表示缩放比例,对应正态分布参数的 σ 2 \sigma^2 σ2算术根 σ \sigma σ,缺省值为1。
例1 设 X X X~ N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),试计算 P ( μ − σ < X < μ + σ ) P(\mu-\sigma<X<\mu+\sigma) P(μ−σ<X<μ+σ), P ( μ − 2 σ < X < μ + 2 σ ) P(\mu-2\sigma<X<\mu+2\sigma) P(μ−2σ<X<μ+2σ)和 P ( μ − 3 σ < X < μ + 3 σ ) P(\mu-3\sigma<X<\mu+3\sigma) P(μ−3σ<X<μ+3σ)。
解:
P ( μ − σ < X < μ + σ ) = P ( − σ < X − μ < σ ) = P ( − 1 < X − μ σ < 1 ) = 2 Φ ( 1 ) − 1. P(\mu-\sigma<X<\mu+\sigma)=P(-\sigma<X-\mu<\sigma)=P\left(-1<\frac{X-\mu}{\sigma}<1\right)=2\Phi(1)-1. P(μ−σ<X<μ+σ)=P(−σ<X−μ<σ)=P(−1<σX−μ<1)=2Φ(1)−1.
相仿地可得 P ( μ − 2 σ < X < μ + 2 σ ) = 2 Φ ( 2 ) − 1 = 0.9544 P(\mu-2\sigma<X<\mu+2\sigma)= 2\Phi(2)-1=0.9544 P(μ−2σ<X<μ+2σ)=2Φ(2)−1=0.9544及 P ( μ − 3 σ < X < μ + 3 σ ) = 2 Φ ( 3 ) − 1 P(\mu-3\sigma<X<\mu+3\sigma)= 2\Phi(3)-1 P(μ−3σ<X<μ+3σ)=2Φ(3)−1。下列代码完成计算
p1=2*norm.cdf(1)-1 #计算2Phi(1)-1
p2=2*norm.cdf(2)-1 #计算2Phi(2)-1
p3=2*norm.cdf(3)-1 #计算2Phi(3)-1
print('P(mu-sigma<X<mu+sigma)=%.4f'%p1)
print('P(mu-2sigma<X<mu+2sigma)=%.4f'%p2)
print('P(mu-3sigma<X<mu+3sigma)=%.4f'%p3)
程序的第2~4行计算的是标准正态分布的分布函数在1、2、3处的值 Φ ( 1 ) \Phi(1) Φ(1)、 Φ ( 2 ) \Phi(2) Φ(2)和 Φ ( 3 ) \Phi(3) Φ(3)的值,故调用norm(第1行导入)的cdf函数并使用loc和scale参数的默认值0和1。程序运行输出:
P(mu-sigma<X<mu+sigma)=0.6827
P(mu-2sigma<X<mu+2sigma)=0.9545
P(mu-3sigma<X<mu+3sigma)=0.9973
由此可见,服从参数为 μ \mu μ和 σ 2 \sigma^2 σ2的正态分布的随机变量 X X X其值落在区间 ( μ − 3 σ , μ + 3 σ ) (\mu-3\sigma, \mu+3\sigma) (μ−3σ,μ+3σ)内几乎是肯定的事。这就是所谓的“3 σ \sigma σ法则”,其几何意义如图2-15所示。
例2 某企业准备通过招聘考试招收职工,根据考试分数,从高分到低分分别录取正式职工280人,临时工20人。报考的人数是1657,考试满分是400分。已知考试成绩 X X X~ N ( 166 , σ 2 ) N(166, \sigma^2) N(166,σ2),其中 σ 2 \sigma^2 σ2未知。此外,360分以上的高分考生31人。设某考生得256分,问他能否被录取?能否被聘为正式工?
解:由于考试成绩 X X X~ N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2),其中 μ = 166 \mu=166 μ=166, σ 2 \sigma^2 σ2未知。设 X X X的分布函数为 F ( x ) F(x) F(x)。按题意有 P ( X ≥ 360 ) = 31 / 1657 P(X\geq 360)=31/1657 P(X≥360)=31/1657,即 P ( X ≤ 360 ) = 1 − P ( X ≥ 360 ) = 1 − 31 / 1657 = 1626 / 1657 P(X\leq 360)=1-P(X\geq 360)=1-31/1657=1626/1657 P(X≤360)=1−P(X≥360)=1−31/1657=1626/1657。利用标准化
1626 1657 = P ( X ≤ 360 ) = F ( 360 ) = Φ ( 360 − 166 σ ) = Φ ( 194 σ ) . \frac{1626}{1657}=P(X\leq 360)=F(360)=\Phi\left(\frac{360-166}{\sigma}\right)=\Phi\left(\frac{194}{\sigma}\right). 16571626=P(X≤360)=F(360)=Φ(σ360−166)=Φ(σ194).
即 σ = 194 / Φ − 1 ( 1626 1657 ) \sigma=194/\Phi^{-1}\left(\frac{1626}{1657}\right) σ=194/Φ−1(16571626)。记 X X X的残存函数 S ( x ) = 1 − F ( x ) S(x)=1-F(x) S(x)=1−F(x),设录取员工的最低分数为 x 1 x_1 x1,则按题意有 S ( x 1 ) = 1 − F ( x 1 ) = P ( X ≥ x 1 ) = 300 / 1657 S(x_1)=1-F(x_1)=P(X\geq x_1)=300/1657 S(x1)=1−F(x1)=P(X≥x1)=300/1657,于是 x 1 = S − 1 ( 300 1657 ) x_1=S^{-1}\left(\frac{300}{1657}\right) x1=S−1(1657300)。相仿地,设录取的正式员工的最低分数为 x 2 x_2 x2,则 x 2 = S − 1 ( 280 1657 ) x_2=S^{-1}\left(\frac{280}{1657}\right) x2=S−1(1657280)。分别比较考生成绩与 x 1 x_1 x1, x 2 x_2 x2的大小,即可判断他是否能被录取为临时工,或正式工。下列代码完成本例计算。
from scipy.stats import norm #导入norm
mu=166 #mu=166
scor=256 #考生成绩scor
q1=31/1657 #高分概率q1
q2=300/1657 #录取概率q2
q3=280/1657 #录取为正式员工概率q3
x=norm.isf(q=q1) #x=Phi^(-1)(1-q1)
sigma=(360-mu)/x #计算sigma
x1=norm.isf(q=q2, loc=166, scale=sigma) #x1=F^(-1)(1-q2)为最低录取分数
x2=norm.isf(q=q3, loc=166, scale=sigma) #x2=F^(-1)(1-q3)正式员工最低分数
print('x1<=scor is %s'%(x1<=scor)) #比较x1与scor
print('x2<=scor is %s'%(x2<=scor)) #比较x2与scor
程序代码逐句均有注释,读者不难理解。此处着重强调第7行、第9行和第10行调用残余函数的反函数isf,分别传递 q 1 q_1 q1, q 2 q_2 q2和 q 3 q_3 q3计算 Φ − 1 ( 1 − q 1 ) \Phi^{-1}(1-q_1) Φ−1(1−q1)、 F − 1 ( 1 − q 2 ) F^{-1}(1-q_2) F−1(1−q2)和 F − 1 ( 1 − q 3 ) F^{-1}(1-q_3) F−1(1−q3)。运行程序2.14,输出:
x1<=scor is True
x2<=scor is True
这意味着该考生不但能被录取,还能成为正式工。
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
代码诚可贵,原理价更高。若为AI学,读正版书好。
返回《导引》
这篇关于概率统计Python计算:连续型随机变量分布(norm)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!