本文主要是介绍概率统计Python计算:随机变量的分布函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
任何随机变量 X X X都有其分布函数(或称为累积分布函数)
F ( x ) = P ( X ≤ x ) , x ∈ ( − ∞ , + ∞ ) . F(x)=P(X\leq x), x\in (-\infty,+\infty). F(x)=P(X≤x),x∈(−∞,+∞).
例1 向半径为 r r r的圆内任一投掷一个点,求此点到圆心的距离 X X X的分布函数,并计算 P ( X > r / 2 ) P(X>r/2) P(X>r/2)。
解:显然,这是一个2-维几何概型, X X X的取值范围为 [ 0 , r ] [0,r] [0,r]。当 x < 0 x<0 x<0时, X ≤ x X\leq x X≤x是个不可能事件,故 F ( x ) = P ( X ≤ x ) = 0 F(x)=P(X\leq x)=0 F(x)=P(X≤x)=0。当 x > r x>r x>r时,根据 X X X的定义, X ≤ x X\leq x X≤x是一个必然事件。故 F ( x ) = P ( X ≤ x ) = 1 F(x)=P(X\leq x)=1 F(x)=P(X≤x)=1。当 0 ≤ x ≤ r 0\leq x\leq r 0≤x≤r时, X ≤ x X\leq x X≤x为事件:投掷的点落在以 x x x为半径的圆内,故 F ( x ) = P ( X ≤ x ) = π x 2 π r 2 = x 2 r 2 F(x)=P(X\leq x)=\frac{\pi x^2}{\pi r^2}=\frac{x^2}{r^2} F(x)=P(X≤x)=πr2πx2=r2x2。于是, X X X的分布函数为
F ( x ) = P ( X ≤ x ) = { 0 x < 0 ( x r ) 2 0 ≤ x ≤ r 1 x > r . F(x)=P(X\leq x)=\begin{cases}0&x<0\\\left(\frac{x}{r}\right)^2&0\leq x\leq r\\1&x>r\end{cases}. F(x)=P(X≤x)=⎩ ⎨ ⎧0(rx)21x<00≤x≤rx>r.
而 P ( X > r / 2 ) = 1 − P ( X ≤ r / 2 ) = 1 − F ( r / 2 ) = 1 − 1 / 4 = 3 / 4 P(X>r/2)=1-P(X\leq r/2)=1-F(r/2)=1-1/4=3/4 P(X>r/2)=1−P(X≤r/2)=1−F(r/2)=1−1/4=3/4。
在Python中定义数学函数,作为自变量的参数可以是numpy的array数组类型,算得的函数值也构成一个数组。由于numpy拥有大量对数组的高效操作,故对定义分段函数带来很多方便。此外,这样定义的数学函数更便于用matplot包中的工具绘制其图形。下列Python代码定义本例中随机变量 X X X的分布函数(累积概率函数)并用以计算概率 P ( X > r / 2 ) P(X>r/2) P(X>r/2)(假定r=2)。
import numpy as np #导入numpy
def cdf(x, r):if type(x)!=type(np.array([])): #非数组类型x=np.array([x]) #凑成统一的数组类型y=np.zeros(x.size) #函数值初始化为0d=np.where((x>=0)&(x<=r)) #x中介于0~r的部分y[d]=(x[d]/r)**2 #x介于0~r对应的函数值d=np.where(x>r) #x中大于r的部分y[d]=1 #x中大于r对应的函数值if y.size==1: #单一函数值return y[0]return y #数组型函数值
print('P(X>r/2)=%.4f'%(1-cdf(x=1/2, r=2))
程序的第1行导入numpy包。为使函数既能计算单一自变量对应的函数值又能计算对应一组自变量值对应的函数值,第3~4行的if语句对单一自变量转换成数组类型,以便统一处理。第5行调用numpy的zeros函数产生一个元素均为0的数组,该函数的调用接口为
zeros(size) \text{zeros(size)} zeros(size)
其中参数size指定所产生的元素为0的数组所含的元素个数。在程序的第5行,传递给参数size的值是表示自变量的参数x的元素个数,创建一个与x等长的函数值数组y,所有元素初始化为0。
numpy的函数where,可用来计算一个数组中满足指定条件的元素对应的下标形成的序列,其调用接口为
where(condition) \text{where(condition)} where(condition)
参数condition是一个描述数组元素需满足的条件。在程序的第6行中表示自变量的参数x中值介于0~r的元素计算对应的下表序列d。第7行将y[d]中的元素置为函数值 ( x r ) 2 \left(\frac{x}{r}\right)^2 (rx)2。第8行再次将x中值大于r的元素下标序记为d,第9行将y[d]中的元素置为1。第10~11行的if语句返回单一的函数值,第12行返回数组型的函数值。第13行调用以上定义的cdf函数计算概率 P ( X > r / 2 ) P(X>r/2) P(X>r/2)。运行程序输出
P(X>r/2)=0.75
恰为 P ( X > r / 2 ) = 3 / 4 P(X>r/2)=3/4 P(X>r/2)=3/4的值。
Python的matplotlib包含有大量的数据可视化的方法。其中的pyplot对象拥有绘制各种平面图形的函数。下列代码完成绘制以上定义的 X X X的分布函数 F ( x ) F(x) F(x)对 r = 2 r=2 r=2时的图像。
from matplotlib import pyplot as plt #导入绘图对象pyplot
import numpy as np #导入numpy
x=np.linspace(-0.5, 2.5, 256) #设置自变量数组
r=2 #设置圆盘半径r为2
y=cdf(x, r) #计算函数值y
plt.plot(x, y) #绘制y=F(x)的图像
plt.show() #展示图形
程序的第1行导入matplotlib包中的pyplot。第3行调用numpy的linspace函数设置表示横坐标上的绘图范围,也就是函数 y = F ( x ) y=F(x) y=F(x)的自变量取值范围的数组。该函数的调用接口为
linspace(start, stop, num) \text{linspace(start, stop, num)} linspace(start, stop, num)
其中参数start和stop分别表示取值的起点和终点,num表示介于start和stop之间的等分点的个数。例如,程序第3行中linspace(-0.5,2.5,256)表示创建一个含有256个元素的数组x,这些元素的最小值为start,最大值为stop,相邻元素是等差的。第4行设置圆形区域半径r为2,第5行调用前面程序定义的函数cdf,传递x和r,计算cdf(x)得到的数组存于y。第6行调用pyplot的plot函数绘制函数 y = F ( x ) y=F(x) y=F(x)的图像。该函数的调用接口为:
plot(x, y) \text{plot(x, y)} plot(x, y)
其中,参数x表示横坐标的取值,y表示对应的函数值。运行程序,第7行展示如下图形。
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
代码诚可贵,原理价更高。若为AI学,读正版书好。
返回《导引》
这篇关于概率统计Python计算:随机变量的分布函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!