概率统计Python计算:随机变量的分布函数

2024-08-22 22:58

本文主要是介绍概率统计Python计算:随机变量的分布函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
任何随机变量 X X X都有其分布函数(或称为累积分布函数)
F ( x ) = P ( X ≤ x ) , x ∈ ( − ∞ , + ∞ ) . F(x)=P(X\leq x), x\in (-\infty,+\infty). F(x)=P(Xx),x(,+).
例1 向半径为 r r r的圆内任一投掷一个点,求此点到圆心的距离 X X X的分布函数,并计算 P ( X > r / 2 ) P(X>r/2) P(X>r/2)
:显然,这是一个2-维几何概型, X X X的取值范围为 [ 0 , r ] [0,r] [0,r]。当 x < 0 x<0 x<0时, X ≤ x X\leq x Xx是个不可能事件,故 F ( x ) = P ( X ≤ x ) = 0 F(x)=P(X\leq x)=0 F(x)=P(Xx)=0。当 x > r x>r x>r时,根据 X X X的定义, X ≤ x X\leq x Xx是一个必然事件。故 F ( x ) = P ( X ≤ x ) = 1 F(x)=P(X\leq x)=1 F(x)=P(Xx)=1。当 0 ≤ x ≤ r 0\leq x\leq r 0xr时, X ≤ x X\leq x Xx为事件:投掷的点落在以 x x x为半径的圆内,故 F ( x ) = P ( X ≤ x ) = π x 2 π r 2 = x 2 r 2 F(x)=P(X\leq x)=\frac{\pi x^2}{\pi r^2}=\frac{x^2}{r^2} F(x)=P(Xx)=πr2πx2=r2x2。于是, X X X的分布函数为
F ( x ) = P ( X ≤ x ) = { 0 x < 0 ( x r ) 2 0 ≤ x ≤ r 1 x > r . F(x)=P(X\leq x)=\begin{cases}0&x<0\\\left(\frac{x}{r}\right)^2&0\leq x\leq r\\1&x>r\end{cases}. F(x)=P(Xx)= 0(rx)21x<00xrx>r.
P ( X > r / 2 ) = 1 − P ( X ≤ r / 2 ) = 1 − F ( r / 2 ) = 1 − 1 / 4 = 3 / 4 P(X>r/2)=1-P(X\leq r/2)=1-F(r/2)=1-1/4=3/4 P(X>r/2)=1P(Xr/2)=1F(r/2)=11/4=3/4
在Python中定义数学函数,作为自变量的参数可以是numpy的array数组类型,算得的函数值也构成一个数组。由于numpy拥有大量对数组的高效操作,故对定义分段函数带来很多方便。此外,这样定义的数学函数更便于用matplot包中的工具绘制其图形。下列Python代码定义本例中随机变量 X X X的分布函数(累积概率函数)并用以计算概率 P ( X > r / 2 ) P(X>r/2) P(X>r/2)(假定r=2)。

import numpy as np                  #导入numpy
def cdf(x, r):if type(x)!=type(np.array([])):	#非数组类型x=np.array([x])				#凑成统一的数组类型y=np.zeros(x.size)				#函数值初始化为0d=np.where((x>=0)&(x<=r))		#x中介于0~r的部分y[d]=(x[d]/r)**2				#x介于0~r对应的函数值d=np.where(x>r)					#x中大于r的部分y[d]=1							#x中大于r对应的函数值if y.size==1:					#单一函数值return y[0]return y						#数组型函数值
print('P(X>r/2)=%.4f'%(1-cdf(x=1/2, r=2))

程序的第1行导入numpy包。为使函数既能计算单一自变量对应的函数值又能计算对应一组自变量值对应的函数值,第3~4行的if语句对单一自变量转换成数组类型,以便统一处理。第5行调用numpy的zeros函数产生一个元素均为0的数组,该函数的调用接口为
zeros(size) \text{zeros(size)} zeros(size)
其中参数size指定所产生的元素为0的数组所含的元素个数。在程序的第5行,传递给参数size的值是表示自变量的参数x的元素个数,创建一个与x等长的函数值数组y,所有元素初始化为0。
numpy的函数where,可用来计算一个数组中满足指定条件的元素对应的下标形成的序列,其调用接口为
where(condition) \text{where(condition)} where(condition)
参数condition是一个描述数组元素需满足的条件。在程序的第6行中表示自变量的参数x中值介于0~r的元素计算对应的下表序列d。第7行将y[d]中的元素置为函数值 ( x r ) 2 \left(\frac{x}{r}\right)^2 (rx)2。第8行再次将x中值大于r的元素下标序记为d,第9行将y[d]中的元素置为1。第10~11行的if语句返回单一的函数值,第12行返回数组型的函数值。第13行调用以上定义的cdf函数计算概率 P ( X > r / 2 ) P(X>r/2) P(X>r/2)。运行程序输出

P(X>r/2)=0.75

恰为 P ( X > r / 2 ) = 3 / 4 P(X>r/2)=3/4 P(X>r/2)=3/4的值。
Python的matplotlib包含有大量的数据可视化的方法。其中的pyplot对象拥有绘制各种平面图形的函数。下列代码完成绘制以上定义的 X X X的分布函数 F ( x ) F(x) F(x) r = 2 r=2 r=2时的图像。

from matplotlib import pyplot as plt    #导入绘图对象pyplot
import numpy as np                      #导入numpy
x=np.linspace(-0.5, 2.5, 256)           #设置自变量数组
r=2										#设置圆盘半径r为2
y=cdf(x, r)                             #计算函数值y
plt.plot(x, y)                          #绘制y=F(x)的图像
plt.show()                              #展示图形

程序的第1行导入matplotlib包中的pyplot。第3行调用numpy的linspace函数设置表示横坐标上的绘图范围,也就是函数 y = F ( x ) y=F(x) y=F(x)的自变量取值范围的数组。该函数的调用接口为
linspace(start, stop, num) \text{linspace(start, stop, num)} linspace(start, stop, num)
其中参数start和stop分别表示取值的起点和终点,num表示介于start和stop之间的等分点的个数。例如,程序第3行中linspace(-0.5,2.5,256)表示创建一个含有256个元素的数组x,这些元素的最小值为start,最大值为stop,相邻元素是等差的。第4行设置圆形区域半径r为2,第5行调用前面程序定义的函数cdf,传递x和r,计算cdf(x)得到的数组存于y。第6行调用pyplot的plot函数绘制函数 y = F ( x ) y=F(x) y=F(x)的图像。该函数的调用接口为:
plot(x, y) \text{plot(x, y)} plot(x, y)
其中,参数x表示横坐标的取值,y表示对应的函数值。运行程序,第7行展示如下图形。
在这里插入图片描述
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
代码诚可贵,原理价更高。若为AI学,读正版书好
返回《导引》

这篇关于概率统计Python计算:随机变量的分布函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1097640

相关文章

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

hdu1171(母函数或多重背包)

题意:把物品分成两份,使得价值最接近 可以用背包,或者是母函数来解,母函数(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v)(1 + x^v+x^2v+.....+x^num*v) 其中指数为价值,每一项的数目为(该物品数+1)个 代码如下: #include<iostream>#include<algorithm>

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

poj 1113 凸包+简单几何计算

题意: 给N个平面上的点,现在要在离点外L米处建城墙,使得城墙把所有点都包含进去且城墙的长度最短。 解析: 韬哥出的某次训练赛上A出的第一道计算几何,算是大水题吧。 用convexhull算法把凸包求出来,然后加加减减就A了。 计算见下图: 好久没玩画图了啊好开心。 代码: #include <iostream>#include <cstdio>#inclu

uva 1342 欧拉定理(计算几何模板)

题意: 给几个点,把这几个点用直线连起来,求这些直线把平面分成了几个。 解析: 欧拉定理: 顶点数 + 面数 - 边数= 2。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#inc

uva 11178 计算集合模板题

题意: 求三角形行三个角三等分点射线交出的内三角形坐标。 代码: #include <iostream>#include <cstdio>#include <cstdlib>#include <algorithm>#include <cstring>#include <cmath>#include <stack>#include <vector>#include <

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学