概率统计Python计算:假设检验应用——分布拟合检验

2024-08-22 22:48

本文主要是介绍概率统计Python计算:假设检验应用——分布拟合检验,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
对来自总体 X X X的样本 X 1 , X 2 , ⋯ , X n X_1,X_2,\cdots,X_n X1,X2,,Xn,及给定的显著水平 α \alpha α检验假设 H 0 : X 的分布函数为 F ( x ) ( H 1 : X 的分布函数不是 F ( x ) ) . H_0:X\text{的分布函数为}F(x)(H_1:X\text{的分布函数不是}F(x)). H0:X的分布函数为F(x)(H1:X的分布函数不是F(x)).其中, F ( x ) F(x) F(x)是已知分布类型的分布函数(或分布律),含有 r r r个未知参数。为此,需要将 ( − ∞ , + ∞ ) (-\infty,+\infty) (,+)划分成 k ≤ n k\leq n kn个区间 A 1 , A 2 , ⋯ , A k A_1,A_2,\cdots,A_k A1,A2,,Ak,统计样本中落入每个区间 A i A_i Ai中的频数 f i f_i fi并按假设中的分布函数 F ( x ) F(x) F(x)(用未知参数的最大似然统计量值替代对应参数)计算概率 p i = P ( X ∈ A i ) p_i=P(X\in A_i) pi=P(XAi)。利用这些数据,调用scipy.stats包中的函数
chisquare(f_obs, f_exp, ddof=0) \text{chisquare(f\_obs, f\_exp, ddof=0)} chisquare(f_obs, f_exp, ddof=0)
即可算得检验假设 H 0 H_0 H0的p值。该函数的参数f_obs表示上述样本频数序列 { f 1 , f 2 , ⋯ , f k } \{f_1,f_2,\cdots,f_k\} {f1,f2,,fk},f_exp表示假设总体概率序列 { n p 1 , n p 2 , ⋯ , n p k } \{np_1,np_2,\cdots,np_k\} {np1,np2,,npk},ddof表示假设总体所含的未知参数个数 r r r,缺省值为0。该函数的返回值包括两个数据:表示检验统计量值 χ 2 = ∑ i = 1 k ( f i − n p i ) 2 n p i \chi^2=\sum\limits_{i=1}^k\frac{(f_i-np_i)^2}{np_i} χ2=i=1knpi(finpi)2的chisq,和表示检验p值 S ( χ 2 ) = 1 − F ( χ 2 ) S(\chi^2)=1-F(\chi^2) S(χ2)=1F(χ2)的p,其中 F ( x ) F(x) F(x) S ( x ) S(x) S(x)分别为 χ 2 ( k − 1 − r ) \chi^2(k-1-r) χ2(k1r)分布的分布函数和残存函数。
例1在一实验中,每隔一定时间观察一次由某种铀所放射的到达计数器上的 α \alpha α粒子数 X X X,共观察了100次,得结果如下表:

i i i01234567891011 ≥ \geq 12
f i f_i fi15161726119921210
A i A_i Ai A 0 A_0 A0 A 1 A_1 A1 A 2 A_2 A2 A 3 A_3 A3 A 4 A_4 A4 A 5 A_5 A5 A 6 A_6 A6 A 7 A_7 A7 A 8 A_8 A8 A 9 A_9 A9 A 10 A_{10} A10 A 11 A_{11} A11 A 12 A_{12} A12

其中, f i f_i fi是观察到有 i i i α \alpha α粒子的次数,从理论上考虑知 X X X应服从泊松分布 π ( λ ) \pi(\lambda) π(λ),问此判断是否符合实际(取 α = 0.05 \alpha=0.05 α=0.05)?
解: 下列代码完成本例中假设 H 0 : X H_0:X H0:X~ π ( λ ) \pi(\lambda) π(λ)的检验。

from scipy.stats import poisson, chisquare  #导入poisson, chisquare
import numpy as np                          #导入numpy
n=100                                       #样本容量
alpha=0.05                                  #显著水平
f=np.array([1,5,16,17,26,11,9,9,2,1,2,1,0]) #样本数据频数
k=f.size                                    #区间个数
r=1                                         #总体未知参数个数
x_bar=(np.arange(k)*f).sum()/n              #总体均值的最大似然估计值
p=[poisson.pmf(i,x_bar) for i in range(k-1)]#各区间内概率
p.append(1-sum(p))
p=np.array(p)
_, pv=chisquare(f, p*n, r)                  #检验p值
print('H0 is %s'%(pv>=alpha))

程序的第3~5行按题面设置各项数据。第6行计算区间个数k,第7行设置未知参数个数r,第8行计算假设中总体所含未知参数 λ \lambda λ的最大似然估计值x_bar。第9行计算概率 p i = λ i i ! e − λ , i = 0 , 1 , ⋯ , k − 2 p_i=\frac{\lambda^i}{i!}e^{-\lambda},i=0,1,\cdots,k-2 pi=i!λieλ,i=0,1,,k2,第10行计算 p k − 1 = 1 − ∑ i = 0 k − 2 p i p_{k-1}=1-\sum\limits_{i=0}^{k-2}p_i pk1=1i=0k2pi,第11行将算得的 p 0 , p 1 , ⋯ , p k − 1 p_0,p_1,\cdots,p_{k-1} p0,p1,,pk1构造成数组p。第12行调用函数chisquare,传递参数f(各区间内样本数据频数),n*p(序列 n p 0 , n p 1 , ⋯ , n p k − 1 np_0,np_1,\cdots,np_{k-1} np0,np1,,npk1)和r(未知参数个数),计算假设 H 0 : X H_0:X H0:X~ π ( λ ) \pi(\lambda) π(λ)的检验p值(由于此处我们并不需要检验统计量值,故用下划线将chisq屏蔽)。运行程序,输出

H0 is True.

表示接受假设 H 0 : X H_0:X H0:X~ π ( λ ) \pi(\lambda) π(λ)
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
代码诚可贵,原理价更高。若为AI学,读正版书好
返回《导引》

这篇关于概率统计Python计算:假设检验应用——分布拟合检验的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1097621

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、