假设检验:以样本服从二项分布举例

2024-01-21 03:04

本文主要是介绍假设检验:以样本服从二项分布举例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 假设检验
    • 一、假设检验的思想
    • 二、假设检验的基本步骤
      • 1. 确定要进行检验的假设
      • 2. 选择检验统计量
      • 3. 确定用于做决策的拒绝域
      • 4. 求出检验统计量的值
      • 5. 查看样本结果是否位于拒绝域内
      • 6. 做出决策
    • 三、举例说明
      • 例子1——某公司治疗打鼾
      • 例子2——女士品茶的故事

假设检验

一、假设检验的思想

假设检验的基本思想是 “小概率事件”原理 ,其统计推断方法是带有某种概率性质的反证法。小概率思想是指小概率事件在一次试验中基本上不会发生
反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设H0是否正确,首先假定该假设H0正确,然后根据样本对假设H0做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设H0,否则应接受假设H0。

“小概率事件”的概率越小,否定原假设H0就越有说服力,常记这个概率值为 α(0<α<1),称为检验的显著性水平。对于不同的问题,检验的显著性水平α不一定相同,一般认为,事件发生的概率小于0.1、0.05或0.01等,即“小概率事件” 。

二、假设检验的基本步骤

1. 确定要进行检验的假设

  • 零假又称原假设,符号是H0。
    零假设成立时,有关统计量应服从已知的某种概率分布。
  • 备择假设的符号是H1 。

预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01 。

2. 选择检验统计量

根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等 。

3. 确定用于做决策的拒绝域

我们把拒绝域的分界点称为“c”——临界值。定下“显著性水平”后,临界值大小一般可通过查阅相应的界值表得到。
能够拒绝原假设的检验统计量的所有可能取值的集合,称为拒绝域
在构建拒绝域的时候,还要明白一件事,所构建的是 “单边检验” 还是 “双边检验”
单边检验分为左边和右边
在这里插入图片描述
判断依据:
【左边】
如果备选假设包含<符号,则使用左尾,此时拒绝域位于数据的左端
【右边】
如果备选假设包含>符号,则使用右尾,此时拒绝域位于数据的右端
【双边检验】
如果备选假设包含≠符号,则使用双尾检验
即将拒绝域一分为二位于数据两侧,两侧各占α/2,总和为α

不能够拒绝原假设的检验统计量的所有可能取值的集合称为接受域
根据给定的显著性水平确定的拒绝域的边界值,称为临界值

4. 求出检验统计量的值

5. 查看样本结果是否位于拒绝域内

统计量与临界值比较。

6. 做出决策

如果统计量不在拒绝域,不拒绝H0;如果统计量在拒绝域,拒绝H0,接受H1

三、举例说明

例子1——某公司治疗打鼾

某公司声称他们发明了一种治疗打鼾的新药物鼾克,并断言能在两周内治愈90%的患者。随机抽取了15位鼻鼾患者,看他们使用新药物鼾克后是否不再打鼾。结果如下:
在这里插入图片描述
先假设制药公司的断言属实,然后看医生得到的结果是否有误。作出决策:根据证据,接受或否定制药公司的断言。通常以上过程称为假设检验——做出假设或断言,对照证据进行检验。假设检验的一般步骤如下:

第1步:确定假设
我们所检验的这个断言被称为原假设,用H0表示。那么鼾克的这个原假设就是:
H0:p=0.9
那么鼾克的这个备择假设就是:
H1:p<0.9
:在进行假设检验时,你假定原假设为真,如果有足够的证据反驳原假设,则拒绝原假设,接受备选假设。原假设处于一种被保护的地位。

第2步:选择检验统计量
确定检验内容以后,就需要通过某些手段进行检验,这可以借助检验统计量实现。

我们做假设检验的目的是检验药物的治愈率是否达到90%以上,为此可以根据制药公司的说法查看概率分布,看看抽样中的成功次数是否显著。

如果用X表示样本人数,样本中共有15名患者,成功概率为90%,由于X符合二项式分布,于是检验统计量符合:
X~B(15,0.9)

第3步:确定拒绝域
假设检验的拒绝域是一组数值,这组数值给出反驳原假设的最极端证据。我们把拒绝域的分界点称为——临界值。

那么如何求解拒绝域呢?在求解拒绝域之前我们得确定下显著性水平。若我们想以5%为显著性水平检验制药公司的断言,这说明我么选取的的拒绝域应使得“鼻鼾患者治愈人数小于k”的概率小于0.05,即概率分布最低端的5%部分。

我们对鼾克使用的是单边检验,由于备择假设为p<0.9,因此拒绝域位于左边。
P(X<k)<α
α=5%

第4步:求出检验统计量的值
P(X≤11)=1-P(X≥12)
=1-(P(X=12)+P(X=13)+P(X=14)+P(X=15))
=1-(0.1285+0.2669+0.3432+0.2059)
=1-0.9445 =0.0555

第5步:样本结果是否位于拒绝域内

因为 P(X≤11) =0.0555 >0.05 ,所以P没有落在拒绝域内。

第6步:作出决策

因为假设检验的P值落在检验的拒绝域外,因此没有充分证据可以拒绝原假设H0,原假HO成立,所以我们接收制药公司治愈率为90%的断言。

例子2——女士品茶的故事

1920年的剑桥大学,某个风和日丽的下午,一群科学家正悠闲地享受下午茶时光。正如往常一样准备冲泡奶茶的时候,有位女士突然说:“冲泡的顺序对于奶茶的风味影响很大。先把茶加进牛奶里,与先把牛奶加进茶里,这两种冲泡方式所泡出的奶茶口味截然不同。我可以轻松地辨别出来。”在场的绝大多数人对这位女士的“胡言乱语”嗤之以鼻。然而,其中一位身材矮小、戴着厚眼镜的先生却不这么看,他对这个问题很有兴趣。这个人就是费歇尔(R. A. Fisher)。
他首先假该设女士没有这个能力(这个假设被称为原假设)。随后,Fisher将8杯已经调制好的奶茶随机地放到那位女士的面前,看看这位女士能否正确地品尝出不同的茶。

第1步:确定假设
H0:女士没有这个能力(每次分辨正确的概率P为0.5)
p=0.5
H1:女士有这个能力
p>0.5

第2步:选择检验统计量
用字母p表示该女士每次答对的概率,用随机变量k表示女士答对的次数;在n次实验中,女士答对k次的概率可以用二项分布来描述:
在这里插入图片描述
检验统计量符合
X~B(15,0.9)

在原假设下,女士并没有鉴别的能力,能否答对完全靠蒙——此时,p=0.5(类似于抛硬币)。

我们可以计算出 女士答对k次的概率,如下图2所示:
在这里插入图片描述
第3步:确定拒绝域
根据备用假设可知是单边检验的右边检验:
P(X>k)<α
α=5%
第4步:求出检验统计量的值
P(x>=8)=0.39%
第5步:样本结果是否位于拒绝域内
P(x>=8)=0.0039<0.05,统计量没有落在拒绝域内。
第6步:作出决策

因为假设检验的统计值P落在检验的拒绝域,当小概率事件发生时,我们有足够的理由怀疑原假设H0的正确性,因而我们拒绝原假设,接受备用假设H1,即女士有这个能力。

这篇关于假设检验:以样本服从二项分布举例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/628172

相关文章

医院检验系统LIS源码,LIS系统的定义、功能结构以及样本管理的操作流程

本文将对医院检验系统LIS进行介绍,包括LIS系统的定义、功能结构以及样本管理的操作流程方面。 LIS系统定义 LIS系统(Laboratory Information System)是一种专门为临床检验实验室开发的信息管理系统,其主要功能包括实验室信息管理、样本管理、检验结果管理、质量控制管理、数据分析等。其主要作用是管理医院实验室的各项业务,包括样本采集、检验、结果录入和报告生成等。Li

PDF样本图册转换为一个二维码,随时扫码打开无需印刷

在这个数字化时代,纸质样本图册已成为过去。如今,一切都变得触手可及,包括我们的PDF样本图册。想象一下,将这些图册转换为一个二维码,让客户随时扫码打开,无需印刷,这将带来多大的便利和环保效益!接下来就让我来教你如何轻松实现PDF样本图册到二维码的转换,让您与时俱进,走在环保科技的前沿吧。 1. 准备好制作工具:FLBOOK在线制作电子杂志平台 2. 转换文档:点击开始

论文速读|利用局部性提高机器人操作的样本效率

项目地址:SGRv2  本文提出了SGRv2,一个系统的视觉运动政策框架,通过整合动作局部性提高了样本效率。在多个模拟和真实世界环境中进行的广泛评估表明,SGRv2在数据有限的情况下表现出色,并且在不同的控制模式下保持一致的性能。未来的工作可以进一步探索将扩散政策与局部性框架结合,以增强在现实世界中的性能,并扩展泛化测试的范围。 论文初读:

在目标检测模型中使用正样本和负样本组成的损失函数。

文章目录 背景例子说明1. **样本和标签分配**2. **计算损失函数**3. **组合损失函数** 总结 背景 在目标检测模型中,损失函数通常包含两个主要部分: 分类损失(Classification Loss):用于评估模型对目标类别的预测能力。定位损失(Localization Loss):用于评估模型对目标位置的预测准确性。 例子说明 假设我们有一个目标检测模

R-Adapter:零样本模型微调新突破,提升鲁棒性与泛化能力 | ECCV 2024

大规模图像-文本预训练模型实现了零样本分类,并在不同数据分布下提供了一致的准确性。然而,这些模型在下游任务中通常需要微调优化,这会降低对于超出分布范围的数据的泛化能力,并需要大量的计算资源。论文提出新颖的Robust Adapter(R-Adapter),可以在微调零样本模型用于下游任务的同时解决这两个问题。该方法将轻量级模块集成到预训练模型中,并采用新颖的自我集成技术以提高超出分布范围的鲁棒性

学术分享|无惧数据匮乏!上海交大博士后周子宜详解蛋白质语言模型的小样本学习方法 FSFP

预训练蛋白质语言模型 (PLMs) 能够以无监督的方式学习数百万蛋白质中氨基酸序列的分布特征,在揭示蛋白质序列与其功能之间的隐含关系方面显示出了巨大的潜力。 在此背景下,上海交通大学自然科学研究院/物理天文学院/张江高研院/药学院洪亮教授课题组,联合上海人工智能实验室青年研究员谈攀,开发了一种针对蛋白质语言模型的小样本学习方法,能够在使用极少数湿实验数据的情况下大幅提升传统蛋白质语言模型的突变效

零样本学习(zero-shot learning)——综述

-------本文内容来自对论文A Survey of Zero-Shot Learning: Settings, Methods, and Applications 的理解和整理,这里省去了众多的数学符号,以比较通俗的语言对零样本学习做一个简单的入门介绍,用词上可能缺乏一定的严谨性。一些图和公式直接来自于论文,并且省略了论文中讲的比较细的东西,如果感兴趣建议还是去通读论文 注1:为了方便,文中

CVPR2019 少样本学习

分类任务上的少样本学习 1.Edge-Labeling Graph Neural Network for Few-shot Learning(classification) paper: https://arxiv.org/abs/1905.01436 code: https://github.com/khy0809/fewshot-egnn 图网络(Graph Neural Ne

incr命令和expire命令的误区--举例每分钟访问次数限制

要实现的功能:限制用户的每分钟的访问次数 一个有严重bug的代码:每次访问来了,就执行代码块二,当第一次访问,就走else语句,设置当前用户的次数为1,且设置该key的有效期是一分钟。 在一分钟之内,第二次来访问了,就走if语句了,因为redis存在这个key了,就实现自增一,然后取出来判断是否超过了设定的阈值。逻辑上看似看似没什么问题。 代码块一: Long maxAllowedTimes

中断处理流程举例(21)

中断流程的截图: 下面主要就是解释这张图: 当中断发生之后,首先是硬件,保存CPSR到SPSR,设置CPSR的 0-4位, 第5位, 关闭中断,保存返回地址,然后跳转到中断地址处,这里由于是中断,所以跳转到 0x18处, -------> 然后是保存现场寄存器,执行中断处理函数------>然后是修正返回地址,然后是跳回去。