【统计推断】-01 抽样原理之(三)

2024-04-30 15:04
文章标签 统计 原理 01 抽样 推断

本文主要是介绍【统计推断】-01 抽样原理之(三),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、说明
  • 二、抽样分布
  • 三 均值抽样分布
    • 3.1 有限母体无放回抽样
    • 3.2 有限母体有放回抽样
    • 3.3 无限母体
  • 四、比例抽样分布
  • 五、和差抽样分布

一、说明

   上文中叙述母体和抽样的设计;以及抽样分布的概念,本篇将这种关系定量化,专门针对抽样的指标参数和母体参数的对应关系,这是我们以后做检验的基础。

二、抽样分布

   考虑从给定的母体中抽取容量为N的所有可能样本(抽样时无论放回和不放回)。对于每一个样本,我们可以计算出某个统计量(如均值、标准差)的值,不同样本得到的统计量(均值或标准差)不同,用这种方法得到的统计量分布称为抽样分布。
抽样分布有多种,我们这里重点介绍几个典型抽样分布.

  •    均值抽样分布。
  •    比例抽样分布。
  •    和(差)抽样分布。

三 均值抽样分布

   均值抽样是最常见的抽样。我们知道抽样的目的是从若干个局部,推演出全局的过程。推而广之,从个别是不是属于一个全局的概率。这其实有一个先验前提,母体基本情况是确定的。因此,预先知道母体的基本信息有:

  •    有限母体
  •    无限母体
    从抽样方式上,又分为:
  •    无放回抽样
  •    有放回抽样
    下面我们将分别叙述。

3.1 有限母体无放回抽样

   假定一个有限母体,容量为 N p N_p Np.母体均值和方差为: μ , σ \mu,\sigma μ,σ。抽样的容量为N,均值方差记号为 μ x ˉ , σ x ˉ \mu_{\bar{x}},\sigma_{\bar{x}} μxˉ,σxˉ,那么,抽样的均值和方差与母体的均值和方差存在下列关系:
在这里插入图片描述
   以上关系我们给出一个实例说明:
   给出一个母体 { 2 , 3 , 6 , 8 , 11 } \{2,3,6,8,11\} {2,3,6,8,11},从母体中有放回地抽样,抽样的容量是2;

   如何获取母体的均值和方差
μ = 2 + 3 + 6 + 8 + 11 5 = 6 σ 2 = ( 2 − 6 ) 2 + ( 3 − 6 ) 2 + ( 6 − 6 ) 2 + ( 8 − 6 ) 2 + ( 11 − 6 ) 2 5 = 10.8 \mu = \frac{2+3+6+8+11}{5}=6 \\ \sigma^2 = \frac{(2-6)^2+(3-6)^2+(6-6)^2+(8-6)^2+(11-6)^2}{5}=10.8 μ=52+3+6+8+11=6σ2=5(26)2+(36)2+(66)2+(86)2+(116)2=10.8
σ = 3.29 \sigma=3.29 σ=3.29
   如何获取抽样的均值和方差
   从总体中抽取容量为2的样本,而且是无放回的,这说明什么?

  •    当抽出一个数以后,不放回再抽取第二个,说明两个数不能一样。
  •    当抽取出(a,b)和(b,a)属于同一个抽样。
    这样的抽样共有 C 5 2 C^2_5 C52种,分别是:
Column 1Column 2均值
232.5
2.64
285
2116.5
3.64.5
385.5
3117
687
6118.5
8119.5

样本均值为:
μ x ˉ = 2.5 + 4 + 5 + 6.5 + 4.5 + 5.5 + 7 + 7 + 8.5 + 9.5 10 = 6 \mu_{\bar{x}}=\frac{2.5+4+5+6.5+4.5+5.5+7+7+8.5+9.5}{10}=6 μxˉ=102.5+4+5+6.5+4.5+5.5+7+7+8.5+9.5=6
样本方差:
在这里插入图片描述
在这里插入图片描述
   因此,符合我们给出的(1)式。

3.2 有限母体有放回抽样

   有限母体和抽样中,母体均值和抽样的关系。
μ x ˉ = μ σ x ˉ = σ N \mu_{\bar{x}}=\mu \; \; \; \; \; \; \sigma_{\bar{x}}=\frac{\sigma}{\sqrt{N}} μxˉ=μσxˉ=N σ (2)

在这里插入图片描述

3.3 无限母体

   对于无限的母体,它和有限母体的有放回抽样是一样的,
无限的母体的抽样中,母体均值和抽样的关系。
μ x ˉ = μ σ x ˉ = σ N \mu_{\bar{x}}=\mu \; \; \; \; \; \; \sigma_{\bar{x}}=\frac{\sigma}{\sqrt{N}} μxˉ=μσxˉ=N σ (3)

   好了,我们以上对均值的抽样做出完整解释。下面请看比例抽样是个什么概念。

四、比例抽样分布

   关键词: sampling distribution of proportions
   有一类事物,总是能归结到某事物发生或不发生的概率。这是一个二分法问题,比如,进入某商店的客人中,购买商品的顾客比例。这种问题可以归结到抛硬币问题,或者二项式分布问题。
   总体设定:将总体看成是0-1分布,均值和方差为:
μ = p ; σ 2 = p ( 1 − p ) \mu=p; \; \; \sigma^2=p(1-p) μ=p;σ2=p(1p)
   那么,抽样的均值和方差分别是:
μ p = p ; σ p = p ( 1 − p ) N \mu_p=p; \; \; \sigma_p=\sqrt{ \frac{p(1-p)}{N}} μp=p;σp=Np(1p) (3)
   这个结论和有限,有放回抽样的结果一样的。

五、和差抽样分布

和差抽样分布,是针对;对两个母体分别抽样,然后估算两组抽样中指标数(如均值)和、差的统计运算。因为正寻找最合适的实例,暂时停止,做个记号,日后完善。
(在下文叙述}

这篇关于【统计推断】-01 抽样原理之(三)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/949182

相关文章

MySQL中的MVCC底层原理解读

《MySQL中的MVCC底层原理解读》本文详细介绍了MySQL中的多版本并发控制(MVCC)机制,包括版本链、ReadView以及在不同事务隔离级别下MVCC的工作原理,通过一个具体的示例演示了在可重... 目录简介ReadView版本链演示过程总结简介MVCC(Multi-Version Concurr

Redis主从/哨兵机制原理分析

《Redis主从/哨兵机制原理分析》本文介绍了Redis的主从复制和哨兵机制,主从复制实现了数据的热备份和负载均衡,而哨兵机制可以监控Redis集群,实现自动故障转移,哨兵机制通过监控、下线、选举和故... 目录一、主从复制1.1 什么是主从复制1.2 主从复制的作用1.3 主从复制原理1.3.1 全量复制

Redis主从复制的原理分析

《Redis主从复制的原理分析》Redis主从复制通过将数据镜像到多个从节点,实现高可用性和扩展性,主从复制包括初次全量同步和增量同步两个阶段,为优化复制性能,可以采用AOF持久化、调整复制超时时间、... 目录Redis主从复制的原理主从复制概述配置主从复制数据同步过程复制一致性与延迟故障转移机制监控与维

SpringCloud配置动态更新原理解析

《SpringCloud配置动态更新原理解析》在微服务架构的浩瀚星海中,服务配置的动态更新如同魔法一般,能够让应用在不重启的情况下,实时响应配置的变更,SpringCloud作为微服务架构中的佼佼者,... 目录一、SpringBoot、Cloud配置的读取二、SpringCloud配置动态刷新三、更新@R

Redis主从复制实现原理分析

《Redis主从复制实现原理分析》Redis主从复制通过Sync和CommandPropagate阶段实现数据同步,2.8版本后引入Psync指令,根据复制偏移量进行全量或部分同步,优化了数据传输效率... 目录Redis主DodMIK从复制实现原理实现原理Psync: 2.8版本后总结Redis主从复制实

opencv实现像素统计的示例代码

《opencv实现像素统计的示例代码》本文介绍了OpenCV中统计图像像素信息的常用方法和函数,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 统计像素值的基本信息2. 统计像素值的直方图3. 统计像素值的总和4. 统计非零像素的数量

如何使用 Bash 脚本中的time命令来统计命令执行时间(中英双语)

《如何使用Bash脚本中的time命令来统计命令执行时间(中英双语)》本文介绍了如何在Bash脚本中使用`time`命令来测量命令执行时间,包括`real`、`user`和`sys`三个时间指标,... 使用 Bash 脚本中的 time 命令来统计命令执行时间在日常的开发和运维过程中,性能监控和优化是不

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

hdu4407(容斥原理)

题意:给一串数字1,2,......n,两个操作:1、修改第k个数字,2、查询区间[l,r]中与n互质的数之和。 解题思路:咱一看,像线段树,但是如果用线段树做,那么每个区间一定要记录所有的素因子,这样会超内存。然后我就做不来了。后来看了题解,原来是用容斥原理来做的。还记得这道题目吗?求区间[1,r]中与p互质的数的个数,如果不会的话就先去做那题吧。现在这题是求区间[l,r]中与n互质的数的和