数理统计中95%置信区间的含义

2024-05-04 20:48

本文主要是介绍数理统计中95%置信区间的含义,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

95%置信区间,意味着如果你用同样的步骤,去选样本,计算置信区间,那么100次这样的独立过程,有95%的概率你计算出来的区间会包含真实参数值,即大概会有95个置信区间会包含真值。而对于某一次计算得到的某一个置信区间,其包含真值的概率,我们无法讨论。参源

1.点估计与区间估计

首先我们看看点估计的含义:
是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计。点估计虽然给出了未知参数的估计值,但是未给出估计值的可靠程度,即估计值偏离未知参数真实值的程度。
接下来看下区间估计:
给定置信水平,根据估计值确定真实值可能出现的区间范围,该区间通常以估计值为中心,该区间则为置信区间。

2.中心极限定理与大数定理

中心极限定理:
在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。例如我们要计算全中国人的平均身高。如果每次取10000个身高作为样本,对应有一个样本均值。如果再从总体中重复抽取n多次10000个样本,就对应有n个样本均值。随着n增大,把所有样本均值画出来,得到的就是一个接近正太分布的曲线。
大数定理:
取样数趋近无穷时,样品平均值按概率收敛于期望值。抛硬币的次数越多,越接近正反各一半。

3.置信区间与置信水平

一般我们用中括号[a,b]表示样本估计总体平均值误差范围的区间。a、b的具体数值取决于你对于”该区间包含总体均值”这一结果的可信程度,因此[a,b]被称为置信区间。
一般来说,选定某一个置信区间,我们的目的是为了让”ab之间包含总体平均值”的结果有一特定的概率,这个概率就是所谓的置信水平。
例如我们最常用的95%置信水平,就是说做100次抽样,有95次的置信区间包含了总体均值。

4.标准差(standard deviation)与标准误差(standard error)

标准差是描述观察值(个体值)之间的变异程度(例如一个人打十次靶子的成绩,这时有一个平均数8,有一个反映他成绩稳定与否的标准差);
标准误是描述样本均数的抽样误差(例如十次抽样,每次他成绩平均数(7,8,6,9,5,6,7,7,8,9)的标准差,也就是抽样分布的标准差);
样本的标准误差为:

在这里插入图片描述

5.如何理解95%的置信区间

以上面的统计身高为例,假设全国人民的身高服从正态分布:

X∼N(μ,σ2)

不断进行采样,假设样本的大小为n,则样本的均值为:

在这里插入图片描述

由大数定理与中心极限定理:

在这里插入图片描述

注意σ1的计算方法为第4部分提到的标准误差!

为什么常用95%的置信水平:

这里写图片描述

对照上图,用一句简单的话概括就是:
有95%的样本均值会落在2个(比较精确的值是1.96)标准误差范围内。

用数学公式描述就是:

在这里插入图片描述

6.计算置信区间的套路

从上面的例子来看,计算置信区间的套路如下:
1.首先明确要求解的问题。比如我们的例子,就是想通过样本来估计全国人民身高的平均值。
2.求抽样样本的平均值与标准误差(standard error)。注意标准误差与标准差(standard deviation)不一样。
3.确定需要的置信水平。比如常用的95%的置信水平,这样可以保证样本的均值会落在总体平均值2个标准差得范围内。
4.查z表,求z值。
5.计算置信区间
a = 样本均值 - z*标准误差
b = 样本均值 + z*标准误差

用公式表示置信区间:

在这里插入图片描述
其中,x¯表示样本的均值,z值表示有多少标准差,s为样本的方差。

这篇关于数理统计中95%置信区间的含义的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/960059

相关文章

Linux错误代码及其含义

最近在做工程的时候,程序在崩溃时候弹出了错误号,然后根据错误号搜索错误信息,很快解决之,特此记录。 在程序出错时,我们通过全局变量错误号errno和perror函数能够很快的定位到错误原因。 Linux错误代码及其含义 C NameValueDescription含义Success0Success成功EPERM1Operation not permitted操作不允许ENOENT2No

兔子-build.gradle中代码的含义

//声明构建的项目类型,这里当然是android了apply plugin: 'com.android.application'//设置编译android项目的参数android {// SDK的版本号,也就是API Level,例如API-19、API-20、API-21等等。compileSdkVersion 23//构建工具的版本,其中包括了打包工具aapt、dx等等。// 这个工具的目

概率论与数理统计(1)

第一节博客已经整理了求导的公式,一些常用的概念。链接如下:高等数学基础(1)-CSDN博客。         第二节博客整理了微积分的公式及其相关概念。链接如下:高等数学基础(2)——微积分-CSDN博客         第三节博客则整理了泰勒公式和拉格朗日公式的相关概念。链接如下:高等数学基础(3)——泰勒公式与拉格朗日-CSDN博客         第四节博客则整理了行

MySQL数据类型 int(M)中M含义

int(M)我们先来拆分,int是代表整型数据那么中间的M应该是代表多少位了,后来查mysql手册也得知了我的理解是正确的,下面我来举例说明。 MySQL 数据类型中的 integer types 有点奇怪。你可能会见到诸如:int(3)、int(4)、int(8) 之类的 int 数据类型。刚接触 MySQL 的时候,我还以为 int(3) 占用的存储空间比 int(4) 要小, int(4)

区块链的含义是什么

目录 区块链的基本定义 区块链的构成与特性 区块链的类型 区块链的应用 区块链的基本定义 区块链是一种分布式数据存储、点对点传输、共识机制和加密算法等计算机技术的新型应用模式。它通过将数据区块按照时间顺序相连形成链式结构,确保数据的真实性和不可篡改性。 区块链的构成与特性 构成:区块链由多个数据区块组成,每个区块包含一定数量的交易记录,并通过哈希值与前一个区块相连。特性:区

c++ 链表tail->next = new ListNode(sum % 10); tail = tail -> next; 语句含义

这两行 C++ 代码: tail->next = new ListNode(sum % 10);tail = tail->next; 通常出现在处理链表(ListNode)的上下文中,特别是在实现与数字相加相关的算法时,比如“两个数相加”问题。下面是对这两行代码的详细解释: 代码背景 首先,有一个链表节点的结构体定义,通常会是这样的: struct ListNode {int val

c++ 解释return {it->second,i}; 这条语句中每个单词的含义

在 C++ 中,return {it->second, i}; 语句的含义可以分解为以下几个部分。 1. return 含义:return 是一个关键字,用于从一个函数中返回值。在函数执行到 return 语句时,会结束函数的执行,并将后面跟随的值返回给调用该函数的地方。 2. {it->second, i} 含义:这个部分使用了列表初始化(C++11 及以后版本引入的特性)。它表示创建一

在 “Label Studio” 和 “Android Studio” 中,“studio”的含义

这个词通常有以下含义: 一、工作场所或空间 可以理解为一个专门用于特定任务的工作区域。就像艺术家的工作室是他们进行创作的地方一样,在软件领域,这些带有 “studio” 的工具为开发者或使用者提供了一个集中进行特定开发、标注等工作的环境。 例如,Android Studio 为 Android 应用开发者提供了一个集成的开发环境,包括代码编辑、调试、测试等各种功能,开发者可以在这个环境中高效

python中**字典的含义

格式 **dict 例如 dict1 = {'name': '海鸥', 'gender': '男', 'age': 24, 'mobile': '123','des':'秒内噶'}def tmp1(name, gender, age, mobile, des):print(name, gender, age, mobile, des)def tmp2():tmp3 = tmp1