python实现区间估计,一个正态总体,均值已知,未知的区间估计,正态分布,t 分布

本文主要是介绍python实现区间估计,一个正态总体,均值已知,未知的区间估计,正态分布,t 分布,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先导入数据,这里使用的是一次数据竞赛的 train_label 的数据,即房租的价格
数据可在百度网盘中下载
链接:https://pan.baidu.com/s/1_4GI4_N3zWZGO9LgFP7RKA 提取码:yk5F

import pandas as pd
import numpy as np
from scipy import stats
data = pd.read_csv('train_data.csv')
tradeMoney = data['tradeMoney']
tradeMoney_mean = np.mean(tradeMoney)
tradeMoney_std = np.std(tradeMoney, ddof=1)
print(tradeMoney_mean)
print(tradeMoney_std)

将该总体近似看做正态分布,查看该总体的均值和总体的方差,输出:

8837.074227557916
551428.6590976383

查看数据的描述信息:

tradeMoney.describe()

输出:

count    4.144000e+04
mean     8.837074e+03
std      5.514287e+05
min      0.000000e+00
25%      2.800000e+03
50%      4.000000e+03
75%      5.500000e+03
max      1.000000e+08
Name: tradeMoney, dtype: float64

选取样本容量为100的一个样本:

tradeMoney_sam = tradeMoney.sample(100)
tradeMoney_sam.describe()

查看该样本的描述信息:

count      100.000000
mean      5026.100000
std       3400.800231
min       1190.000000
25%       2882.500000
50%       4250.000000
75%       5975.000000
max      24500.000000
Name: tradeMoney, dtype: float64
  • 一个正态总体方差已知,均值的区间估计,使用的是正态分布

    np.std 求得的均值是有偏的,这里我们需要的是无偏的均值,所以需要加上 ddof=1

# 自定义函数实现正态分布下的置信区间,这里使用的是总体方差
def norm_conf(data, std, confidence=0.95):sample_mean = np.mean(data)  # 求样本均值sample_size = len(data)alpha = 1 - confidence  # 显著性水平norm_score = stats.norm.isf(alpha / 2)  # 查表得正态分布的分数ME = std / np.sqrt(sample_size) * norm_scorelower_limit = sample_mean - MEupper_limit = sample_mean + ME
#     print('(%.6f, %.6f)' % (lower_limit, upper_limit))return lower_limit, upper_limit
norm_conf(tradeMoney_sam, tradeMoney_std)

输出:

(-103051.931187, 113104.131187)
  • 一个正态总体,方差未知,均值的区间估计,使用的是 t 分布
# 自定义函数实现t分布下的置信区间
def ttest_conf(data, confidence=0.95):sample_mean = np.mean(data)sample_std = np.std(data,ddof=1)    sample_size = len(data)alpha = 1 - confidencet_score = stats.t.isf(alpha / 2, df = (sample_size-1) )ME = t_score * sample_std / np.sqrt(sample_size)lower_limit = sample_mean - MEupper_limit = sample_mean + MEprint(  '( %.6f, %.6f)' % (lower_limit, upper_limit))return lower_limit, upper_limit
ttest_conf(tradeMoney_sam)

输出:

( 4351.307453, 5700.892547)

下面验证该区间估计的准确度,以一个正态总体,方差已知,均值的区间估计为例:

# 重复抽取数据,验证一个正态总体,方差已知,均值的区间估计的准确度
scale_means = []
size = 0
for _ in range(1000):tradeMoney_sample = tradeMoney.sample(100, replace=True)lower_limit_norm, upper_limit_norm = norm_conf(tradeMoney_sample, tradeMoney_std)if tradeMoney_mean >= lower_limit_norm and tradeMoney_mean <= upper_limit_norm:size += 1
print('一个正态总体,方差已知,均值的区间估计的准确度为:', size / 1000)

输出:

一个正态总体,方差已知,均值的区间估计的准确度为: 0.992

上面都是自定义函数实现的区间估计,其实在 scipy.stats 包中有包装好的函数供我们使用

  • 一个正态总体方差已知,均值的区间估计,使用的是正态分布

    conf_intveral = scipy.stats.norm.interval(confidence, loc=sample_mean, scale=sample_std)
    
  • 一个正态总体,方差未知,均值的区间估计,使用的是 t 分布

    conf_intveral = scipy.stats.t.interval(confidence,df = (sample_size-1) , loc=sample_mean, scale=sample_std)
    

    欢迎关注微信公众号 shinerise,与你一起慢慢进步~

Alt

这篇关于python实现区间估计,一个正态总体,均值已知,未知的区间估计,正态分布,t 分布的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/457150

相关文章

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

hdu 1754 I Hate It(线段树,单点更新,区间最值)

题意是求一个线段中的最大数。 线段树的模板题,试用了一下交大的模板。效率有点略低。 代码: #include <stdio.h>#include <string.h>#define TREE_SIZE (1 << (20))//const int TREE_SIZE = 200000 + 10;int max(int a, int b){return a > b ? a :