本文主要是介绍如何计算置信区间,RMSE均方根误差/标准误差:误差平方和的平均数开方,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
如何通过部分样本来计算总体的一个置信区间呢?主要有下面几个步骤:
step1:首先明确要求解的问题。就是你要预估什么?不管是全校学生身高还是学生成绩。
step2:求抽样样本的平均值与标准误差(standard error,RMSE,均方根误差)。注意标准误差与标准差(standard deviation)不一样(标准差反映了整个样本对样本平均数的离散程度,标准误差反映样本平均数对总体平均数的变异程度)。
标准差等于方差开根号。 标准误差等于样本标准差除n的开根号。
均方根误差(Root meansquared error):误差平方和的平均数开方。
step3:确定需要的置信水平。比如常用的 95% 的置信水平,就是我有 95% 的把握估算对,这样可以保证样本的均值会落在总体平均值2个标准差范围内。
step4:查z表,求z值。什么是z表呢?是不是已经忘记了,z表是标准正态分布表,是用来反映标准分与概率值之间的关系表,也就是通过标准分能查到概率值,通过概率值也可以反查标准分。
现在我们知道了 95% 的置信水平对应的概率值是 2.5% ,只需要通过标准正态分布表查出 2.5% 概率对应的标准分即可,也就是z值。
常用置信水平与标准分z值的对应表
置信水平 | Z值 |
---|---|
90% | 1.64 |
95% | 1.96 |
99% | 2.58 |
step5:计算置信区间
a = 样本均值 - z*标准误差 b = 样本均值 + z*标准误差
最后置信区间就为 [a,b]。
这篇关于如何计算置信区间,RMSE均方根误差/标准误差:误差平方和的平均数开方的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!