学习心得——第一类错误、第二类错误、统计功效

2023-11-21 00:10

本文主要是介绍学习心得——第一类错误、第二类错误、统计功效,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  一、什么是第一类错误、第二类错误、统计功效

        在某个文艺小清新网站上,有一则作者不可考的略黄略暴力的故事很好地阐述了这几个概念:话说N年过去了,某位性别不明的地球统治者决定要消灭地球上的男人们。但是怎样找到地球上所有的男人并把他们都消灭呢?这位统治者开发出了一种自动判别武器——如果胸小于A罩杯,则杀无赦;如果等于或大于A罩杯,则放过。 

        如果用统计学的语言来说,由于武器旨在找出男人放过女人,每当它碰到一个没见过的人时,它就先假设这是个女人(「原假设」),如果这人罩杯太小,那就认为这肯定不是个女人(「推翻原假设」)。不是女人那还能是啥?男人呗(「接受备选假设」)。 

在这里,武器的判别程序犯了两种错误:

        把一小部分小胸女人当成了男人,也就是在原假设其实为真时错误地拒绝了它,这在统计学中被称为「第一类错误」;

        把一小撮大胸男人当成了女人,也就是在原假设其实为假时错误地接受了它,这在统计学中被称为「第二类错误」。 

腊字母β来代表犯第一类和第二类错误的概率,既然原来的目标是消灭男人,我们就看看到底多大比例的男人被干掉了,这个比例就是1-β。我们很快就会看到,这正是「统计功效」

统计功效指的就是:如果我们感兴趣的效应或差异的确存在,在给定的显著性水平的规定下,我们能够正确地拒绝原假设的概率。这其实就是不犯第二类错误的概率,因此,统计功效的值可以用1减去β得到,用数学式子表示为

 其中,P表示概率,(拒绝 H0 | H1 为真)表示在备选假设 H1为真的条件下拒绝了原假设H0的事件。

        当了解了这一切之后,统治者很生气,就不能两种错误都少犯些吗!ta得到的反应一定是:「臣妾做不到啊!!」在任何统计学问题上,两类错误都是此消彼长的。
        如果统治者想少犯第二类错误,把大胸男们也一块赶尽杀绝,那么必然会有更多小胸女人中枪;相反,如果统治者想少犯第一类错误,降低罩杯标准,那么男人们逃脱厄运就更容易了。
        因此,我们的统计学巨人尽管努力地想用显著性和功效这两条大腿把第一类和第二类错误都踩在脚下,然而他却是骑在一辆自行车上——放下一条腿,就只能抬起另一条腿。 

特别鸣谢:张之昊 《说人话的统计学》        

这篇关于学习心得——第一类错误、第二类错误、统计功效的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/398445

相关文章

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

flume系列之:查看flume系统日志、查看统计flume日志类型、查看flume日志

遍历指定目录下多个文件查找指定内容 服务器系统日志会记录flume相关日志 cat /var/log/messages |grep -i oom 查找系统日志中关于flume的指定日志 import osdef search_string_in_files(directory, search_string):count = 0

hdu4267区间统计

题意:给一些数,有两种操作,一种是在[a,b] 区间内,对(i - a)% k == 0 的加value,另一种操作是询问某个位置的值。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import

hdu4417区间统计

给你一个数列{An},然后有m次查询,每次查询一段区间 [l,r] <= h 的值的个数。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamRead

hdu3333区间统计

题目大意:求一个区间内不重复数字的和,例如1 1 1 3,区间[1,4]的和为4。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;

实例:如何统计当前主机的连接状态和连接数

统计当前主机的连接状态和连接数 在 Linux 中,可使用 ss 命令来查看主机的网络连接状态。以下是统计当前主机连接状态和连接主机数量的具体操作。 1. 统计当前主机的连接状态 使用 ss 命令结合 grep、cut、sort 和 uniq 命令来统计当前主机的 TCP 连接状态。 ss -nta | grep -v '^State' | cut -d " " -f 1 | sort |

Java EE学习心得

–Java EE学习心得     1.    称为编程专家的秘诀是: 思考-----编程--------思考------编程…….. 编程不能一步到位,不能一上来就编,必须先思考如何写,怎样写?然后再编程,完事后,再思考  我编的程序还有那些不好的地方和要改进的地方,可以增加写什么功能等等;然后再去编程; 2. 先搭建整体框架再抠细节,在编程中不管是什么要先做出来,再去问怎么做!即是:先K

【经验交流】修复系统事件查看器启动不能时出现的4201错误

方法1,取得『%SystemRoot%\LogFiles』文件夹和『%SystemRoot%\System32\wbem』文件夹的权限(包括这两个文件夹的所有子文件夹的权限),简单点说,就是使你当前的帐户拥有这两个文件夹以及它们的子文件夹的绝对控制权限。这是最简单的方法,不少老外说,这样一弄,倒是解决了问题。不过对我的系统,没用; 方法2,以不带网络的安全模式启动,运行命令行,输入“ne

Python脚本:TXT文档行数统计

count = 0 #计数变量file_dirs = input('请输入您要统计的文件根路径:')filename = open(file_dirs,'r') #以只读方式打开文件file_contents = filename.read() #读取文档内容到file_contentsfor file_content in file_contents:

SQL2005 性能监视器计数器错误解决方法

【系统环境】 windows 2003 +sql2005 【问题状况】 用户在不正当删除SQL2005后会造成SQL2005 性能监视器计数器错误,如下图 【解决办法】 1、在 “开始” --> “运行”中输入 regedit,开启注册表编辑器,定位到 [HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVer