学习记录682@查准率与查全率真的必然负相关吗?

2023-10-17 13:04

本文主要是介绍学习记录682@查准率与查全率真的必然负相关吗?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

查准率和查全率定义

在这里插入图片描述

查准率与查全率真的必然负相关吗?

先说结论,两者并非绝对负相关,只是在统计学上表现出大概率的负相关性,而数学证明上无法严格证明两个的负相关性。

枚举来证明两者并非必然负相关

一组数据:A1、B1、C1、D0、E0、F0,其中1代表正例,0代表反例。
第一次分类预测:预测为正例的样本为:A1、B1、D0,预测为反例的样本为:C1、E0、F0,此时TP=2,FP=1 ,FN=1,TN=2,P=2/3,R=2/3。
第二次分类预测,提高P值:预测为正例的样本为:A1、B1、C1、D0,预测为反例的样本为:E0、F0,此时TP=3,FP=1 ,FN=0,TN=2,P=3/4,R=1。
从以上枚举可以发现,提高P,R也可以提高,因此证明了并非查准率与查全率真的必然负相关。

逻辑推理证明两者负相关的概率比较大

对于R值,分母TP+FN=样本真实的正例数量,必然保持不变。因此要提高R值,则只能提高TP,在此条件下,再来看P值,分子提高,但是逻辑上来说,如果要提高分子,也就是预测正例正确的数量,那么在其他条件一致的情况下(比如预测的机制不变),只有尽可能多的预测,比如之前预测10个正例,正确5个,要使得TP增加,在不改变预测机制的情况下就只能预测30个正例,从概率上来说可能预测正确的数量会高于5个,但是因为预测正例的数量增加了,概率上来说FP也增加了,因此综合起来,TP增加的速度可能小于TP+FP增加的速度,因此P值实际上可能是降低的,因为分子增加的速度小于分母增加的速度。所以真实的PR曲线是非光滑的,也并非是一直是复斜率的。
在这里插入图片描述

这篇关于学习记录682@查准率与查全率真的必然负相关吗?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/225589

相关文章

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

关于Spring @Bean 相同加载顺序不同结果不同的问题记录

《关于Spring@Bean相同加载顺序不同结果不同的问题记录》本文主要探讨了在Spring5.1.3.RELEASE版本下,当有两个全注解类定义相同类型的Bean时,由于加载顺序不同,最终生成的... 目录问题说明测试输出1测试输出2@Bean注解的BeanDefiChina编程nition加入时机总结问题说明

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

关于rpc长连接与短连接的思考记录

《关于rpc长连接与短连接的思考记录》文章总结了RPC项目中长连接和短连接的处理方式,包括RPC和HTTP的长连接与短连接的区别、TCP的保活机制、客户端与服务器的连接模式及其利弊分析,文章强调了在实... 目录rpc项目中的长连接与短连接的思考什么是rpc项目中的长连接和短连接与tcp和http的长连接短

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Servlet中配置和使用过滤器的步骤记录

《Servlet中配置和使用过滤器的步骤记录》:本文主要介绍在Servlet中配置和使用过滤器的方法,包括创建过滤器类、配置过滤器以及在Web应用中使用过滤器等步骤,文中通过代码介绍的非常详细,需... 目录创建过滤器类配置过滤器使用过滤器总结在Servlet中配置和使用过滤器主要包括创建过滤器类、配置过滤

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

python与QT联合的详细步骤记录

《python与QT联合的详细步骤记录》:本文主要介绍python与QT联合的详细步骤,文章还展示了如何在Python中调用QT的.ui文件来实现GUI界面,并介绍了多窗口的应用,文中通过代码介绍... 目录一、文章简介二、安装pyqt5三、GUI页面设计四、python的使用python文件创建pytho

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert