Accuracy准确率,Precision精确率,Recall召回率,F1 score

2024-04-10 08:36

本文主要是介绍Accuracy准确率,Precision精确率,Recall召回率,F1 score,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

真正例和真反例是被正确预测的数据,假正例和假反例是被错误预测的数据。然后我们需要理解这四个值的具体含义:
TP(True Positive):被正确预测的正例。即该数据的真实值为正例,预测值也为正例的情况;
TN(True Negative):被正确预测的反例。即该数据的真实值为反例,预测值也为反例的情况;
FP(False Positive):被错误预测的正例。即该数据的真实值为反例,但被错误预测成了正例的情况;
FN(False Negative):被错误预测的反例。即该数据的真实值为正例,但被错误预测成了反例的情况。

  1. 准确率(Accuracy)表示分类正确的样本占总样本个数的比例。
    Acc = (TP+TN)/(TP+TN+FP+FN)
    Accuracy是衡量分类模型的最直白的指标,但缺陷也是明显的。假设有100个样本,其中有99个都是正样本,则分类器只需要一直预测为正例,就可以得到99%的准确率,实际上这个分类器性能是很低下的。也就是说,当不同类别的样本所占的比例严重不平衡时,占比大的类别会是影响准确率的最主要的因素。所以,只有当数据集各个类别的样本比例比较均衡时,Accuracy这个指标才是一个比较好的衡量标准。因此,必须参考其他指标才能完整评估模型的性能。
  2. Precision精确率又叫查准率,表示预测结果为正例的样本中实际为正样本的比例
    Pre = TP/(TP+FP)
    当反例被错误预测成正例(FP)的代价很高时,适合用精确率。根据公式可知,精确率越高,FP越小。比如在垃圾在垃圾邮件检测中,假正例意味着非垃圾邮件(实际为负)被错误的预测为垃圾邮件(预测为正)。如果一个垃圾邮件监测系统的查准率不高导致很多非垃圾邮件被归到垃圾邮箱里去,那么邮箱用户可能会丢失或者漏看一些很重要的邮件。
  3. Recall召回率又被称为查全率,表示预测结果为正样本中实际正样本数量占全样本中正样本的比例。
    Rec = TP/(TP+FN)
    当正例被错误的预测为反例(FN)产生的代价很高时,适合用召回率。根据公式可知,召回率越高,FN越小。比如说在银行的欺诈检测或医院的病患者检测中,如果将欺诈性交易(实际为正)预测为非欺诈性交易(预测为负),则可能会给银行带来非常严重的损失。再比如以最近的新冠疫情为例,如果一个患病者(实际为正)经过试剂检测被预测为没有患病(预测为负),这样的假反例或者说假阴性产生的风险就非常大
  4. F1 score是精确率和召回率的一个加权平均。
    F1 = 2 * (P*R/(P+R))
    Precision体现了模型对负样本的区分能力,Precision越高,模型对负样本的区分能力越强;Recall体现了模型对正样本的识别能力,Recall越高,模型对正样本的识别能力越强。F1 score是两者的综合,F1 score越高,说明模型越稳健。

这篇关于Accuracy准确率,Precision精确率,Recall召回率,F1 score的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/890560

相关文章

03 TensorFlow 2.0:TOPK Accuracy实战

这江山风雨 岁月山河 刀光剑影 美了多少世间传说 且看他口若悬河 衣上有风尘 却原来是一位江湖说书人                                                                                                                                 《说书人》 在分类问题中会遇到TO

今天遇到的3到智力面试题(给工人分金条,小鸟来回在2火车之间飞行的距离,精确称水问题)

智力题1:你让工人为你工作7天,给工人的回报是一根金条。金条平分成相连的7段,你必须在每天结束时给他们一段金条,如果只许你两次把金条弄断,你如何给你的工人付费? 答:把金条2次弄断的方式是第一次1,6分,,然后把剩余的6用2,4分,即弄断2次为1段、2段、4段 第一天给1段, 第二天让工人把1段归还给2段, 第三天给1段, 第四天归还1段和2段,给4段。 第五天给1段, 第六天给2

Depth Anything V2:抖音开源高性能任何单目图像深度估计V2版本,并开放具有精确注释和多样化场景的多功能评估基准

📜文献卡 题目: Depth Anything V2作者: Lihe Yang; Bingyi Kang; Zilong Huang; Zhen Zhao; Xiaogang Xu; Jiashi Feng; Hengshuang ZhaoDOI: 10.48550/arXiv.2406.09414摘要: This work presents Depth Anything V2. With

Elasticsearch term 查询:精确值搜索

一、引言 Elasticsearch 是一个功能强大的搜索引擎,它支持全文搜索、结构化搜索等多种搜索方式。在结构化搜索中,term 查询是一种常用的查询方式,用于在索引中查找与指定值完全匹配的文档。本文将详细介绍 term 查询的工作原理、使用场景以及如何在 Elasticsearch 中应用它。 二、term 查询概述 term 查询是 Elasticsearch 中用于精确值搜索的一种查

C++ ostream类包含的一个简单的用于控制格式的成员函数setf precision

ostream类包含一些可用于控制格式的成员函数 这里介绍一个简单的setf(),可用于避免科学计数法 std::cout.setf(std::ios_base::fixed, std::ios_base::floatfield);这设置了cout对象的一个标记,命令cout使用定点表示法 std::cout.precision(3);表示cout在使用定点表示法时,

在Excel中使用SQL语句实现精确查询

来自:http://blog.sina.com.cn/s/blog_5fc375650102e1g5.html 今天在微博上看到@数据分析精选 分享的一篇文章,是关于《在Excel中使用SQL语句实现精确查询》,觉得非常受用,分享给大家。 微博上有人回复评论说直接用vlookup、或者导入数据库进行查询处理就好了,岂不是更高效、更灵活;其实给人的第一直观感觉是这样子的,但是我们多想一步,这篇文

java版-金额转大写(可处理千万亿,精确到分)

转自:http://605113068.iteye.com/blog/2049163 package test; import java.math.BigDecimal; /**  * 数字转换为汉语中人民币的大写<br>  *  * @author hongten  * @contact hongtenzone@foxmail.com  * @create 2013-08-13  */

多分类问题中评价指标F1-Score 加权平均权重的计算方法

多分类问题中评价指标F1-Score 加权平均权重的计算方法     众所周知,F1分数(F1-score)是分类问题的一个衡量指标。在分类问题中,常常将F1-score作为评价分类结果好坏的指标。它是精确率和召回率的调和平均数,值域为[0,1]。 F 1 = 2 ∗ P ∗ R P + R F_1=2*\frac{P*R}{P+R} F1​=2∗P+RP∗R​     其中,P代表着准确率(

Elastic Search 搜索结果中 _score 字段为 null

参考了 使用elasticsearchTemplate.query()查询发现score字段为null 出现原因 搜索时使用了其他字段作为排序条件,ES 默认是使用 _score 作为排序条件的 解决方案 在 sort 里增加 _score 字段排序

【中文】PDF文档切分\切片\拆分最优方案-数据预处理阶段,为后续导入RAG向量数据库和ES数据库实现双路召回

目的 将PDF文档拆开,拆开后每个数据是文档中的某一段,目的是保证每条数据都有较完整的语义,并且长度不会太长 项目自述 看了很多切分项目,包括langchain、Langchain-Chatchat、、Chinese-LangChain、LangChain-ChatGLM-Webui、ChatPDF、semchunk等等,效果还行,但是不够完美,毕竟他们的对"\n"的优先级设置的较高,使用p