WA、UAR、F1和sklearn自带的函数

2024-03-11 11:30
文章标签 函数 自带 f1 sklearn wa uar

本文主要是介绍WA、UAR、F1和sklearn自带的函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

多分类问题中常用的评价指标。

目录

1.WA(weighted accuracy)加权准确率

2.UAR(unweighted average recall)未加权平均召回率

3.F1分数

4.使用sklearn进行计算

5.适用场景

6.其他


1.WA(weighted accuracy)加权准确率

在多分类问题中,加权准确率(Weighted Accuracy)是一种考虑每个类别样本数量的准确率计算方式。对于样本不均衡的情况,该方式比较适用。其计算方式是将每个类别的准确率乘以该类别在总样本中的比例(权重),然后求和。

其实就是我们日常跑代码出来的acc

计算公式如下:

WA = \frac{\sum (TP_i) }{\sum (TP_i + FP_i + FN_i)}

其中,TP_i 是第 i 类的真正例数量,FP_i 是第 i 类的假正例数量,FN_i 是第 i 类的假反例数量。Σ 表示对所有类别求和。

2.UAR(unweighted average recall)未加权平均召回率

是一种性能评估指标,主要用于多分类问题。它表示各类别的平均召回率(Recall),在计算时,不对各类别进行加权。对于每个类别,召回率是该类别中真正被正确预测的样本数与该类别中所有样本数的比值。

UAR在评估一个分类器时,对每个类别都给予相同的重要性,而不考虑各类别的样本数量。这使得UAR在处理不平衡数据集时具有一定的优势,因为它不会受到数量较多的类别的影响。

计算公式如下:

UAR = \frac{1}{N}* \sum (Recall_i)

其中,Recall_i 是第 i 类的召回率,N 是类别的总数。

3.F1分数

F1分数是精确率(Precision)和召回率(Recall)的调和平均值。在多分类问题中,通常会计算每个类别的F1分数,然后取平均值作为总体的F1分数。平均方法可以是简单的算术平均(Macro-F1)(常用),也可以是根据每个类别的样本数量进行加权的平均(Weighted-F1)。

计算公式如下:

F1 = \frac{2 * Precision * Recall }{(Precision + Recall)}

4.使用sklearn进行计算

from sklearn.metrics import classification_report

使用👆导入的包,模型输出预测值y_pred和真实值y_test得到report如下:

report = classification_report(y_test, y_pred)
              precision    recall  f1-score   support0       0.89      0.80      0.84        101       0.60      0.75      0.67         82       0.92      0.85      0.88        13accuracy                           0.81        31macro avg       0.80      0.80      0.80        31
weighted avg       0.83      0.81      0.82        31

"macro avg"行表示,对于精度(precision),召回率(recall)和F1分数(f1-score),它们的未加权平均值分别是0.80、0.80和0.80。

"weighted avg"行表示,对于精度(precision),召回率(recall)和F1分数(f1-score),它们的加权平均值分别是0.83、0.81和0.82。加权平均是根据每个类别的样本数进行加权的,所以在这个案例中,类别2(有13个样本)的影响力大于类别0(10个样本)和类别1(8个样本)。

accuracy,可以视作每个类别的权重都一样的加权准确率。

5.适用场景

在类别不平衡的情况下,UAR 和 F1 分数通常比准确率更能反映模型的性能。

6.其他

精确率(Precision)和准确率(Accuracy)都是评价模型性能的重要指标,但是他们衡量的角度不同。

准确率(Accuracy):是所有预测正确的样本(真正例TP和真负例TN)占总样本数(TP+TN+FP+FN)的比例。它适用于正负样本比例相当的情况。在正负样本极度不均衡的情况下,准确率就没有太大的意义。

   Accuracy = (TP+TN) / (TP+TN+FP+FN)

精确率(Precision):是预测为正且预测正确的样本(真正例TP)占所有预测为正的样本数(TP+FP)的比例。它适用于关注假正例(FP,即将负例错误预测为正例)的情况。

   Precision = TP / (TP+FP)

举个例子,假设有100个邮件,其中95个是垃圾邮件,5个是正常邮件。如果模型预测所有邮件都是垃圾邮件,那么准确率是95%(因为正确预测了95个垃圾邮件),但是精确率就是0%(因为没有预测出任何正常邮件)。所以在不同的场景和需求下,我们需要根据实际情况选择合适的评价指标。

这篇关于WA、UAR、F1和sklearn自带的函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/797679

相关文章

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

GO语言中函数命名返回值的使用

《GO语言中函数命名返回值的使用》在Go语言中,函数可以为其返回值指定名称,这被称为命名返回值或命名返回参数,这种特性可以使代码更清晰,特别是在返回多个值时,感兴趣的可以了解一下... 目录基本语法函数命名返回特点代码示例命名特点基本语法func functionName(parameters) (nam

Python Counter 函数使用案例

《PythonCounter函数使用案例》Counter是collections模块中的一个类,专门用于对可迭代对象中的元素进行计数,接下来通过本文给大家介绍PythonCounter函数使用案例... 目录一、Counter函数概述二、基本使用案例(一)列表元素计数(二)字符串字符计数(三)元组计数三、C

Python中的filter() 函数的工作原理及应用技巧

《Python中的filter()函数的工作原理及应用技巧》Python的filter()函数用于筛选序列元素,返回迭代器,适合函数式编程,相比列表推导式,内存更优,尤其适用于大数据集,结合lamb... 目录前言一、基本概念基本语法二、使用方式1. 使用 lambda 函数2. 使用普通函数3. 使用 N

MySQL中REPLACE函数与语句举例详解

《MySQL中REPLACE函数与语句举例详解》在MySQL中REPLACE函数是一个用于处理字符串的强大工具,它的主要功能是替换字符串中的某些子字符串,:本文主要介绍MySQL中REPLACE函... 目录一、REPLACE()函数语法:参数说明:功能说明:示例:二、REPLACE INTO语句语法:参数

python中update()函数的用法和一些例子

《python中update()函数的用法和一些例子》update()方法是字典对象的方法,用于将一个字典中的键值对更新到另一个字典中,:本文主要介绍python中update()函数的用法和一些... 目录前言用法注意事项示例示例 1: 使用另一个字典来更新示例 2: 使用可迭代对象来更新示例 3: 使用

Python lambda函数(匿名函数)、参数类型与递归全解析

《Pythonlambda函数(匿名函数)、参数类型与递归全解析》本文详解Python中lambda匿名函数、灵活参数类型和递归函数三大进阶特性,分别介绍其定义、应用场景及注意事项,助力编写简洁高效... 目录一、lambda 匿名函数:简洁的单行函数1. lambda 的定义与基本用法2. lambda

Python 函数详解:从基础语法到高级使用技巧

《Python函数详解:从基础语法到高级使用技巧》本文基于实例代码,全面讲解Python函数的定义、参数传递、变量作用域及类型标注等知识点,帮助初学者快速掌握函数的使用技巧,感兴趣的朋友跟随小编一起... 目录一、函数的基本概念与作用二、函数的定义与调用1. 无参函数2. 带参函数3. 带返回值的函数4.

MySQL中DATE_FORMAT时间函数的使用小结

《MySQL中DATE_FORMAT时间函数的使用小结》本文主要介绍了MySQL中DATE_FORMAT时间函数的使用小结,用于格式化日期/时间字段,可提取年月、统计月份数据、精确到天,对大家的学习或... 目录前言DATE_FORMAT时间函数总结前言mysql可以使用DATE_FORMAT获取日期字段

Django中的函数视图和类视图以及路由的定义方式

《Django中的函数视图和类视图以及路由的定义方式》Django视图分函数视图和类视图,前者用函数处理请求,后者继承View类定义方法,路由使用path()、re_path()或url(),通过in... 目录函数视图类视图路由总路由函数视图的路由类视图定义路由总结Django允许接收的请求方法http