谣言检测常用评价指标

本文主要是介绍谣言检测常用评价指标，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

谣言检测通常是一个二分类任务，常用评价指标包括Precision、Recall、Accuracy、F1-score、Micro-F1、Macro-F1等。

Precision和Recall

名称	含义
TP(True Positive)	真阳性预测为正，实际为正
FP(False Positive)	假阳性预测为正，实际为负
TN(True Negative)	真阴性预测为负，实际为负
FN(False Negative)	假阴性预测为负，实际为正

Precision（正确率）：在认为是正的样本中，有多少是正的
$Precision=\frac {TP}{TP+FP}$
Recall（召回率）：原本为正的样本中，有多少被找出来了
$Recall=\frac{TP}{TP+FN}$
Accuracy（准确率）：整个样本空间中的样本分类正确的比例
$Accuracy=\frac{TP+TN}{TP+FP+TN+FN}$

F1-score

统计TP、FP、TN、FN等指标数据可以用于计算精确率(Precision)和召回率(Recall)，根据精确率和召回率可以计算出F1值。
F1分数（F1-Score、F1-Measure），是分类问题的一个衡量指标，用于权衡Precision和Recall，被定义为精确率和召回率的调和平均数。
$F1=2\cdot \frac{Precision\cdot Recall}{Precision + Recall}$

Micro-F1、 Macro-F1

微观F1(Micro-F1)和宏观F1(Macro-F1)都是F1合并后的结果，是用于评价多分类任务的指标。
第i类的Precision和Recall可以表示为：
$Precision_i=\frac {TP_i}{TP_i+FP_i}$
$Recall_i=\frac{TP_i}{TP_i+FN_I}$
Micro-F1:
（1）先计算所有类别总的Precision和Recall：
$Precision_{micro}=\frac {\sum_{i=1}^nTP_i}{\sum_{i=1}^nTP_i+\sum_{i=1}^nFP_i}$
$Recall_{micro}=\frac{\sum_{i=1}^nTP_i}{\sum_{i=1}^nTP_i+\sum_{i=1}^nFN_I}$
（2）计算调和平均数：
$F1_{micro}=2\cdot \frac{Precision_{micro}\cdot Recall_{micro}}{Precision_{micro} + Recall_{micro}}$
微观F1(Micro-F1)考虑了各种类别的数量，所以更适用于数据分布不平衡的情况，数量较多的类别会对F1的影响较大。

Macro-F1：
（1）先计算所有类别平均的Precision和Recall：
$Precision_{macro}=\frac {\sum_{i=1}^nPrecision_i}{n}$
$Recall_{macro}=\frac{\sum_{i=1}^nRecall_i}{n}$
（2）计算调和平均数：
$F1_{macro}=2\cdot \frac{Precision_{macro}\cdot Recall_{macro}}{Precision_{macro} + Recall_{macro}}$
宏观F1(Macro-F1)对各类别的Precision和Recall直接求平均，不考虑类别数量，Precision和Recall值较高的类别对F1的影响会比较大。