【科研】常用的实验结果评价指标(2) —— MAE 是什么? !

2024-05-15 00:12

本文主要是介绍【科研】常用的实验结果评价指标(2) —— MAE 是什么? !,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

了解MAE

提示:先说概念,后续再陆续上代码


文章目录

  • 了解MAE
  • 前言
  • 一、MAE 基本概念
    • 1. MAE 是什么?
    • 2. MAE 的起源
    • 3. MAE 的计算公式
  • 二、MAE的适用场景是什么?
  • 三、MAE 的劣势,或 不适用于那些场景或者数据?
  • 四、MAE的取值特点(取值范围)


前言

各类论文的实验结果中经常会有MAE作为评价指标,本篇就是为了搞清楚MAE究竟是什么,什么时候能用,什么时候不能用。


一、MAE 基本概念

1. MAE 是什么?

MAE 是 “平均绝对误差”(Mean Absolute Error)的缩写,它是用来衡量预测模型或者估计方法在统计学中准确度的指标。MAE 反映了预测值与真实值之间的绝对误差的平均水平。

2. MAE 的起源

MAE 的概念和使用可以追溯到统计学和数理统计的早期发展。尽管难以准确指出它的“起源”,因为统计学的发展是一个逐步积累和演化的过程,但可以确定的是,MAE 作为误差度量的一种形式,在20世纪初的统计学和预测分析中已经开始使用。

在统计学的历史中,人们长期以来一直在探索和发展不同的误差度量方法来提高预测模型的准确性和可靠性。MAE 作为其中一种简单直观的方法,因其计算简单和对异常值具有较好的抵抗性而被广泛应用于多个领域,包括但不限于经济学、气象学、工程学等。

MAE 的使用特别适合那些需要等重视所有错误大小的场合,因为与平均平方误差(MSE)相比,MAE 不会将较大的误差的影响放大,从而提供了一个更均衡的误差评估。这种特性使得 MAE 在实际应用中非常有用,特别是在预测误差的大小不应被过度放大时。

3. MAE 的计算公式

MAE 的计算公式可以表示为:

在这里插入图片描述

其中

在这里插入图片描述

MAE 的值越小,表示模型的预测准确性越高。它是一个很直观的衡量误差的方式,因为它平等地考虑了所有的单个预测误差的大小,而不考虑误差的方向。

二、MAE的适用场景是什么?

作为一个常用的统计度量方法,MAE适用于多种不同的场景,主要特点是简单、直观且对异常值具有较好的鲁棒性。以下是一些MAE特别适用的场景:

  1. 异常值敏感度较低的应用:MAE对异常值的敏感度较平均平方误差(MSE)来说较低,因此在数据中可能包含一些异常值或离群值的情况下,使用MAE作为评估标准可以得到更稳定的误差评估。

  2. 需要等权重评估误差的场景:MAE为所有误差提供相同的权重(不像MSE那样对较大的误差赋予更高的权重),这使得在需要公平评估每个预测错误时,MAE成为一个更合适的选择。

  3. 简单性和可解释性重要的领域:由于MAE的计算和解释都相对简单,它在需要向非专业人士解释模型性能的领域(如商业分析和社会科学)中非常有用。

  4. 实时系统和快速反馈环境:MAE的计算效率高,适合在需要快速反馈的实时系统中使用,比如实时交易系统或在线学习环境。

  5. 多领域的预测和回归分析:无论是金融市场预测、气象预报、能源消耗预测还是医疗影像分析,MAE因其直观性和实用性,都是评估预测精度的常用工具。

总的来说,MAE是一个广泛应用的误差度量方法,适用于各种需要准确反映预测误差且对异常值有一定抵抗力的应用场景。

三、MAE 的劣势,或 不适用于那些场景或者数据?

虽然平均绝对误差(MAE, Mean Absolute Error)在很多场景中都是一个非常有用的误差度量方法,但它也存在一些局限性,使其在某些情况下可能不是最佳选择。以下是MAE不太适用的一些场景或数据类型:

  1. 对大误差敏感的场景:MAE对所有的误差都给予相同的权重,这意味着它对大误差的惩罚不如平均平方误差(MSE)严格。因此,在一些对大误差特别敏感的应用中,如安全关键系统(例如飞行控制系统),使用MAE可能无法有效地捕捉和惩罚这些大的预测错误。

  2. 需要加权误差的情况:在一些特定的应用中,可能需要对不同类型的误差按不同的重要性进行加权。例如,在经济预测中,对经济衰退期的预测错误可能比繁荣期的预测错误更加严重。在这种情况下,MAE由于无法直接实现误差加权,可能不是最佳选择。

  3. 分布极度不平衡的数据:在处理极端不平衡的数据集时,MAE可能无法提供充分的信息,尤其是当数据中的一个类别比其他类别频繁得多时。在这种情况下,MAE可能过于简化了误差的表现,不能完全捕捉数据的特性。

  4. 优化算法中的使用限制:在使用基于梯度的优化算法时,MAE的梯度相对于MSE来说是常数(不考虑误差的大小),这可能会导致优化过程中遇到一些问题,如收敛速度慢,尤其是在误差较大时。

  5. 分析需要强调异常值的情况:在需要识别或强调异常值的分析中,MAE由于对异常值的“容忍”性,可能掩盖了重要的异常现象。在这种情况下,可能需要选择更敏感于异常值的误差度量方法,如MSE或者其他基于异常值检测的统计方法。

综上所述,虽然MAE是一个广泛使用的误差度量工具,具有计算简单和直观的优点,但在需要对大误差敏感、进行错误加权、处理极不平衡数据或强调异常值的情况下,可能需要考虑其他更合适的度量方法。

四、MAE的取值特点(取值范围)

平均绝对误差(MAE, Mean Absolute Error)的取值具有一些特点,这些特点使其在统计分析和预测模型评估中非常有用:

  1. 非负值:MAE的取值范围是从0到无穷大。MAE是实际值与预测值之差的绝对值的平均,因此它永远是非负的。MAE等于0表示完美预测,即所有预测值都完全等于实际值。

  2. 量纲一致性:MAE的单位与被预测数据的单位相同。例如,如果你在预测消费者支出(以美元计),MAE的单位也将是美元。这使得MAE易于理解和解释。

  3. 易于理解和解释:由于MAE是每个误差的平均绝对值,它提供了一个直观的度量,显示平均每个预测的误差大小。这使得非技术用户也能容易地理解模型性能。

  4. 对所有错误相等敏感:MAE给予所有的预测误差相同的权重,无论它们的大小。这与平均平方误差(MSE)不同,后者对较大的误差给予更高的惩罚(因为误差被平方)。因此,MAE对异常值的影响较小,更加稳健。

  5. 中位数的最优性:在统计学中,MAE的一个有趣特点是它的最小化等同于找到一组数据的中位数,而不是均值。这意味着当使用MAE作为损失函数时,它倾向于产生对抗异常值的鲁棒预测。

这些特点使得MAE成为在各种应用中评估预测准确性的一个非常实用和受欢迎的工具,特别是在需要一个直观、易解释和对异常值相对稳健的误差度量时。

这篇关于【科研】常用的实验结果评价指标(2) —— MAE 是什么? !的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/990257

相关文章

Linux上设置Ollama服务配置(常用环境变量)

《Linux上设置Ollama服务配置(常用环境变量)》本文主要介绍了Linux上设置Ollama服务配置(常用环境变量),Ollama提供了多种环境变量供配置,如调试模式、模型目录等,下面就来介绍一... 目录在 linux 上设置环境变量配置 OllamPOgxSRJfa手动安装安装特定版本查看日志在

Java常用注解扩展对比举例详解

《Java常用注解扩展对比举例详解》:本文主要介绍Java常用注解扩展对比的相关资料,提供了丰富的代码示例,并总结了最佳实践建议,帮助开发者更好地理解和应用这些注解,需要的朋友可以参考下... 目录一、@Controller 与 @RestController 对比二、使用 @Data 与 不使用 @Dat

Mysql中深分页的五种常用方法整理

《Mysql中深分页的五种常用方法整理》在数据量非常大的情况下,深分页查询则变得很常见,这篇文章为大家整理了5个常用的方法,文中的示例代码讲解详细,大家可以根据自己的需求进行选择... 目录方案一:延迟关联 (Deferred Join)方案二:有序唯一键分页 (Cursor-based Paginatio

Python实现常用文本内容提取

《Python实现常用文本内容提取》在日常工作和学习中,我们经常需要从PDF、Word文档中提取文本,本文将介绍如何使用Python编写一个文本内容提取工具,有需要的小伙伴可以参考下... 目录一、引言二、文本内容提取的原理三、文本内容提取的设计四、文本内容提取的实现五、完整代码示例一、引言在日常工作和学

Redis中的常用的五种数据类型详解

《Redis中的常用的五种数据类型详解》:本文主要介绍Redis中的常用的五种数据类型详解,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Redis常用的五种数据类型一、字符串(String)简介常用命令应用场景二、哈希(Hash)简介常用命令应用场景三、列表(L

python中time模块的常用方法及应用详解

《python中time模块的常用方法及应用详解》在Python开发中,时间处理是绕不开的刚需场景,从性能计时到定时任务,从日志记录到数据同步,时间模块始终是开发者最得力的工具之一,本文将通过真实案例... 目录一、时间基石:time.time()典型场景:程序性能分析进阶技巧:结合上下文管理器实现自动计时

C#中的 Dictionary常用操作

《C#中的Dictionary常用操作》C#中的DictionaryTKey,TValue是用于存储键值对集合的泛型类,允许通过键快速检索值,并且具有唯一键、动态大小和无序集合的特性,常用操作包括添... 目录基本概念Dictionary的基本结构Dictionary的主要特性Dictionary的常用操作

Python中常用的四种取整方式分享

《Python中常用的四种取整方式分享》在数据处理和数值计算中,取整操作是非常常见的需求,Python提供了多种取整方式,本文为大家整理了四种常用的方法,希望对大家有所帮助... 目录引言向零取整(Truncate)向下取整(Floor)向上取整(Ceil)四舍五入(Round)四种取整方式的对比综合示例应

C#中读取XML文件的四种常用方法

《C#中读取XML文件的四种常用方法》Xml是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具,下面我们就来看看C#中读取XML文件的方法都有哪些吧... 目录XML简介格式C#读取XML文件方法使用XmlDocument使用XmlTextReader/XmlTextWr

CSS弹性布局常用设置方式

《CSS弹性布局常用设置方式》文章总结了CSS布局与样式的常用属性和技巧,包括视口单位、弹性盒子布局、浮动元素、背景和边框样式、文本和阴影效果、溢出隐藏、定位以及背景渐变等,通过这些技巧,可以实现复杂... 一、单位元素vm 1vm 为视口的1%vh 视口高的1%vmin 参照长边vmax 参照长边re