Adaloss: 用于关键点定位的自适应损失函数

2024-06-21 08:18

本文主要是介绍Adaloss: 用于关键点定位的自适应损失函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Jae Duk Seo

编译:ronghuaiyang

导读

逐步的增加训练的难度,让模型越来越准确。

这里给大家介绍关键点定位的另一个损失函数,但现在我们使用的是热图,我们使用2D概率图。(但这种损失有点特殊,因为它会自适应ground truth数据,并进行梯度控制)。

因此,某些损失的值会更集中,如中小损失。

对于任何与计算机视觉相关的任务,如果我们需要检测关键点的话,通常准确的预测这些关键点是很难的。

这个方法能给出令人印象深刻的结果,非常的准确。大多数现有的深度学习方法都是输出坐标或热图。

首先,对二维高斯分布进行展开,但随着训练的进行,它会变得更加精确,这很好,因为网络正在处理一个更困难的问题。首先,我们将使用较大的方差,因此训练可以更容易地进行,然而,随着训练的进行,我们将变得更精确。

本文的特别之处在于,他们创建了一个基于自适应损失函数的应用,这是非常有趣的。模型需要更少的迭代就能收敛了,这是很好的优点。

他们在不同的应用上尝试了他们的方法,希望能够向所有人展示令人印象深刻的结果。热力图更好?在添加了跳跃连接和FCN之后似乎是这样的。有些工作是与视频相关的,有些工作甚至是使用GANs创建一个新的数据集,这是一项艰巨的任务。

他们使用的是热力图的回归方法,他们的损失函数是专门创建的,在创建损失函数之前考虑优化器。这是一种创造自适应损失函数的有趣方法,我们需要设置一些超参数,并根据这些值改变梯度,而不是调整优化器。

如上图所示,损失值在变小,这是因为Adaloss能够适应当前的误差损失值,使事情变得更加困难,从而获得更好的精度。

他们使用了不同的数据集 —— 医学图像和cat图像。

Adaloss真的很好,更好的收敛性。而且距离变得更精确了。

损失值变得更小了,模型也更精确了。

在这里我们可以看到,高斯分布的标准差变小了,并且在收敛时并没有减小。

哇,这是非常好的特点,在做人脸关键点检测的时候,我们能够为某些部位设置特定的σ值,这样就可以专注于人脸的特定部位。

眉毛和下巴的轮廓很难预测,因为它们可能被遮住了,或者因为那里的角点没有显示出来。

我们可以观察到作者的方法给出了很多稳定的结果,将这种方法用于不同的应用,如医疗手术,是另一个伟大的应用。

他们能够提高结果的状态 —— 这要归功于创建了一个新的损失函数,在这个函数中,随着训练的继续,问题会变得更加困难(梯度控制)。

—END—

英文原文:https://medium.com/@SeoJaeDuk/adaloss-adaptive-loss-function-for-landmark-localization-13315f9943d3

请长按或扫描二维码关注本公众号

喜欢的话,请给我个在看吧

这篇关于Adaloss: 用于关键点定位的自适应损失函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080688

相关文章

【操作系统】信号Signal超详解|捕捉函数

🔥博客主页: 我要成为C++领域大神🎥系列专栏:【C++核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 ​ 如何触发信号 信号是Linux下的经典技术,一般操作系统利用信号杀死违规进程,典型进程干预手段,信号除了杀死进程外也可以挂起进程 kill -l 查看系统支持的信号

java中查看函数运行时间和cpu运行时间

android开发调查性能问题中有一个现象,函数的运行时间远低于cpu执行时间,因为函数运行期间线程可能包含等待操作。native层可以查看实际的cpu执行时间和函数执行时间。在java中如何实现? 借助AI得到了答案 import java.lang.management.ManagementFactory;import java.lang.management.Threa

SQL Server中,isnull()函数以及null的用法

SQL Serve中的isnull()函数:          isnull(value1,value2)         1、value1与value2的数据类型必须一致。         2、如果value1的值不为null,结果返回value1。         3、如果value1为null,结果返回vaule2的值。vaule2是你设定的值。        如

时间服务器中,适用于国内的 NTP 服务器地址,可用于时间同步或 Android 加速 GPS 定位

NTP 是什么?   NTP 是网络时间协议(Network Time Protocol),它用来同步网络设备【如计算机、手机】的时间的协议。 NTP 实现什么目的?   目的很简单,就是为了提供准确时间。因为我们的手表、设备等,经常会时间跑着跑着就有误差,或快或慢的少几秒,时间长了甚至误差过分钟。 NTP 服务器列表 最常见、熟知的就是 www.pool.ntp.org/zo

tf.split()函数解析

API原型(TensorFlow 1.8.0): tf.split(     value,     num_or_size_splits,     axis=0,     num=None,     name='split' ) 这个函数是用来切割张量的。输入切割的张量和参数,返回切割的结果。  value传入的就是需要切割的张量。  这个函数有两种切割的方式: 以三个维度的张量为例,比如说一

神经网络第三篇:输出层及softmax函数

在上一篇专题中,我们以三层神经网络的实现为例,介绍了如何利用Python和Numpy编程实现神经网络的计算。其中,中间(隐藏)层和输出层的激活函数分别选择了 sigmoid函数和恒等函数。此刻,我们心中不难发问:为什么要花一个专题来介绍输出层及其激活函数?它和中间层又有什么区别?softmax函数何来何去?下面我们带着这些疑问进入本专题的知识点: 1 输出层概述 2 回归问题及恒等函数 3

神经网络第一篇:激活函数是连接感知机和神经网络的桥梁

前面发布的文章介绍了感知机,了解了感知机可以通过叠加层表示复杂的函数。遗憾的是,设定合适的、能符合预期的输入与输出的权重,是由人工进行的。从本章开始,将进入神经网络的学习,首先介绍激活函数,因为它是连接感知机和神经网络的桥梁。如果读者认知阅读了本专题知识,相信你必有收获。 感知机数学表达式的简化 前面我们介绍了用感知机接收两个输入信号的数学表示如下:

vscode python pip : 无法将“pip”项识别为 cmdlet、函数、脚本文件或可运行程序的名称

在vscode中控制台运行python文件出现:无法将"pip”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 使用vscode开发python,需要安装python开发扩展: 本文已经安装,我们需要找的是python安装所在目录,本文实际路径如下: 如果在本文路径中没有此目录,请尝试在C盘中搜索 python,搜索到相关python目录后,点击Python 3.9进入目录,

C语言入门系列:初识函数

文章目录 一,C语言函数与数学函数的区别1,回忆杀-初中数学2,C语言中的函数 二, 函数的声明1,函数头1.1,函数名称1.2,返回值类型1.3,参数列表 2,函数体2.1,函数体2.2,return语句 三,main函数四,函数的参数与传递方式1,实参和形参1.1,函数定义(含形参)1.2,函数调用(使用实参) 2,参数传递方式2.1,值传递2.2,引用传递 五,函数原型与预声明1,

HTML(20)——定位

定位 作用:灵活的改变盒子在网页中的位置 实现: 定位模式:position边偏移:设置盒子的位置 leftrighttopbottom 相对定位 position:relative 改变位置的参照物是自己原来的位置,并且不脱标占位,标签显示模式特点不变 绝对定位 position:absolute 使用场景:子级绝对定位,父级相对定位  脱标不占位参照物:先找最近的已经