yolov3算法中关于loss={'yolo_loss': lambda y_true, y_pred: y_pred}的理解

2024-04-20 20:18

本文主要是介绍yolov3算法中关于loss={'yolo_loss': lambda y_true, y_pred: y_pred}的理解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

yolov3算法中关于loss={‘yolo_loss’: lambda y_true, y_pred: y_pred}的理解

参考文献:
(1)https://www.jianshu.com/p/7e45586c44be
(2)https://blog.csdn.net/wangdongwei0/article/details/82563689?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
(3)https://kexue.fm/archives/4493

所用的yolov3代码: https://github.com/qqwweee/keras-yolo3 ,解压之后用pycharm打开。

在train.py中有如下代码,对模型进行编译:

    if True:model.compile(optimizer=Adam(lr=1e-3), loss={# use custom yolo_loss Lambda layer.'yolo_loss': lambda y_true, y_pred: y_pred})

刚开始对 loss={‘yolo_loss’: lambda y_true, y_pred: y_pred})不理解,通过查看相关博客,个人理解如下:
首先查看 Keras中的目标函数(损失函数)的定义方法(路径是keras→losses.py):

def mean_squared_error(y_true, y_pred):return K.mean(K.square(y_pred - y_true), axis=-1)def mean_absolute_error(y_true, y_pred):return K.mean(K.abs(y_pred - y_true), axis=-1)def mean_absolute_percentage_error(y_true, y_pred):diff = K.abs((y_true - y_pred) / K.clip(K.abs(y_true),K.epsilon(),None))return 100. * K.mean(diff, axis=-1)

可以发现y_true, y_pred是标准的函数输入参数,一个代表真实值(标签),一个代表预测值,函数返回的是即为预测值与真实值的某种误差函数。

但yolov3算法中,将loss函数写成一个Lambda层了,即该层的输出就是模型的loss值,也就是模型的预测值 y_pred.

model_loss = Lambda(yolo_loss, output_shape=(1,), name='yolo_loss',arguments={'anchors': anchors, 'num_classes': num_classes, 'ignore_thresh': 0.5})([*model_body.output, *y_true])

因此,模型compile时传递的是自定义的loss,自定义的方法是使用Python里的匿名函数,即 lambda y_true, y_pred: y_pred, 其中,该匿名函数的输入参数是y_true, y_pred: y_pred,代表模型的真实值和预测值,该匿名函数的返回值是y_pred,即模型的预测值,该预测值正是loss值。
对于loss={‘yolo_loss’: lambda y_true, y_pred: y_pred}中的’yolo_loss’,参考以下文献就明白了:
https://keras-zh.readthedocs.io/getting-started/functional-api-guide/
https://blog.csdn.net/xiaohuihui1994/article/details/81022043
我的理解是凡是在字典中的键,如loss={‘yolo_loss’: lambda y_true, y_pred: y_pred}中的’yolo_loss’,loss_weights={‘main_output’: 1., ‘aux_output’: 0.2})中的’main_output’,model.fit({‘main_input’: headline_data, ‘aux_input’: additional_data}, {‘main_output’: headline_labels, ‘aux_output’: additional_labels},epochs=50, batch_size=32)中的’main_input’、'aux_input’等,都是在在定义层时传递的一个 name 参数,即
model_loss = Lambda(yolo_loss, output_shape=(1,), name=‘yolo_loss’,
arguments={‘anchors’: anchors, ‘num_classes’: num_classes, ‘ignore_thresh’: 0.5})(
[*model_body.output, *y_true]) 中的name=‘yolo_loss’ 。

    if True:model.compile(optimizer=Adam(lr=1e-3), loss={# use custom yolo_loss Lambda layer.'yolo_loss': lambda y_true, y_pred: y_pred})

这篇关于yolov3算法中关于loss={'yolo_loss': lambda y_true, y_pred: y_pred}的理解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/921229

相关文章

Python19 lambda表达式

在 Python 中,lambda 表达式是一个小型匿名函数,通常用于实现简单、单行的函数。lambda 函数可以接受任意数量的参数,但只能有一个表达式。 基本语法: lambda arguments: expression 这里,arguments 是传递给 lambda 的参数,expression 是关于这些参数的表达式,它的计算结果就是 lambda 函数的返回值。 使用

java8的新特性之一(Java Lambda表达式)

1:Java8的新特性 Lambda 表达式: 允许以更简洁的方式表示匿名函数(或称为闭包)。可以将Lambda表达式作为参数传递给方法或赋值给函数式接口类型的变量。 Stream API: 提供了一种处理集合数据的流式处理方式,支持函数式编程风格。 允许以声明性方式处理数据集合(如List、Set等)。提供了一系列操作,如map、filter、reduce等,以支持复杂的查询和转

代码随想录算法训练营:12/60

非科班学习算法day12 | LeetCode150:逆波兰表达式 ,Leetcode239: 滑动窗口最大值  目录 介绍 一、基础概念补充: 1.c++字符串转为数字 1. std::stoi, std::stol, std::stoll, std::stoul, std::stoull(最常用) 2. std::stringstream 3. std::atoi, std

回调的简单理解

之前一直不太明白回调的用法,现在简单的理解下 就按这张slidingmenu来说,主界面为Activity界面,而旁边的菜单为fragment界面。1.现在通过主界面的slidingmenu按钮来点开旁边的菜单功能并且选中”区县“选项(到这里就可以理解为A类调用B类里面的c方法)。2.通过触发“区县”的选项使得主界面跳转到“区县”相关的新闻列表界面中(到这里就可以理解为B类调用A类中的d方法

人工智能机器学习算法总结神经网络算法(前向及反向传播)

1.定义,意义和优缺点 定义: 神经网络算法是一种模仿人类大脑神经元之间连接方式的机器学习算法。通过多层神经元的组合和激活函数的非线性转换,神经网络能够学习数据的特征和模式,实现对复杂数据的建模和预测。(我们可以借助人类的神经元模型来更好的帮助我们理解该算法的本质,不过这里需要说明的是,虽然名字是神经网络,并且结构等等也是借鉴了神经网络,但其原型以及算法本质上还和生物层面的神经网络运行原理存在

yolov3 上生产

1、在生产环境上编译darknet,执行make命令就好哦。  通过以后,拿到libdarknet.so 2、改一改../python/darknet.py文件 3、把darknet里的四个模型文件地址改一改就可以了     后面我会写一篇详细的,今天我要回家了

YOLO v3 训练速度慢的问题

一天一夜出了两个模型,仅仅迭代了200次   原因:编译之前没有将Makefile 文件里的GPU设置为1,编译的是CPU版本,必须训练慢   解决方案: make clean  vim Makefile make   再次训练 速度快了,5分钟迭代了500次

大林 PID 算法

Dahlin PID算法是一种用于控制和调节系统的比例积分延迟算法。以下是一个简单的C语言实现示例: #include <stdio.h>// DALIN PID 结构体定义typedef struct {float SetPoint; // 设定点float Proportion; // 比例float Integral; // 积分float Derivative; // 微分flo

如何理解redis是单线程的

写在文章开头 在面试时我们经常会问到这样一道题 你刚刚说redis是单线程的,那你能不能告诉我它是如何基于单个线程完成指令接收与连接接入的? 这时候我们经常会得到沉默,所以对于这道题,笔者会直接通过3.0.0源码分析的角度来剖析一下redis单线程的设计与实现。 Hi,我是 sharkChili ,是个不断在硬核技术上作死的 java coder ,是 CSDN的博客专家 ,也是开源

MySQL理解-下载-安装

MySQL理解: mysql:是一种关系型数据库管理系统。 下载: 进入官网MySQLhttps://www.mysql.com/  找到download 滑动到最下方:有一个开源社区版的链接地址: 然后就下载完成了 安装: 双击: 一直next 一直next这一步: 一直next到这里: 等待加载完成: 一直下一步到这里