本文主要是介绍yolov3 v4 v5的对比,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
以下将以v3、v4、v5的顺序进行介绍并比对:
1、输入端
yolov4:Mosaic数据增强、(cmBN、SAT自对抗训练)
yolov5:Mosaic数据增强、自适应锚框计算、自适应图片缩放
Yolov5会自动按照新的数据集的labels自动学习anchors的尺寸。采用 k 均值和遗传学习算法对自定义数据集进行分析,获得适合自定义数据集中对象边界框预测的预设锚定框。
2、backbone
yolov3 、v4网络结构,参考:https://zhuanlan.zhihu.com/p/143747206
yolov3网络结构
yolov4网络结构
yolov5s网络结构
yolov3:Darknet53,借鉴了ResNet的残差结构,使用这种结构可以让网络结构更深。
yolov4:将各种新的方式结合起来,包括:CSPDarknet53、Mish激活函数、Dropblock。
CSPDarknet53,CSP就是CSPNet论文里面跨阶段局部融合网络,CSP结构在每个res_block残差块的头尾增加连接,使特征更好的向后传递,对小目标有好处。CSPNet仿照的是Densenet密集跨层跳层连接思想,但是考虑到内存消耗过大,故修改为部分局部跨层融合做法.
yolov5:Focus结构,CSP结构。
Focus结构使用切片并concat的方式替换尺化操作,减少尺寸的同时不减少特征。由于减少了卷积层,所以可以减少计算量,同时不损失精度。
Yolov5与Yolov4不同点在于,Yolov4中只有主干网络使用了CSP结构。而Yolov5中设计了两种CSP结构,以Yolov5s网络为例,CSP1_X结构应用于Backbone主干网络,另一种CSP2_X结构则应用于Neck中。
3、neck
yolov3:FPN
yolov4: SPP模块、FPN+PAN结构
采用SPP模块的方式,比单纯的使用k*k最大池化的方式,更有效的增加主干特征的接收范围,显著的分离了最重要的上下文特征。
yolov5:与yolov4一样的FPN+PAN结构,不同点在于Yolov4的Neck结构中,采用的都是普通的卷积操作。而Yolov5的Neck结构中,采用借鉴CSPnet设计的CSP2结构,加强网络特征融合的能力。
Prediction创新
yolov3:
一个是目标框位置x,y,w,h(左上角和长宽)带来的误差,也即是 box 带来的 loss。
而在 box 带来的 loss 中又分为x,y 带来的 BCE Loss 以及w,h带来的 MSE Loss。
一个是目标置信度带来的误差,也就是 obj 带来的 loss(BCE Loss)。
最后一个是类别带来的误差,也就是 class 带来的 loss(类别数个 BCE Loss)
yolov4: CIOU_loss、DIOU_nms
Bounding Box Regeression的Loss近些年的发展过程是:Smooth L1 Loss-> IoU Loss(2016)-> GIoU Loss(2019)-> DIoU Loss(2020)->CIoU Loss(2020)
nms时将IOU替换成DIOU,提高对密集及遮挡目标的效果。
yolov5:GIOU_loss、加权nms(不如yolov4)
yolov4:https://zhuanlan.zhihu.com/p/143747206 写的太详细了
https://zhuanlan.zhihu.com/p/150127712
yolov5:https://zhuanlan.zhihu.com/p/172121380
这篇关于yolov3 v4 v5的对比的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!