【目标检测实验系列】YOLOv5创新点改进：融合高效轻量级网络结构GSConv，减轻模型复杂度的同时保持检测精度！（内含源代码，超详细改进代码流程）

本文主要是介绍【目标检测实验系列】YOLOv5创新点改进：融合高效轻量级网络结构GSConv，减轻模型复杂度的同时保持检测精度！（内含源代码，超详细改进代码流程），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

自我介绍：本人硕士期间全程放养，目前成果:一篇北大核心CSCD录用,两篇中科院三区已见刊，一篇中科院三区在投。如何找创新点，如何放养过程厚积薄发，如何写中英论文，找期刊等等。本人后续会以自己实战经验详细写出来，还请大家能够点个关注和赞，收藏一下，谢谢大家

1. 文章主要内容

本篇博客主要涉及将GSConv融合到YOLOv5模型中。通过GSConv替换普通的卷积结构，减轻模型复杂度的同时保持检测精度。（通读本篇博客需要7分钟左右的时间）。

2. GSConv原理

简单的来讲是，GSConv能够降低计算量的同时提升模型检测的速度，和保持检测的精度，甚至可能涨点。具体的原理解析推荐博客：【论文笔记】Slim-neck by GSConv。

3 详细代码改进流程(含本人经验)

3.1 GSConv(与VoVGSCSP)源代码(大家自己创建GSConv.py文件)

import torch
from torch import nnfrom models.common import Convclass GSConv(nn.Module):# GSConv https://github.com/AlanLi1997/slim-neck-by-gsconvdef __init__(self, c1, c2, k=1, s=1, g=1, act=True):super().__init__()c_ = c2 // 2self.cv1 = Conv(c1, c_, k, s, None, g, act)self.cv2 = Conv(c_, c_, 5, 1, None, c_, act)def forward(self, x):x1 = self.cv1(x)x2 = torch.cat((x1, self.cv2(x1)), 1)# shuffleb, n, h, w = x2.data.size()b_n = b * n // 2y = x2.reshape(b_n, 2, h * w)y = y.permute(1, 0, 2)y = y.reshape(2, -1, n // 2, h, w)return torch.cat((y[0], y[1]), 1)class GSBottleneck(nn.Module):# GS Bottleneck https://github.com/AlanLi1997/slim-neck-by-gsconvdef __init__(self, c1, c2, k=3, s=1):super().__init__()c_ = c2 // 2# for lightingself.conv_lighting = nn.Sequential(GSConv(c1, c_, 1, 1),GSConv(c_, c2, 1, 1, act=False))# for receptive fieldself.conv = nn.Sequential(GSConv(c1, c_, 3, 1),GSConv(c_, c2, 3, 1, act=False))self.shortcut = Conv(c1, c2, 3, 1, act=False)def forward(self, x):return self.conv_lighting(x) + self.shortcut(x)class VoVGSCSP(nn.Module):# VoV-GSCSP https://github.com/AlanLi1997/slim-neck-by-gsconvdef __init__(self, c1, c2, n=1, shortcut=True, g=1, e=0.5):super().__init__()c_ = int(c2 * e)self.cv1 = Conv(c1, c_, 1, 1)self.cv2 = Conv(2 * c_, c2, 1)self.m = nn.Sequential(*(GSBottleneck(c_, c_) for _ in range(n)))def forward(self, x):x1 = self.cv1(x)return self.cv2(torch.cat((self.m(x1), x1), dim=1))

3.2 建立一个yolov5-gsconv.yaml文件

GSConv原论文中，是通过原理加实验的方式证明了将GSConv放到颈部结构效果更高，这里将YOLOv5的Neck部分Conv替换GSConv，一共四个地方。源代码如下：

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license# Parameters
nc: 4  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors:- [10,13, 16,30, 33,23]  # P3/8  小目标- [30,61, 62,45, 59,119]  # P4/16 中目标- [116,90, 156,198, 373,326]  # P5/32  大目标# YOLOv5 v6.0 backbone
backbone:# [from, number, module, args][[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2  output_channel, kernel_size, stride, padding[-1, 1, Conv, [128, 3, 2]],  # 1-P2/4[-1, 3, C3, [128]],[-1, 1, Conv, [256, 3, 2]],  # 3-P3/8[-1, 6, C3, [256]],[-1, 1, Conv, [512, 3, 2]],  # 5-P4/16[-1, 9, C3, [512]],[-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32[-1, 3, C3, [1024]],[-1, 1, SPPF, [1024, 5]],  # 9]# YOLOv5 v6.0 head
head:[[-1, 1, GSConv, [512, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 6], 1, Concat, [1]],  # cat backbone P4[-1, 3, C3, [512, False]],  # 13[-1, 1, GSConv, [256, 1, 1]],[-1, 1, nn.Upsample, [None, 2, 'nearest']],[[-1, 4], 1, Concat, [1]],  # cat backbone P3[-1, 3, C3, [256, False]],  # 17 (P3/8-small)[-1, 1, GSConv, [256, 3, 2]],[[-1, 14], 1, Concat, [1]],  # cat head P4[-1, 3, C3, [512, False]],  # 20 (P4/16-medium)[-1, 1, GSConv, [512, 3, 2]],[[-1, 10], 1, Concat, [1]],  # cat head P5[-1, 3, C3, [1024, False]],  # 23 (P5/32-large)[[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)]

注意到，yaml文件中的nc为数据集的类别数，需要改成自己数据集的类别。另外，也可以将源码中的VoVGSCSP结构替换掉Neck部分的C3，不过据本人实验，效果并不好，掉点有点多，可能是数据集的问题，大家可以自行尝试一下。另外，GSConv替换Neck部分几个普通的Conv效果最好，和数据集也有关系，多做下消融实验，将这种位置上的消融实验写进论文也是丰富了实验的内容，更加有说服力。