主干网络篇 | YOLOv5/v7 更换主干网络之 ResNet50/ResNet101 | 对比实验必备

2024-06-22 09:04

本文主要是介绍主干网络篇 | YOLOv5/v7 更换主干网络之 ResNet50/ResNet101 | 对比实验必备,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

主干网络篇 | YOLOv5/v7 更换主干网络之 ResNet50/ResNet101 | 对比实验必备

1. 简介

ResNet 是近年来最受欢迎的深度卷积神经网络架构之一,它以其优异的性能和鲁棒性而著称。ResNet50 和 ResNet101 是 ResNet 家族中最常用的两个模型,它们分别具有 50 层和 101 层残差块。

YOLOv5 和 YOLOv7 是目前流行的实时目标检测框架,它们以其快速、准确的检测性能而著称。然而,YOLOv5/v7 的默认主干网络通常是轻量级的,例如 Darknet53 或 CSPDarknet53,这可能会导致模型精度略逊于其他更复杂的模型。

将 ResNet50/ResNet101 作为主干网络替换 YOLOv5/v7 中原有骨干网络可以显著提高模型的精度,但同时也增加了模型的计算量。

2. 原理详解

ResNet 的核心思想是通过引入残差连接来解决深度卷积神经网络的梯度消失问题。残差连接可以将输入特征直接传递到输出特征,从而使梯度更容易流过网络。

ResNet 的基本结构如下图所示:

​编辑Opens in a new window​编辑www.researchgate.net

ResNet basic structure

ResNet50 和 ResNet101 的主要区别在于它们残差块的数量。ResNet50 具有 4 个阶段,每个阶段包含 3 个或 4 个残差块。ResNet101 具有 5 个阶段,每个阶段包含 3 个或 4 个残差块。

3. 应用场景解释

将 ResNet50/ResNet101 作为主干网络替换 YOLOv5/v7 中原有骨干网络具有以下优势:

  • 提高模型精度: ResNet50/ResNet101 在 ImageNet 数据集上取得了 76.1% 和 82.1% 的 Top-1 准确率,显著高于 YOLOv5/v7 默认主干网络的精度。
  • 扩展模型应用场景: ResNet50/ResNet101 可以应用于更复杂的场景,例如医学图像分析、遥感图像分析等。

4. 算法实现

将 ResNet50/ResNet101 作为主干网络替换 YOLOv5/v7 中原有骨干网络的具体步骤如下:

  1. 下载 ResNet50/ResNet101 预训练权重: 从 PyTorch 官方网站下载 ResNet50/ResNet101 预训练权重。
  2. 修改 YOLOv5/v7 代码: 修改 YOLOv5/v7 代码,将原有的骨干网络替换为 ResNet50/ResNet101。
  3. 训练模型: 如果需要,可以对模型进行微调以提高性能。

5. 完整代码实现

import torch
import torch.nn as nn
from torchvision.models import resnet50, resnet101class ResNetBackbone(nn.Module):def __init__(self, pretrained=True):super(ResNetBackbone, self).__init__()if pretrained:self.resnet = resnet50(pretrained=True)else:self.resnet = resnet50()self.layer1 = self.resnet.conv1self.layer2 = self.resnet.layer1self.layer3 = self.resnet.layer2self.layer4 = self.resnet.layer3def forward(self, x):x = self.layer1(x)x = self.layer2(x)x = self.layer3(x)x = self.layer4(x)return xdef get_resnet_backbone(pretrained=True):return ResNetBackbone(pretrained=pretrained)def get_backbone(name, **kwargs):"""Get a backbone by name."""if name == 'resnet50':return get_resnet_backbone(**kwargs)elif name == 'resnet101':return get_resnet_backbone(**kwargs)else:raise ValueError('Unknown backbone name: {}'.format(name))

 

6. 部署测试搭建实现

将 ResNet50/ResNet101 作为主干网络的 YOLOv5/v7 模型可以部署在各种平台上,包括:

  • CPU: ResNet50
        return get_resnet_backbone(**kwargs)else:raise ValueError('Unknown backbone name: {}'.format(name))

Python

import torch
import torch.nn as nn
from torch.hub import load_state_dict_from_urlclass Darknet(nn.Module):def __init__(self, pretrained=False, cfg='yolov5s.yaml'):super().__init__()if pretrained:print(f"Loading YOLOv5 {cfg} pretrained model")self.model = load_state_dict_from_url(f"https://github.com/ultralytics/yolov5/blob/master/models/{cfg}",strict=True,)else:print(f"Creating YOLOv5 {cfg} model")self.model = torch.hub.load("ultralytics/yolov5", cfg, pretrained=False)def forward(self, x):return self.model(x)def get_backbone(name, **kwargs):"""Get a backbone by name."""if name == 'darknet53':return Darknet(**kwargs)elif name == 'cspdarknet53':return CSPDarknet(**kwargs)else:raise ValueError('Unknown backbone name: {}'.format(name))def get_model(cfg, pretrained=False, backbone='darknet53'):"""Create a YOLOv5 model."""backbone = get_backbone(backbone, pretrained=pretrained)model = Model(backbone, cfg)return model

 

YOLOv7 完整代码实现

import torch
import torch.nn as nn
from ultralytics.models.common import ConvBNFuseclass Darknet(nn.Module):def __init__(self, pretrained=False, cfg='yolov7.yaml'):super().__init__()if pretrained:print(f"Loading YOLOv7 {cfg} pretrained model")self.model = load_state_dict_from_url(f"https://github.com/ultralytics/yolov7/blob/master/models/{cfg}",strict=True,)else:print(f"Creating YOLOv7 {cfg} model")self.model = torch.hub.load("ultralytics/yolov7", cfg, pretrained=False)def forward(self, x):return self.model(x)def get_backbone(name, **kwargs):"""Get a backbone by name."""if name == 'cspdarknet53':return CSPDarknet(**kwargs)elif name == 'cspdarknet53_v2':return CSPDarknetV2(**kwargs)else:raise ValueError('Unknown backbone name: {}'.format(name))def get_model(cfg, pretrained=False, backbone='cspdarknet53'):"""Create a YOLOv7 model."""backbone = get_backbone(backbone, pretrained=pretrained)model = Model(backbone, cfg)return model

 

HGNetv2 完整代码实现

import paddle
import paddle.nn as nn
from ppcv.modeling import backbonesclass HGNetv2(nn.Layer):def __init__(self, channels=[64, 128, 256, 512, 1024]):super(HGNetv2, self).__init__()self.stages = nn.Sequential(_hgnet_stage(channels[0], name='stage1'),_hgnet_stage(channels[1], name='stage2'),_hgnet_stage(channels[2], name='stage3'),_hgnet_stage(channels[3], name='stage4'),_hgnet_stage(channels[4], name='stage5'),)def forward(self, x):return self.stages(x)def _hgnet_stage(filters, name):return nn.Sequential(_hgnet_block(filters, name=name + '_block1'),_hgnet_block(filters, name=name + '_block2'),_hgnet_block(filters, name=name + '_block3'),)

6. 部署测试搭建实现

将 ResNet50/ResNet101 作为主干网络的 YOLOv5/v7 模型可以部署在各种平台上,包括:

  • CPU: ResNet50/ResNet101 的推理速度较慢,在 CPU 上部署可能会比较慢。
  • GPU: 在 GPU 上部署 ResNet50/ResNet101 可以获得更高的性能。
  • 服务器: ResNet50/ResNet101 可以部署在服务器上,用于处理大规模的目标检测任务。

部署测试搭建的具体步骤取决于所使用的平台和硬件。以下是一些通用的步骤:

  1. 安装依赖库: 安装 PyTorch、YOLOv5/v7 等必要的库。
  2. 下载模型权重: 下载训练好的 ResNet50/ResNet101 YOLOv5/v7 模型权重。
  3. 转换模型格式: 如果需要,将模型权重转换为目标平台的格式。
  4. 部署模型: 将模型部署到目标平台上。
  5. 测试模型: 测试模型的性能和精度。

7. 文献材料链接

  • Deep Residual Learning for Image Recognition
  • YOLOv5: An Enhanced Version of YOLOv3
  • PP-LCNet: An Efficient Convolutional Neural Network for Image Classification

8. 应用示例产品

将 ResNet50/ResNet101 作为主干网络的 YOLOv5/v7 模型已经应用于各种产品和场景中,例如:

  • 智能安防: ResNet50/ResNet101 可以用于智能安防系统,进行实时的人脸识别、物体识别等。
  • 自动驾驶: ResNet50/ResNet101 可以用于自动驾驶系统,进行障碍物检测、车道线识别等。
  • 医学图像分析: ResNet50/ResNet101 可以用于医学图像分析,进行病灶检测、器官分割等。

9. 总结

将 ResNet50/ResNet101 作为主干网络替换 YOLOv5/v7 中原有骨干网络可以显著提高模型的精度,但同时也增加了模型的计算量。

10. 影响

ResNet 的出现对深度卷积神经网络架构设计产生了深远的影响,它证明了通过引入残差连接可以有效地提高模型的性能和鲁棒性。

11. 未来扩展

未来,可以继续探索更有效的 ResNet 变体,并将其应用于更多类型的模型和任务中。

 

这篇关于主干网络篇 | YOLOv5/v7 更换主干网络之 ResNet50/ResNet101 | 对比实验必备的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1083850

相关文章

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

免费也能高质量!2024年免费录屏软件深度对比评测

我公司因为客户覆盖面广的原因经常会开远程会议,有时候说的内容比较广需要引用多份的数据,我记录起来有一定难度,所以一般都用录屏工具来记录会议内容。这次我们来一起探索有什么免费录屏工具可以提高我们的工作效率吧。 1.福晰录屏大师 链接直达:https://www.foxitsoftware.cn/REC/  录屏软件录屏功能就是本职,这款录屏工具在录屏模式上提供了多种选项,可以选择屏幕录制、窗口

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

【机器学习】高斯网络的基本概念和应用领域

引言 高斯网络(Gaussian Network)通常指的是一个概率图模型,其中所有的随机变量(或节点)都遵循高斯分布 文章目录 引言一、高斯网络(Gaussian Network)1.1 高斯过程(Gaussian Process)1.2 高斯混合模型(Gaussian Mixture Model)1.3 应用1.4 总结 二、高斯网络的应用2.1 机器学习2.2 统计学2.3

STM32(十一):ADC数模转换器实验

AD单通道: 1.RCC开启GPIO和ADC时钟。配置ADCCLK分频器。 2.配置GPIO,把GPIO配置成模拟输入的模式。 3.配置多路开关,把左面通道接入到右面规则组列表里。 4.配置ADC转换器, 包括AD转换器和AD数据寄存器。单次转换,连续转换;扫描、非扫描;有几个通道,触发源是什么,数据对齐是左对齐还是右对齐。 5.ADC_CMD 开启ADC。 void RCC_AD