mmdetection使用未定义backbone训练

2024-06-11 13:44

本文主要是介绍mmdetection使用未定义backbone训练,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先找到你需要用到的 backbone,一般有名的backbone 都会在github有相应的代码开源和预训练权重提供
本文以mobilenetv3 + fastercnn 作为举例,在mmdetection中并未提供 mobilenetv3,提供的仅有 mobilenetv2;
在github上找到 mobilenetv3 实现和权重,下载到本地;本文使用参考为:https://github.com/d-li14/mobilenetv3.pytorch

为了能够用在mmdetection体系中,我们要对代码进行修改,以适应mmdetection 配置式构建网络

增加 init_weigths函数

 def init_weights(self, pretrained=None):logger = get_root_logger()if self.init_cfg is None and pretrained is None:logger.warn(f'No pre-trained weights for 'f'{self.__class__.__name__}, 'f'training start from scratch')passelse:assert 'checkpoint' in self.init_cfg, f'Only support ' \f'specify `Pretrained` in ' \f'`init_cfg` in ' \f'{self.__class__.__name__} 'if self.init_cfg is not None:ckpt_path = self.init_cfg['checkpoint']elif pretrained is not None:ckpt_path = pretrainedckpt = _load_checkpoint(ckpt_path, logger=logger, map_location='cpu')if 'state_dict' in ckpt:_state_dict = ckpt['state_dict']elif 'model' in ckpt:_state_dict = ckpt['model']else:_state_dict = ckptstate_dict = _state_dictmissing_keys, unexpected_keys = \self.load_state_dict(state_dict, False)logger.info(f"Miss {missing_keys}")logger.info(f"Unexpected {unexpected_keys}")

修改 模型参数列表

可以看到上面用到了 self.init_cfg ,但原始模型并没有,因此需要
修改模型参数列表,添加 init_cfg,out_indices,等
并初始化

修改forward 【结合模型特点、网络结构 进行修改,将out_indices 对应的输出取出来】

def forward(self, x):outs = []# x = self.features(x)for i,f in enumerate(self.features):x = f(x)if i in self.out_indices:outs.append(x)assert (len(outs) == 4)return outs

有些网络的实现并不是直接使用,而是使用配置,来提供不同类型的网络模型,这里就有 small large 两种
由于我们上面的 模型类 修改了参数列表,因此也需要对 这种二次配置的函数 参数列表进行修改 添加 init_cfg,out_indices 等,原有参数尽量保持不变

def mobilenetv3_large(pretrained=False, num_classes = 1000, distillation=False, init_cfg=None, out_indices=[],**kwargs):# ...cfgs = []return MobileNetV3(cfgs, mode='large',init_cfg=init_cfg, out_indices=out_indices,**kwargs)

添加注解

然后,我们要将他们添加到 mmdet 中的 registry 中,
mmdet提供了一种 装饰器的模式 用于将我们自定义的模型 加入到其中

# 导入
from mmdet.models.builder import BACKBONES,MODELS,Necks # 这里定义了mmdetection 的各种组件# 添加 注解
@BACKBONES.register_module()
def mobilenetv3_large():#...@BACKBONES.register_module()
def mobilenetv3_small():#...

这个时候,我们的文件基本修改完成

注意事项

注意这个时候 其实只是配置完成,但在运行时 不会真正加载到 registry 中 ,运行就会发现报错

'mobilenetv3_large is not in the models registry'"

解决方法 就是运行时引入,在train.py 导入这个文件

import mobilenetv3

我在配置时就遇到了这样情况,感谢 https://blog.csdn.net/Kiki_soda/article/details/137491803 提醒

debug

image.png
可以看到 我们的模型已经被加载进去

其他方法

官方提供的方法

  1. 一种是 修改源码层中的 init 文件,这个也要求你的mobilenet文件也要定义在源码文件中
  2. 使用一种 custom_imports 【尝试未成功】

具体参考官方文档 https://mmdetection.readthedocs.io/zh-cn/v2.21.0/tutorials/customize_models.html

配置文件

然后配置文件,根据模型结构合理设置参数

_base_ = ['./_base_/models/faster_rcnn_r50_fpn.py','./_base_/datasets/coco_detection.py','./_base_/schedules/schedule_1x.py', './_base_/default_runtime.py'
]model = dict(backbone=dict(type='mobilenetv3_large',init_cfg=dict(type='Pretrained',checkpoint='pretrain/mobilenetv3-large-1cd25616.pth', # 预训练权重位置),out_indices = [2, 5, 9, 14], # 根据模型来设置),neck=dict(type='FPN',in_channels=[24, 40, 80, 160], # 根据模型来设置 和out_indices 对应out_channels=256, # 修改这个会牵动 下面很多配置; 如需修改 其他后续参数也需修改num_outs=5))

完成!就可以开始训练了

对于如何设置 out_indices,可以参考 timm 提供的模型 特征输出情况,进而设置

参考:

https://blog.csdn.net/Kiki_soda/article/details/137491803
https://mmdetection.readthedocs.io/zh-cn/v2.21.0/tutorials/customize_models.html
https://www.cnblogs.com/qiulinzhang/p/12252033.html

这篇关于mmdetection使用未定义backbone训练的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1051335

相关文章

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Spring Boot中WebSocket常用使用方法详解

《SpringBoot中WebSocket常用使用方法详解》本文从WebSocket的基础概念出发,详细介绍了SpringBoot集成WebSocket的步骤,并重点讲解了常用的使用方法,包括简单消... 目录一、WebSocket基础概念1.1 什么是WebSocket1.2 WebSocket与HTTP

C#中Guid类使用小结

《C#中Guid类使用小结》本文主要介绍了C#中Guid类用于生成和操作128位的唯一标识符,用于数据库主键及分布式系统,支持通过NewGuid、Parse等方法生成,感兴趣的可以了解一下... 目录前言一、什么是 Guid二、生成 Guid1. 使用 Guid.NewGuid() 方法2. 从字符串创建

Python使用python-can实现合并BLF文件

《Python使用python-can实现合并BLF文件》python-can库是Python生态中专注于CAN总线通信与数据处理的强大工具,本文将使用python-can为BLF文件合并提供高效灵活... 目录一、python-can 库:CAN 数据处理的利器二、BLF 文件合并核心代码解析1. 基础合

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客