mmdet专题

【YOLO改进】换遍MMDET主干网络之EfficientNet(基于MMYOLO)

EfficientNet EfficientNet是Google在2019年提出的一种新型卷积神经网络架构,其设计初衷是在保证模型性能的同时,尽可能地降低模型的复杂性和计算需求。EfficientNet的核心思想是通过均衡地调整网络的深度(层数)、宽度(每层的通道数)和分辨率(输入的图像尺寸)这三个维度,以实现模型的性能最大化。 具体来说,EfficientNet使用了一个复合缩放方法(com

【YOLO改进】换遍MMDET主干网络之Pyramid Vision Transformerv2(PVTv2)(基于MMYOLO)

Pyramid Vision Transformer v2(PVTv2) Pyramid Vision Transformer v2(PVTv2)是在PVTv1的基础上进行改进的一种深度学习模型,它同样结合了Transformer架构和金字塔结构,旨在提供更强大的特征表示和更好的性能。 PVTv2的主要改进包括: 降低计算复杂度:通过引入线性复杂度注意层(Linear Complexity

【YOLO改进】换遍MMDET主干网络之SwinTransformer-Tiny(基于MMYOLO)

SwinTransformer-Tiny SwinTransformer-Tiny是Swin Transformer模型的一个轻量级版本。Swin Transformer是微软亚洲研究院在2021年提出的一种新型的视觉Transformer,它通过引入移位窗口(Shifted Windows)的概念,实现了层次化的特征表示和线性的计算复杂度,使其在各种视觉任务中都取得了出色的性能。 SwinT

【Transformer-BEV编码(7)】Sparse4D源代码,在mmdet里面增加cuda的插件deformable_aggregation

文章目录 插件位置在论文V3中的“地位”看看具体的代码1. deformable_aggregation.py2. deformable_aggregation.cpp3. deformable_aggregation_cuda.cu3.1 双线性插值bilinear_sampling()3.2 bilinear_sampling_grad() 梯度计算3.3 `deformable_agg

MMDet加载旧版本代码权重及自定义数据集的问题及解决

文章首发见博客:https://mwhls.top/4881.html。 无图/格式错误/后续更新请见首发页。 更多更新请到mwhls.top查看 欢迎留言提问或批评建议,私信不回。 场景 PyTorch说它们2.0很快,那么就安个最新的Torch和MMDet。打开两年前的顶会文章,复制更早几年的代码文件以及权重。找个数据集。按照最新的config进行配置权重路径。然而,找不到加载权重。

mmdet tools 使用指南

MMDetection 是一个基于 PyTorch 的目标检测开源工具箱。它是 OpenMMLab 项目的一部分。 主分支代码目前支持 PyTorch 1.8 及其以上的版本。 使用前提 (1)mmdet使用手册地址 https://mmdetection.readthedocs.io/zh-cn/latest/user_guides/index.html#id2 (2)第一次

mmdet全教程

官方给的文档一言难尽,网上的教程又没有从大纲到源码的完整解读,计划年后开个系列记录一下

openMMLab的mmcv和mmdet、mmdet3d、mmseg版本对应关系

openmmlab提供了MIM来统一安装其多个mm功能框架包https://github.com/open-mmlab/mim,但是需要不借助MIM安装时,这里怎么确定要安装什么版本的mmcv和mmdet、mmdet3d、mmseg,在openmmlab网站主页上没有一个容易能找到的完整表格页面来详细记录他们之间的版本对应关系,好不容易找到个Faq页面,里面却只记录了最新的mmcv2.x和其它组