RT-DETR使用教程(超越YOLO的实时目标检测器)

2024-04-09 07:52

本文主要是介绍RT-DETR使用教程(超越YOLO的实时目标检测器),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


专栏介绍:YOLOv9改进系列 | 包含深度学习最新创新,助力高效涨点!!!


一、RT-DETR介绍

        RT-DETR是一种基于Transformer检测架构的实施目标检测器,其性能在发布时超越当时最强的YOLOv8检测器。与基于CNN架构的YOLO主要不同是检测头部分,RT-DETR检测头中使用了Deformable Transformer Decoder,而YOLO使用的是CNN进行预测。RT-DETR由百度开发,是一种当前顶级的的端到端目标检测器,精度高速度快。它利用ViT,通过解耦尺度内相互作用和跨尺度融合,有效地处理多尺度特征。RT-DETR具有高度适应性,支持使用不同解码器层灵活调整推理速度而无需重新训练。该模型在加速后端(如CUDA和TensorRT)上表现出色,优于许多其他实时对象检测器。

        论文摘要:

        近年来,基于变压器的端到端检测器(DETRs)取得了令人瞩目的进展。然而,高计算成本限制了der的实际应用,使其无法充分发挥无后处理(non-maximum suppression, NMS)等优点。本文首先分析了NMS对现有实时目标检测器的精度和速度的负面影响,并建立了端到端的速度基准。为了解决上述问题,我们提出了实时检测变压器(RT-DETR),这是我们所知的第一个实时端到端对象检测器。具体来说,我们设计了一个高效的混合编码器,通过解耦尺度内交互和跨尺度融合来高效地处理多尺度特征,并提出了iou感知查询选择,通过向解码器提供更高质量的初始对象查询来进一步提高性能。此外,我们提出的检测器支持通过使用不同的解码器层来灵活调整推理速度,而无需再训练,这有利于在各种实时场景中的实际应用。我们的rt - der - l在COCO val2017上实现了53.0%的AP,在T4 GPU上实现了114 FPS,而rt - der - x实现了54.8%的AP和74 FPS,在速度和精度上都优于同等规模的最先进的YOLO检测器。此外,我们的RT-DETR-R50达到53.1%的AP和108 FPS,在精度上优于DINO-DeformableDETR-R50 2.2%的AP和大约21倍的FPS。源代码和预训练模型可在https://github.com/lyuwenyu/RT-DETR上获得。

实测效果:精度高于YOLO系列。


二、使用教程

 2.1 模型下载

      作者版本下载链接:https://github.com/lyuwenyu/RT-DETR

      本文教程所用版本链接:https://gitcode.com/ultralytics/ultralytics

 2.1 创建训练脚本

        新建一个训练脚本,命名为train,并填入图中代码,运行即可。

from ultralytics.models import RTDETRif __name__ == '__main__':model = RTDETR(model='ultralytics/cfg/models/rt-detr/rtdetr-l.yaml')model.load('rtdetr-l.pt')model.train(pretrained=True, data='data.yaml', epochs=1, batch=1, device=0, imgsz=320, workers=2,cache=False,)


马上推出RT-DETR改进项目,欢迎关注!


这篇关于RT-DETR使用教程(超越YOLO的实时目标检测器)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/887594

相关文章

C语言中联合体union的使用

本文编辑整理自: http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=179471 一、前言 “联合体”(union)与“结构体”(struct)有一些相似之处。但两者有本质上的不同。在结构体中,各成员有各自的内存空间, 一个结构变量的总长度是各成员长度之和。而在“联合”中,各成员共享一段内存空间, 一个联合变量

Tolua使用笔记(上)

目录   1.准备工作 2.运行例子 01.HelloWorld:在C#中,创建和销毁Lua虚拟机 和 简单调用。 02.ScriptsFromFile:在C#中,对一个lua文件的执行调用 03.CallLuaFunction:在C#中,对lua函数的操作 04.AccessingLuaVariables:在C#中,对lua变量的操作 05.LuaCoroutine:在Lua中,

Vim使用基础篇

本文内容大部分来自 vimtutor,自带的教程的总结。在终端输入vimtutor 即可进入教程。 先总结一下,然后再分别介绍正常模式,插入模式,和可视模式三种模式下的命令。 目录 看完以后的汇总 1.正常模式(Normal模式) 1.移动光标 2.删除 3.【:】输入符 4.撤销 5.替换 6.重复命令【. ; ,】 7.复制粘贴 8.缩进 2.插入模式 INSERT

Lipowerline5.0 雷达电力应用软件下载使用

1.配网数据处理分析 针对配网线路点云数据,优化了分类算法,支持杆塔、导线、交跨线、建筑物、地面点和其他线路的自动分类;一键生成危险点报告和交跨报告;还能生成点云数据采集航线和自主巡检航线。 获取软件安装包联系邮箱:2895356150@qq.com,资源源于网络,本介绍用于学习使用,如有侵权请您联系删除! 2.新增快速版,简洁易上手 支持快速版和专业版切换使用,快速版界面简洁,保留主

如何免费的去使用connectedpapers?

免费使用connectedpapers 1. 打开谷歌浏览器2. 按住ctrl+shift+N,进入无痕模式3. 不需要登录(也就是访客模式)4. 两次用完,关闭无痕模式(继续重复步骤 2 - 4) 1. 打开谷歌浏览器 2. 按住ctrl+shift+N,进入无痕模式 输入网址:https://www.connectedpapers.com/ 3. 不需要登录(也就是

Toolbar+DrawerLayout使用详情结合网络各大神

最近也想搞下toolbar+drawerlayout的使用。结合网络上各大神的杰作,我把大部分的内容效果都完成了遍。现在记录下各个功能效果的实现以及一些细节注意点。 这图弹出两个菜单内容都是仿QQ界面的选项。左边一个是drawerlayout的弹窗。右边是toolbar的popup弹窗。 开始实现步骤详情: 1.创建toolbar布局跟drawerlayout布局 <?xml vers

C#中,decimal类型使用

在Microsoft SQL Server中numeric类型,在C#中使用的时候,需要用decimal类型与其对应,不能使用int等类型。 SQL:numeric C#:decimal

Steam邮件推送内容有哪些?配置教程详解!

Steam邮件推送功能是否安全?如何个性化邮件推送内容? Steam作为全球最大的数字游戏分发平台之一,不仅提供了海量的游戏资源,还通过邮件推送为用户提供最新的游戏信息、促销活动和个性化推荐。AokSend将详细介绍Steam邮件推送的主要内容。 Steam邮件推送:促销优惠 每当平台举办大型促销活动,如夏季促销、冬季促销、黑色星期五等,用户都会收到邮件通知。这些邮件详细列出了打折游戏、

探索Elastic Search:强大的开源搜索引擎,详解及使用

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选,相信大家多多少少的都听说过它。它可以快速地储存、搜索和分析海量数据。就连维基百科、Stack Overflow、

flask 中使用 装饰器

因为要完成毕业设计,我用到fountain code做数据恢复。 于是在github上下载了fountain code的python原代码。 github上的作者用flask做了fountain code的demo。 flask是面向python的一个网站框架。 里面有用到装饰器。 今天笔试的时候,我也被问到了python的装饰器。