RT-DETR使用教程（超越YOLO的实时目标检测器）

本文主要是介绍RT-DETR使用教程（超越YOLO的实时目标检测器），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

专栏介绍：YOLOv9改进系列 | 包含深度学习最新创新，助力高效涨点！！！

一、RT-DETR介绍

RT-DETR是一种基于Transformer检测架构的实施目标检测器，其性能在发布时超越当时最强的YOLOv8检测器。与基于CNN架构的YOLO主要不同是检测头部分，RT-DETR检测头中使用了Deformable Transformer Decoder，而YOLO使用的是CNN进行预测。RT-DETR由百度开发，是一种当前顶级的的端到端目标检测器，精度高速度快。它利用ViT，通过解耦尺度内相互作用和跨尺度融合，有效地处理多尺度特征。RT-DETR具有高度适应性，支持使用不同解码器层灵活调整推理速度而无需重新训练。该模型在加速后端(如CUDA和TensorRT)上表现出色，优于许多其他实时对象检测器。

论文摘要：

近年来，基于变压器的端到端检测器(DETRs)取得了令人瞩目的进展。然而，高计算成本限制了der的实际应用，使其无法充分发挥无后处理(non-maximum suppression, NMS)等优点。本文首先分析了NMS对现有实时目标检测器的精度和速度的负面影响，并建立了端到端的速度基准。为了解决上述问题，我们提出了实时检测变压器(RT-DETR)，这是我们所知的第一个实时端到端对象检测器。具体来说，我们设计了一个高效的混合编码器，通过解耦尺度内交互和跨尺度融合来高效地处理多尺度特征，并提出了iou感知查询选择，通过向解码器提供更高质量的初始对象查询来进一步提高性能。此外，我们提出的检测器支持通过使用不同的解码器层来灵活调整推理速度，而无需再训练，这有利于在各种实时场景中的实际应用。我们的rt - der - l在COCO val2017上实现了53.0%的AP，在T4 GPU上实现了114 FPS，而rt - der - x实现了54.8%的AP和74 FPS，在速度和精度上都优于同等规模的最先进的YOLO检测器。此外，我们的RT-DETR-R50达到53.1%的AP和108 FPS，在精度上优于DINO-DeformableDETR-R50 2.2%的AP和大约21倍的FPS。源代码和预训练模型可在https://github.com/lyuwenyu/RT-DETR上获得。

实测效果：精度高于YOLO系列。

二、使用教程

2.1 模型下载

作者版本下载链接：https://github.com/lyuwenyu/RT-DETR

本文教程所用版本链接：https://gitcode.com/ultralytics/ultralytics

2.1 创建训练脚本

新建一个训练脚本，命名为train,并填入图中代码，运行即可。

from ultralytics.models import RTDETRif __name__ == '__main__':model = RTDETR(model='ultralytics/cfg/models/rt-detr/rtdetr-l.yaml')model.load('rtdetr-l.pt')model.train(pretrained=True, data='data.yaml', epochs=1, batch=1, device=0, imgsz=320, workers=2,cache=False,)