YOLO v10 是目前最好的吗?

2024-06-14 09:44
文章标签 yolo v10 最好 目前

本文主要是介绍YOLO v10 是目前最好的吗?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击下方卡片,关注“小白玩转Python”公众号

ef161ea3d1e215df8faf8706835197ea.png

YOLO(You Only Look Once,你只看一眼)因其快速的对象检测算法而闻名。它的速度和效率使其成为计算机视觉(CV)领域中对象检测的标准方法。YOLO 可以实时处理图像,使其非常适合自动驾驶、安全监控和零售分析等应用。

YOLO 是如何工作的?

eb344701e48d5e5c38e10193a826605f.jpeg

考虑图像分类的场景,目标是确定图像是否包含狗或人。当涉及到图像分类,我们应该确定它是否是狗还是人 - 如果是狗,就是1,如果是人,就是0,就像上面的图像 - 只有狗存在!但在对象检测算法中 - 我们考虑一种叫做对象定位的东西。除了上述解释的图像分类数据,我们还传递了边界框。

边界框

{Pc, Bx, By, Bw, Bh, C1, C2}
{1 , 50, 70, 60, 70, 1 , 0}
  • Pc — 类别的概率,如果两种类别都不出现,它将是0,否则是1。

  • Bx 和 By — 注释框的中心坐标 - 它将覆盖正好只有类别 - 在这个例子中是狗。

  • Bw 和 Bh — 注释框的宽度和高度。

  • C1 — 狗类别 - 因为狗存在 - 它是1。

  • C2 — 人类别 - 因为人不存在 - 它是0。

显然,如果没有对象 - Pc 将是0,其余的将没有值!

如果我们在图像中有多个对象怎么办?当图像中存在多个对象时,YOLO 将图像划分为网格,然后预测每个网格单元的边界框和类别概率。允许模型同时检测和定位多个对象。例如,如果网格大小是 4x4,每个单元将产生一个预测向量。假设每个预测向量由 7 个单元组成(Pc, Bx, By, Bw, Bh, C1, C2),整体预测张量的大小将是 4x4x7。

如果图像包含重叠对象,如一个人抱着一只狗,也会使用相同的方法。

训练神经网络由于图像及其相应的向量都已获得 - 我们可以将图像样本视为输入数据 - 其相应的向量样本作为输出数据传递给神经网络。现在这些数据样本及其相应的输入和输出矩阵可以输入到神经网络中 - 当涉及到隐藏状态中的节点数量、激活函数等时,可以调整和调整神经网络!获得最佳组合以获得最佳准确率。

输出将是模型所做的网格单元分隔的大小。如果是 4x4,输出将是 16 个向量。

它之所以被称为 YOLO - You Only Look Once  - 是因为模型在单次前向传播中完成所有预测。这有效地允许模型快速检测模式和对象,无论网格单元的数量如何。

对象检测模型的问题尽管 YOLO 可以被认为是用于对象检测的最佳模型之一 - 但所有模型都不完美。当涉及到 YOLO 时,可能会有重叠边界框的问题。

0db770d876e02124fb9ff570d024e93e.png

考虑上面有两个人的图像:一个人和一只狗。YOLO 最初可能会为这些对象检测到多个边界框,在上述背景下 - 结果是五个边界框,而理想情况下应该只有两个(每个对象一个)。

边界框重叠

当多个预测覆盖同一个对象时,就会发生重叠的边界框。这种冗余需要解决,以确保模型输出最准确和最小的边界框集。

交集比并集(IoU)

为了解决重叠的边界框问题,YOLO 使用了一种称为交集比并集(IoU)的技术。IoU 是一种度量两个边界框之间重叠的指标。

IoU = Intersect Area / Union Area
  • 交集面积:两个边界框重叠的区域。

  • 并集面积:两个边界框合并覆盖的总面积。

如果两个边界框完全重叠,IoU 值是 1。如果它们根本不重叠,IoU 值是 0。

非最大抑制(NMS)

为了消除冗余的边界框,YOLO 应用了非最大抑制(NMS):

  1. 计算置信度分数:每个边界框都被分配一个置信度分数,代表对象存在的可能性。

  2. 选择最高置信度框:选择置信度分数最高的边界框。

  3. 抑制重叠框:任何与选定框的 IoU 超过某个阈值(例如,0.5)的边界框都被抑制(即,移除)。

  4. 重复:这个过程对剩余的框重复进行,直到只剩下最自信、不重叠的框为止。

但 YOLO v10 消除了 NMS 的需求 - 简化了预测过程,提高了效率,而不影响模型的准确性!

YOLO v10:性能和比较

最新版本的 YOLO,YOLO v10,由于几个引人注目的原因,被认为是最佳和最改进的版本 - 这里是为什么:

  1. 更高的准确性 - 考虑到开篇的第一张图表 - 我们可以注意到,与以前的版本甚至其他模型相比,该模型产生了更高的 COCO AP 水平!清楚地表明 - YOLOX 模型(特别是 YOLOX-L) - 总体上表现最佳。

  2. 改进的延迟 - (延迟是模型对输入的响应时间)即使准确性更高 - YOLO v10 保持低延迟 - 使其灵活且有益于实时应用!

  3. 更好的对象定位 - 对象检测的主要挑战是处理重叠的边界框。幸运的是,YOLO v10 模型结合了高级技术,如 IoU 和 NMS,有效地处理重叠框,以获得更准确的边界框预测。导致更准确的对象检测模型!

  4. 更低的参数计数 - 在开篇的第二张图表中 - 我们可以得出结论,YOLO v10 模型可以用更少的参数准确预测。使其适合在资源受限的环境中部署。尽管我们可以指定一个 YOLO v10 模型是最好的 - 这都取决于用例。

以下是 YOLO v10 模型的所有变体列表 - 每个都有其自己的优势:

401e56ce2e89c85c654ea911f2c41d23.png

结论

虽然 YOLO v10 在准确性、延迟和效率方面都有所提高 - 但一切都取决于你正在处理的用例,因为对于每个用例,可能都有一个最适合的模型!尽管如此,根据提供的证据 - YOLO v10 作为领先的对象检测模型脱颖而出!

官方 GitHub :https://github.com/THU-MIG/yolov10?tab=readme-ov-file

论文:https://arxiv.org/abs/2405.14458

·  END  ·

HAPPY LIFE

f4144dfaf4b5104c088062702650747e.png

本文仅供学习交流使用,如有侵权请联系作者删除

这篇关于YOLO v10 是目前最好的吗?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1060048

相关文章

YOLO v3 训练速度慢的问题

一天一夜出了两个模型,仅仅迭代了200次   原因:编译之前没有将Makefile 文件里的GPU设置为1,编译的是CPU版本,必须训练慢   解决方案: make clean  vim Makefile make   再次训练 速度快了,5分钟迭代了500次

Win10用户必看:最好用最稳定的版本在此,值得一试!

在Win10电脑操作中,用户可以根据的需要,下载安装不同的系统版本。现在,许多用户好奇Win10哪个版本最好用最稳定?接下来小编给大家推荐最好用最稳定的Win10版本,这些系统版本经过优化升级,相信会给大家带来最棒的操作体验感,且下载安装步骤非常简单。   推荐一:Windows10 22H2 X64 官方正式版   点击下载:https://www.xitongzhijia.net/wi

我国目前常用的卫星影像星座有哪些(高分二号、高分七号、吉林一号、高景一号······)

​ 点击下方全系列课程学习 点击学习—>ArcGIS全系列实战视频教程——9个单一课程组合+系列直播回放 点击学习——>遥感影像综合处理4大遥感软件ArcGIS+ENVI+Erdas+eCognition 中国目前的遥感卫星在数量、种类和应用领域上都取得了显著进展,覆盖了陆地、气象、海洋等多个工作领域,数量与质量均达到了世界先进水平。   下面我们要列出20个我们国内常用的

使用Mikado挑选最好的转录本进行注释

Mikado是基于Python3写的基因组结构注释工具,它主要做的是从多个转录组组装工具得到的转录本里挑选出最好的结果作为基因组的结构注释。此外,它还会基于同源蛋白比对结果对转录本打分。换句话说这个软件主要是根据转录组数据进行注释,没有 ab inito 预测。 软件安装比较方法,我们可以使用bioconda进行安装: conda create -n mikado mikado# 打开Pyt

[数据集][目标检测]棉花叶子害虫检测数据集VOC+YOLO格式595张1类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):595 标注数量(xml文件个数):595 标注数量(txt文件个数):595 标注类别数:1 标注类别名称:["insect"] 每个类别标注的框数: insect 框数 = 823 总框数:823 使用标注工具:

无线麦克风哪个品牌音质最好,揭秘k歌哪种麦克风音质好

无线领夹麦克风在自媒体行业中的地位日益凸显,它已经成为许多视频博主提升作品音频质量的秘密武器。不论是刚入门的自媒体新人,还是已经积累了一定粉丝基础的资深博主,都开始重视起音频设备的选择。一个好的领夹麦克风不仅能够提供清晰的录音效果,还能够在户外拍摄时有效隔离背景噪音。本文将探讨如何挑选一款适合自己需求的无线领夹麦克风,并结合个人使用经验,为大家提供一些推荐。 一、无线领夹麦克风的精选策略

[数据集][目标检测]棉花叶子害虫检测数据集VOC+YOLO格式571张1类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):595 标注数量(xml文件个数):595 标注数量(txt文件个数):595 标注类别数:1 标注类别名称:["insect"] 每个类别标注的框数: insect 框数 = 823 总框数:823 使用标注工具:

银河麒麟V10 SP1.1操作系统 离线安装 nginx1.21.5、redis 服务

银河麒麟官网地址:国产操作系统、麒麟操作系统——麒麟软件官方网站 一、查看系统版本 命令:nkvers  我的是 release V10 (SP1),根据这个版本去官网找对应的rpm包 银河麒麟操作系统的rpm包必须从官方找, 要是随便找个Centos的rpm包,可能会产生不兼容,甚至会把服务器搞挂掉。 二、官网下载rpm包 官网rpm包下载地址: Index of /NS/V10/

使用jquery的ajax需要注意的地方dataType的设置 (目前我也不是很清楚哎)

没有设置dataType:'json',就出现无法解析返回的data数据,会把data当作字符串处理,而不是json对象,记得以前是不用设dataType的,很奇怪,不知道是不是跟jquery版本有关系 昨天在做ajax时遇到问题,  复制代码代码如下: <SPAN style="WHITE-SPACE: pre">  </SPAN>$.ajax({  url:'<{

手机k歌用什么麦克风最好?轻揭无线麦克风哪个品牌音质最好!

​无线领夹麦克风作为现代音频技术的重要代表,已广泛应用于各种场合。它不仅能提升演讲者声音质量,还能增加演讲互动性和生动性。然而面对众多产品如何选择适合自己的设备成难题。本文将提供选购使用无线领夹麦克风的建议与推荐款式,帮助你轻松应对演讲需求。 一、如何挑选无线领夹麦克风?(划重点) ①选择性价比高的麦克风 品牌和价格并不是唯一决定性能的因素。消费者应该根据自己的拍摄需求、使用环境和预