【目标检测】YOLOV2

2024-08-26 18:44
文章标签 目标 检测 yolov2

本文主要是介绍【目标检测】YOLOV2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

YOLO9000: Better, Faster, Stronger

【目标检测】YOLOV1

1、YOLOV2 改进策略

从 YOLO9000: Better, Faster, Stronger 这篇论文名称就可以了解到 YOLO V2 相对于 YOLO V1 ,预测更准确(Better),预测速度更快(Faster),识别的物体类别更多(Stronger),相比于 YOLOV1 只能检测 20 类物体,YOLO9000 提高到 9000+ 种。

YOLO V1 发挥 one-stage 方法的优势,在检测速度上,相对于 R-CNN 系列能达到比较快的检测速度,但是在检测精度上却不如 R-CNN 系列检测方法,所以 YOLO V2 提出了几种改进策略来提升YOLO 模型的定位准确度和召回率,从而提高 mAP 。

在这里插入图片描述

2、Better

(1)Batch Normalization (BN 归一化)

Batch Normalization 助于解决反向传播过程中的梯度消失和梯度爆炸问题,可以加快模型收敛速度。在 YOLO V2 中,每个卷积层后面都添加了 Batch Normalization 层,并且不再使用 droput 。

Dropout 是一种正则化技术,它在训练过程中随机关闭一部分神经元,被关闭的神经元不参与前向传播和反向传播。
Dropout的深入理解(基础介绍、模型描述、原理深入、代码实现以及变种)

(2)High Resolution Classifier (使用高分辨率图像微调分类模型)

YOLO V2 采用 224 * 224 图像进行分类模型预训练后,再采用 448 * 448 的高分辨率样本对分类模型进行微调(10个epoch),使网络特征逐渐适应 448 * 448 的分辨率。然后再使用 448 * 448 的检测样本进行训练,缓解了分辨率突然切换造成的影响。

(3)Convolutional With Anchor Boxes (采用先验框)

借鉴 Faster R-CNN 的做法,YOLO V2 也尝试采用先验框(anchor)。在每个 grid cell 预先设定一组不同大小和宽高比的边框,来覆盖整个图像的不同位置和多种尺度,这些先验框作为预定义的候选区在神经网络中将检测其中是否存在对象,以及微调边框的位置。

同时 YOLO V2 移除了全连接层。另外去掉了一个池化层,使网络卷积层输出具有更高的分辨率。

之前YOLO1并没有采用先验框,并且每个 grid cell 只预测两个 bounding box 。

(4)Dimension Clusters (采用聚类方法提取先验框尺度)

之前先验框都是手工设定的,YOLO V2 的做法是对训练集中标注的边框进行聚类分析,以寻找尽可能匹配样本的边框尺寸,这样就可以减少网络微调先验框到实际位置的难度。

在这里插入图片描述

(5)Direct location prediction (约束预测边框调整的位置)

Faster RCNN 的先验框(Anchor)方法,在训练的早期阶段,其位置预测容易不稳定(即调整后的 Anchor 位置中心可能出现在输入图像任意位置上)。YOLO V2 将预测边框中心位置调整约束在特定 gird cell 网格内

在这里插入图片描述

(6)Fine-Grained Features ( passthrough 层检测细粒度特征)

YOLO V2 引入一种称为 passthrough 层的方法在特征图中保留一些细节信息,以便更好的检测出一些比较小的对象。具体来说,就是在最后一个 pooling 之前,特征图的大小是 26 * 26 * 512,将其 1 拆 4,直接传递( passthrough )到 pooling 后(并且又经过一组卷积)的特征图,两者叠加到一起作为输出的特征图。

(7)Multi-Scale Training (多尺度图像训练)

因为 YOLO V2 网络结构去掉了全连接层,YOLO V2 可以输入多种尺寸的图像

(8)High Resolution Detector (支持高分辨率图像的对象检测)

因为 YOLO V2 调整网络结构后,能够支持多种尺寸的输入图像,如果用较高分辨率的输入图像,可提高 mAP 。

3、Faster

YOLO V2 采用 Darknet-19 网络结构,相对于 YOLO V1 采用的 VGG-16 ,在检测精度上相差无几,但是计算量却可以减少约33%,从而加快目标检测速度。

在这里插入图片描述

4、Stronger

通过采用联合训练(jointly training)机制,综合发挥目标检测任务数据集和图像分类任务数据集的综合优势(目标检测数据集图像数量少、目标类别少但提供精确的目标位置信息,而分类数据集无目标位置信息,但类别数多且图像数量庞大),使得支持的检测目标类别数从原来 YOLO V1 的 20 类大幅扩展至 9000 多种类别,大大提高了模型的适用性。

[COPY]
<机器爱学习>YOLOv2 / YOLO9000 深入理解
YOLOv2 / YOLO9000 深入理解
目标检测那点儿事——更强的YOLO-9000
目标检测那点儿事——更好更快的YOLO-V2
目标检测|YOLOv2原理与实现(附YOLOv3)

这篇关于【目标检测】YOLOV2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109376

相关文章

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

如何用Java结合经纬度位置计算目标点的日出日落时间详解

《如何用Java结合经纬度位置计算目标点的日出日落时间详解》这篇文章主详细讲解了如何基于目标点的经纬度计算日出日落时间,提供了在线API和Java库两种计算方法,并通过实际案例展示了其应用,需要的朋友... 目录前言一、应用示例1、天安门升旗时间2、湖南省日出日落信息二、Java日出日落计算1、在线API2

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

基于 YOLOv5 的积水检测系统:打造高效智能的智慧城市应用

在城市发展中,积水问题日益严重,特别是在大雨过后,积水往往会影响交通甚至威胁人们的安全。通过现代计算机视觉技术,我们能够智能化地检测和识别积水区域,减少潜在危险。本文将介绍如何使用 YOLOv5 和 PyQt5 搭建一个积水检测系统,结合深度学习和直观的图形界面,为用户提供高效的解决方案。 源码地址: PyQt5+YoloV5 实现积水检测系统 预览: 项目背景

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.

[数据集][目标检测]血细胞检测数据集VOC+YOLO格式2757张4类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2757 标注数量(xml文件个数):2757 标注数量(txt文件个数):2757 标注类别数:4 标注类别名称:["Platelets","RBC","WBC","sickle cell"] 每个类别标注的框数:

Temu官方宣导务必将所有的点位材料进行检测-RSL资质检测

关于饰品类产品合规问题宣导: 产品法规RSL要求 RSL测试是根据REACH法规及附录17的要求进行测试。REACH法规是欧洲一项重要的法规,其中包含许多对化学物质进行限制的规定和高度关注物质。 为了确保珠宝首饰的安全性,欧盟REACH法规规定,珠宝首饰上架各大电商平台前必须进行RSLReport(欧盟禁限用化学物质检测报告)资质认证,以确保产品不含对人体有害的化学物质。 RSL-铅,

YOLOv8/v10+DeepSORT多目标车辆跟踪(车辆检测/跟踪/车辆计数/测速/禁停区域/绘制进出线/绘制禁停区域/车道车辆统计)

01:YOLOv8 + DeepSort 车辆跟踪 该项目利用YOLOv8作为目标检测模型,DeepSort用于多目标跟踪。YOLOv8负责从视频帧中检测出车辆的位置,而DeepSort则负责关联这些检测结果,从而实现车辆的持续跟踪。这种组合使得系统能够在视频流中准确地识别并跟随特定车辆。 02:YOLOv8 + DeepSort 车辆跟踪 + 任意绘制进出线 在此基础上增加了用户