yolo系列——yolov2

2023-11-21 00:40
文章标签 系列 yolo yolov2

本文主要是介绍yolo系列——yolov2,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

v2 用coco数据集训练后,可以识别80个种类。Yolo9000可以使用coco数据集+ImageNet数据集联合训练,可以识别9000多个种类,但核心都是yolov2的算法。
(1)batch normlization
a)在目前的网络结构中,BN逐渐变成了标配,在YOLO的每个卷积层中加入BN之后,MAP提升了2%,并且除了Dropout。
(2)相比v1的改进
a)在v1中,网络的backbone部分会在ImageNet数据集上进行预训练,训练时网络输入图像的分辨率224*224
b)在V2中,输入图片提高为448*448的ImageNet数据集上训练10个epoch,再使用检测数据集(例如coco)进行微调。预训练时mAP提高了大约4%。
c)在v2中,神经网络不对预测框(宽,高)的绝对值进行预测,而是预测框与Anchor框的偏差
d)训练时,与最接近ground truth的框产生loss,其余框不产生loss。
e)v2中移除了最后两层全连接层,全连接层计算量大,耗时久。
(3)Anchor box产生的方法
a)在v2中,anchor Box的宽高不经人为获得,而是将训练数据集中的矩形框全部拿出来,用Kmeans聚类得到先验框的宽高,
b)例如使用5个anchor Box,那么Kmeans聚类的类别中心个数设置为5。
c)聚类必须要定义聚类点之间的距离数
步骤:
(1) 提取所有训练数据的bounding boxes 的宽高数据。将坐标数据转化为宽高大小,计算方法:长=右下角横坐标–左上角横坐标,宽=右下角纵坐标-左上角纵坐标
(2) 初始化k个anchor box,通过在所有的bounding boxes中随机选取K个值作为k个anchor boxes的初始值。
(3) 计算每个bounding box与每个anchor box 的iou值

(4) 分类:我们通过比较每个bounding box 与每个anchor box的误差大小,选取最小误差的那个anchor box,将这个bounding box 分类给它,对于每个bounding box都做这个操作,最后记录下来的每个anchor box 有哪些bounding box属与它。
(5) anchor box更新:对于每个anchor box中的那些bounding box,我们再求这些bounding box 的宽高中值大小,将其作为该anchor box新的尺寸
(6) 重复操作第3步到第五步,直到在第五步中发现对于全部bounding box 其所属的anchor box类与之前所属anchor box类完全一样(bounding box不再更新)。
(4)绝对值位置预测(用锚框表示图像中物体的真实框)
预测框数(bb)=网格数锚框数(ab)
预测框的坐标信息表示(tx,ty,tw,th)
每个锚框所对应的网格的左上角坐标(cx,cy)
锚框的的宽度和长度(ph,pw)
真实框的预测
在这里插入图片描述
(5)细粒度特征
26
26的特征图经过卷积层等,变为1313的特征图后,损失了很多细粒度的特征,导致小尺寸物体的识别效果不佳,因此加入了passthrough层(将26261的特征图变成13134的特征图,这种操作不损失细粒度特征)
(6)多尺度训练
• Yolo v2中只有卷积层与池化层, 所以对于网络的输入大小, 并没有限制, 整个网络的降采样倍数为32, 只要输入的特征图尺寸为32的倍数即可。
• 在每10个batch之后, 就将图片resize成{320, 352, …, 608}中的一种。 不同的输入,最后产生的格点数不同。
• 在引入了多尺寸训练方法后, 迫使卷积核学习不同比例大小尺寸的特征。 当输入设置为544
544甚至更大, Yolo v2的mAP已经超过了当时其他的物体检测算法。

这篇关于yolo系列——yolov2的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/398586

相关文章

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

flume系列之:查看flume系统日志、查看统计flume日志类型、查看flume日志

遍历指定目录下多个文件查找指定内容 服务器系统日志会记录flume相关日志 cat /var/log/messages |grep -i oom 查找系统日志中关于flume的指定日志 import osdef search_string_in_files(directory, search_string):count = 0

GPT系列之:GPT-1,GPT-2,GPT-3详细解读

一、GPT1 论文:Improving Language Understanding by Generative Pre-Training 链接:https://cdn.openai.com/research-covers/languageunsupervised/language_understanding_paper.pdf 启发点:生成loss和微调loss同时作用,让下游任务来适应预训

Java基础回顾系列-第七天-高级编程之IO

Java基础回顾系列-第七天-高级编程之IO 文件操作字节流与字符流OutputStream字节输出流FileOutputStream InputStream字节输入流FileInputStream Writer字符输出流FileWriter Reader字符输入流字节流与字符流的区别转换流InputStreamReaderOutputStreamWriter 文件复制 字符编码内存操作流(

Java基础回顾系列-第五天-高级编程之API类库

Java基础回顾系列-第五天-高级编程之API类库 Java基础类库StringBufferStringBuilderStringCharSequence接口AutoCloseable接口RuntimeSystemCleaner对象克隆 数字操作类Math数学计算类Random随机数生成类BigInteger/BigDecimal大数字操作类 日期操作类DateSimpleDateForma

Java基础回顾系列-第三天-Lambda表达式

Java基础回顾系列-第三天-Lambda表达式 Lambda表达式方法引用引用静态方法引用实例化对象的方法引用特定类型的方法引用构造方法 内建函数式接口Function基础接口DoubleToIntFunction 类型转换接口Consumer消费型函数式接口Supplier供给型函数式接口Predicate断言型函数式接口 Stream API 该篇博文需重点了解:内建函数式

Java基础回顾系列-第二天-面向对象编程

面向对象编程 Java类核心开发结构面向对象封装继承多态 抽象类abstract接口interface抽象类与接口的区别深入分析类与对象内存分析 继承extends重写(Override)与重载(Overload)重写(Override)重载(Overload)重写与重载之间的区别总结 this关键字static关键字static变量static方法static代码块 代码块String类特