P1-YOLO学习1.1-YOLOV1

2024-02-13 17:59

文章标签 学习 yolo 1.1 p1 yolov1

本文主要是介绍P1-YOLO学习1.1-YOLOV1，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

目录

一.YOLOV1

1.Abstract

2.Core

3.NetWork

4.Training

5.Experiments

6.WebNet

7.Innovation point

一.YOLOV1

1.Abstract

分析：You Only Look Once 即你只看一遍即可。本文提出了一种不同与分类器检测的思想，即一种一个CNN解决一个回归问题。其优点为检测速度(FPS)和mAP很快，因此非常适合视频实时检测。

2.Core

YOLOV1的核心思想是将图像分成S*S的小网格，如果物体的中心点落在了某一个网格内，那么就由这个网格来进行预测这个物体。

每个中心点产生两个候选框(YOLOV1中bicth=2)B1(x1,y1,w1,h1) B2(x2,y2,w2,h2)，实现代码中对其进行归一化(分别除以图像的w和h)，然后拿真实值算iou，谁的iou大进行微调，每个候选框有一个置信度confidence(当前这个点是物体还不是物体)或者大于某个阈值。每个格子预测一下格子内是什么物体。

Q1:多点产生重合的框怎么办？

NMS(非极大值抑制):按置信度进行排序，选最大的

Class probability map(类概率图):每个cell只负责预测一个类别

总结：YOLOV1核心思想是将目标检测问题转换为一个回归问题，通过一个单独的神经网络模型预测目标的位置和类别。

1>单次预测:YOLOV1采用一次向前传播，直接再整个图像上生成目标的预测，避免多次预测和区域划分的过程

2>网格划分:YOLOV1将图像分割成一个固定大小的网格，每个网格负责预测目标信息

3>边界框预测:每个边界框由一组坐标值表示，包括x,y,h,w，使用回归模型预测边界框的坐标，网络输出是相对网格单元的偏移量和边界框的宽高比

4>类别预测:对于每个网格，YOLOV1预测多个类别的概率。

5>损失函数:使用自定义的损失函数平衡边界框位置预测和类别预测的损失

3.NetWork

神经网络受GoogleNet启发采用24个卷积层和两个全连接层，但不同的是初始模块采用了1*1和3*3的卷积核

Q2:为什么是448*448*3？

受到了全链接层的限制，必须固定图片大小。

第一个全连接层转换为4096个特征

第二个全连接层为1470，其含义为7*7的格子，每个格子预测出30个值

Q3:为什么用来两个全连接层？

两个全连接层能够解决非线性问题

其中30的含义，前5为b1，再5为b2,剩余20为分类任务

4.Training

Q4:为什么位置误差中w,h加上了根号？

为了统一大小物体的误差

数值较小更敏感，但解决的不大，后面版本还有改进

5.Experiments

6.WebNet

YOLO: Real-Time Object Detection

7.Innovation point

1>首次提出one-stage的概念实现end-to-end的图像检测，因其FPS远远高于同时期其他模型，因此YOLO更适用于实时检测

2>为了提高检测速度，每个检测点只选出两个候选框进行识别预测

3>提出了比较合理的损失函数

这篇关于P1-YOLO学习1.1-YOLOV1的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/706218。 23002807@qq.com

相关文章

Java学习手册之Filter和Listener使用方法

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》：本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter（过滤器）1. Filter 的工作原理2. Filter 的配置与使用二、Listen

阅读更多...

Java进阶学习之如何开启远程调式

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,：本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

阅读更多...

Java深度学习库DJL实现Python的NumPy方式

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

阅读更多...

HarmonyOS学习(七)——UI（五）常用布局总结

HarmonyOS学习(七)——UI（五）常用布局总结

自适应布局 1.1、线性布局（LinearLayout）通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列，Row组件中的子组件按照水平方向排列。属性说明space通过space参数设置主轴上子组件的间距，达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式，且在各类尺寸屏幕上表现一致，其中交叉轴为垂直时，取值为Vert

阅读更多...

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya（不是本人，claude AI）在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。以下是详细的内容：提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

阅读更多...

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画（下）

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画（下）

【课程链接】 AntV G6：深入图形与图形分组、自定义节点、节点动画（下）_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中，应该怎样去计算和绘制图形，如何给一个图形制作不间断的动画，以及在鼠标事件之后产生动画。（有点难，需要好好理解） <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

阅读更多...

学习hash总结

学习hash总结

2014/1/29/ 最近刚开始学hash，名字很陌生，但是hash的思想却很熟悉，以前早就做过此类的题，但是不知道这就是hash思想而已，说白了hash就是一个映射，往往灵活利用数组的下标来实现算法，hash的作用：1、判重；2、统计次数；

阅读更多...

usaco 1.1 Broken Necklace（DP）

usaco 1.1 Broken Necklace（DP）

直接上代码接触的第一道dp ps.大概的思路就是先从左往右用一个数组在每个点记下蓝或黑的个数再从右到左算一遍最后取出最大的即可核心语句在于：如果 str[i] = 'r' , rl[i]=rl[i-1]+1, bl[i]=0 如果 str[i] = 'b' , bl[i]=bl[i-1]+1, rl[i]=0 如果 str[i] = 'w', bl[i]=b

阅读更多...

零基础学习Redis(10) -- zset类型命令使用

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合，内部除了存储元素外，还会存储一个score，存储在zset中的元素会按照score的大小升序排列，不同元素的score可以重复，score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd zadd key [NX | XX] [GT | LT] [CH] [INCR] score member [score member ...]

阅读更多...

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言高斯过程（Gaussian Process，简称GP）是一种概率模型，用于描述一组随机变量的联合概率分布，其中任何一个有限维度的子集都具有高斯分布文章目录引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数（或核函数） 1.3 核函数1.4 高斯过程回归（Gauss

阅读更多...