前馈(向)网络之卷积神经网络的应用

2024-03-11 17:58

本文主要是介绍前馈(向)网络之卷积神经网络的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

图像识别:

卷积神经网络(CNN)

分类任务:C个类别

输入:图片,           

输出:类别标签,         

评估准则:准确率

图像识别与定位

输入:图片,         

输出:物体边界框(x,y,w,h)   

评估准则:交并准则

交并准则是预测值与真实值的交集的面积除去并集的面积,值大于0.5通常会认为是有效的定位

图像识别+定位:识别主体+定位

思路1:当作回归

当成一个回归的任务来解决定位的问题,识别问题就是一个分类任务

回归任务损失函数就是均方误差(MSE),分类任务损失函数用交叉熵损失!

step1:解决分类问题,搭建一个识别图像的神经网络(CNN),

step2:将卷积神经网络的尾部展开构建一个分类模块和回归模块,

因为卷积层,池化层是特征的抽取,激励层就是分线性变换,可以在尾部确定自己的任务!

step3:回归模块使用均方误差,在利用SGD进行学习,分类模块类似!

step4:预测阶段把两个模块拼接上,分别进行处理,

回归模块最后加在哪里?可以是最终的卷积层之后,可以是全连接层之后

对主体有更好的识别?规定好有k个组个成部分,做k个部分的回归即可

应用1:识别人的姿势?

每个人的组成部分是相同的,可以对k个关节做回归预测,然后再来进行姿势分类的问题!

思路2:借助图像窗口

类似刚才的回归,分类网络的思路,现在取所有大小不同的框,让框出现在不同的位置(这样的搜索太暴力了,会很慢),判定得分,按照得分高低对结果框做抽取和合并(策略:抽取一个框在根据分类的score得到框向哪边伸展更好,类似启发式的一种搜索框)

问题:用回归得分的过程,由于有全连接会变得很慢!

窗口的复用选择(优化):

用多层卷积层代替全连接层,引入可复用的小卷积核来进行回归/分类!

 

物体检测(实现还是使用tensorflow实现好的一套流程

边缘检测/选择性搜索----->R-CNN

选择性搜索候选框。来达到整个图片的所有物体的识别!

例如:N只猫

首先:对图片的像素点做一个自底向上的聚类(针对像素维度的分类),生成很多的候选集!

R-CNN

step1:构建一个卷积神经网络,自己做一个全连接层的修改,构建自己的任务目标

step2:对所有候选集用卷积层和池化层进行训练,取出第五个池化层的特征存储到硬盘上,然后做一个分类任务比如:使用SVM来进行分类

step3:bbox regression 回归得到滑窗位置的调整(方向的移动,缩放等等....)

问题:对所有子图单独送入神经网络抽取特征太耗费时间

R-CNN------->Fast R-CNN

对R-CNN的优化:

改进1:共享图窗,对卷积层进行一次前向计算,通过反卷积一定可以从第五层的池化层找到一些数值对应原图的某个区域,那么我就不需要对每个候选集都进行特征提取!

改进2:对SVM分类和Bbox reg回归用全连接层接上 逻辑回归和线性回归 变为 神经网络的多任务学习,只需要对损失函数log loss 和 MSE 加权 进行一个比例的调整即可!

改进3:Region of Interest Pooling(RIP)前两种改进只能对同比例大小图片进行处理,对于维度不同的子图,可以进行下采样的方法,把子图全都映射到一个比例大小上,策略:对图片的维度进行画格子变为指定维度的图片,然后对每个格子进行池化!不就可以了嘛!

对比图:

Fast R-CNN------->Faster-CNN

Fast R-CNN的问题:主要速度限制在子图候选集上(是用聚类来生成的,我能不能用神经网络来生成?)因为聚类是CPU来做的嘛,无法使用GPU加速!(适合于大型的矩阵运算和图像渲染...)

通过神经网络,RPN(Region Proposal Network)生成子图,

生成子图的策略:在图片上,取不同的中心点以不同的比例,不同的大小生成不同的候选集!比如:3个不同大小的比例,每个比例对应3个不同大小的候选框!(正方形,横的长方形,纵的长方形)

总结:two-stage的一个方法,一个stage是挑选候选框,另一个是对候选框做一个分类看是否有物体,做一个回归看候选框如何调整才好!

YOLO/SSD

Faster用于实时的检测场景中,也要7fps,是不够的,就此引出YOLO/SSD实时算法!

一步走(one-stage)算法:直接对输入图像应用算法并输出类别和相应的定位(YOLO系列)

策略:对图片进行画格子,然后确定B个中心点,每个中心点确定几个不同比例的子图,把他当成候选集,送入神经网络里然后进行训练!

 

图像分割中的语义分割

只对每个像素距离区域,进行预测类别,只关注像素的意思这就是头牛,而不管它的其他含义(比如几头什么什么样的牛......)

对像素点(pixel)维度去做分类的一个任务!

1.滑窗处理

类似于R-CNN的思路,还可以加上对应的优化的思路,就是这样!(不光可以用在物体检测,还可以用在语义分割上

2.全卷积神经网络

输入3*H*W维度的图像,经过卷积层处理,可以构建一个C个类别的Score:C*H*W的矩阵,输出得分类别最大的一个H*W维度的矩阵!(对像素点维度去做一个分类)

总结:全卷积网络所有的层都为卷积层!

但是会有一个问题,图片现在的精度很高,直接进行处理,很难去训练出来模型,所以需要优化!

3.下采样和上采样

下采样不难理解,因为你的池化层和卷积层就是做的这样的一个事情,所以说是可以做的,但是上采样呢?

上采样一般叫为转置卷积(Transpose Convolution)/反卷积

 

这篇关于前馈(向)网络之卷积神经网络的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/798592

相关文章

如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解

《如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别详解》:本文主要介绍如何通过海康威视设备网络SDK进行Java二次开发摄像头车牌识别的相关资料,描述了如何使用海康威视设备网络SD... 目录前言开发流程问题和解决方案dll库加载不到的问题老旧版本sdk不兼容的问题关键实现流程总结前言作为

5分钟获取deepseek api并搭建简易问答应用

《5分钟获取deepseekapi并搭建简易问答应用》本文主要介绍了5分钟获取deepseekapi并搭建简易问答应用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需... 目录1、获取api2、获取base_url和chat_model3、配置模型参数方法一:终端中临时将加

JavaScript中的isTrusted属性及其应用场景详解

《JavaScript中的isTrusted属性及其应用场景详解》在现代Web开发中,JavaScript是构建交互式应用的核心语言,随着前端技术的不断发展,开发者需要处理越来越多的复杂场景,例如事件... 目录引言一、问题背景二、isTrusted 属性的来源与作用1. isTrusted 的定义2. 为

Python调用另一个py文件并传递参数常见的方法及其应用场景

《Python调用另一个py文件并传递参数常见的方法及其应用场景》:本文主要介绍在Python中调用另一个py文件并传递参数的几种常见方法,包括使用import语句、exec函数、subproce... 目录前言1. 使用import语句1.1 基本用法1.2 导入特定函数1.3 处理文件路径2. 使用ex

将Python应用部署到生产环境的小技巧分享

《将Python应用部署到生产环境的小技巧分享》文章主要讲述了在将Python应用程序部署到生产环境之前,需要进行的准备工作和最佳实践,包括心态调整、代码审查、测试覆盖率提升、配置文件优化、日志记录完... 目录部署前夜:从开发到生产的心理准备与检查清单环境搭建:打造稳固的应用运行平台自动化流水线:让部署像

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

Linux中Curl参数详解实践应用

《Linux中Curl参数详解实践应用》在现代网络开发和运维工作中,curl命令是一个不可或缺的工具,它是一个利用URL语法在命令行下工作的文件传输工具,支持多种协议,如HTTP、HTTPS、FTP等... 目录引言一、基础请求参数1. -X 或 --request2. -d 或 --data3. -H 或

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链