CNN卷积网络基础-卷积核,padding,stride

2024-02-05 02:59

本文主要是介绍CNN卷积网络基础-卷积核,padding,stride,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用卷积网络来处理图像数据有两方面原因:
1.图像以像素点信息表示数据,数据之间的关联性由像素位置表征,图像数据中要观察的目标是一块像素区域,用卷积网络提取特征信息可以按块状提起
2.在DNN网络中,网络的架构与输入数据的维度有关,如果用来分析大分辨率的图像,那么网络将会包含很多参数,这样就需要有更多的训练样本来防止过拟合,如果用卷积网络就可以进行区域特征提取,而不用设计大输入维度的网络架构

边缘检测

卷积网络主要用于图像特征的提取,浅层的卷积网络提取边缘,也叫边缘检测,深层的卷积网络提取整体特征。
边缘检测可以参考下面这张图示,可以把有亮度信息的垂直边缘提取出来
在这里插入图片描述
由上面的垂直边缘检测器,可以联想到如下图所示的水平边缘检测器
在这里插入图片描述
早期的图像边缘提取还有经典的soble算子(着重考虑中间像素,提高鲁棒性)、scharr算子
在这里插入图片描述
在卷积网络中,该3x3的过滤器一共包含9个参数,通过反向传播计算就可以获取能提取任意角度的过滤器

padding和stride

在进行卷积操作时,有2个常用的参数设置,padding,stride。
padding有两个用途

1.解决图像经过卷积操作后图像缩小的问题
2.图像不进行padding的话,边缘处像素只会进行一次卷积操作,而中间的像素点则会进行多次卷积操作,这样边缘像素的信息就会有损失

在这里插入图片描述
下图展示了一个padding为1的图像卷积运算,经过卷积运算后,图像大小不变
在这里插入图片描述
( 6 + 2 ∗ p a d d i n g − k e r n e l + 1 ) → 6 ∗ 6 (6+2*padding-kernel+1)\rightarrow 6*6 (6+2paddingkernel+1)66
在一些深度学习网络框架中,在设置卷积层时,可设置不同的模式,常设置valid 和same,其中的区别可参考卷积的三种模式:full, same, valid

stride用于设置卷积移动的步幅,卷积特征图尺寸计算公式: F o = ⌊ F i n + 2 × p − k s ⌋ + 1 F_o=\lfloor \frac{F_{in}+2\times p - k}{s} \rfloor +1 Fo=sFin+2×pk+1 式中2p表示对图像的上下左右各填充p个像素,式中 ⌊ ⌋ \lfloor\rfloor 是向下取整的符号,意思是除不尽的时候向下取整,k代表卷积核的尺寸,s就是步长,在卷积网络中特征尺寸的计算可参考我的一篇博文深度学习网络-AlexNet

这篇关于CNN卷积网络基础-卷积核,padding,stride的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/679576

相关文章

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

【Linux 从基础到进阶】Ansible自动化运维工具使用

Ansible自动化运维工具使用 Ansible 是一款开源的自动化运维工具,采用无代理架构(agentless),基于 SSH 连接进行管理,具有简单易用、灵活强大、可扩展性高等特点。它广泛用于服务器管理、应用部署、配置管理等任务。本文将介绍 Ansible 的安装、基本使用方法及一些实际运维场景中的应用,旨在帮助运维人员快速上手并熟练运用 Ansible。 1. Ansible的核心概念

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

C 语言基础之数组

文章目录 什么是数组数组变量的声明多维数组 什么是数组 数组,顾名思义,就是一组数。 假如班上有 30 个同学,让你编程统计每个人的分数,求最高分、最低分、平均分等。如果不知道数组,你只能这样写代码: int ZhangSan_score = 95;int LiSi_score = 90;......int LiuDong_score = 100;int Zhou