努力成为优秀视觉工程师的一天(二)

2024-05-31 00:58

本文主要是介绍努力成为优秀视觉工程师的一天(二),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 经典神经网络AlexNet的理解

(1)卷积层、池化层 和全连接层的理解

         从宏观的角度看,如果我们要对一幅图像进行识别,从图像处理--像素的角度来看,每个物体不同像素的组成构成了不同的特征,通过这些特征来区分物体是什么;那么卷积层就是从图像中提取各种特征,池化层就是为了简化特征提取最重要的特征,这样可以减少识别的时间,全连接层就是把这些特征都组合起来,这样才能判断这个图像中到底是什么东西

(2)卷积层是如何实现特征提取的

         首先,从图像处理的角度,卷积本意是寻求两个图像的相似度,例如我们要提取图像中的圆,那么我们用一个圆的模板与之进行卷积,值最高的地方就是最相似的地方,这样就可以找到圆的位置了;广义来讲,也就实现了圆这个特征的提取,那么在深度学习中,我们是不知道我们要提取什么特征,那么卷积的核也就是模板是不知道的,这个参数呢也就是通过不断学习得到的,这样才能提取出图像中有用的特征

卷积核的厚度(第三维的尺寸)=被卷积的图像的通道数
卷积核的个数=卷积操作后输出的通道数(第三维的尺寸)

(3)池化层如何实现特征融合和降维的

        池化也是一种类似卷积的操作,只是池化层的所有参数都是超参数,都是不用学习得到的。池化操作的降维改变的是图像的宽高,而不改变通道数。

(4)全连接层如何实现分类的

        全连接层其实就是之前学深度学习时最简单的y=wx+b,通过第一层将卷积的结果再经过卷积生成列向量,通过激活函数将其进行非线性化,从而分类

总结,AlexNet是由五个卷积层和三个全连接层组成的八层网络,参数个数:60M,分类数目:1000类

这篇关于努力成为优秀视觉工程师的一天(二)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1017172

相关文章

嵌入式软件工程师应聘知识点

嵌入式软件工程师应聘 修改浏览权限 | 删除 数据结构(C语言)部分常考的知识点: 1、局部变量能、全局变量和静态变量 2、堆和栈 3、Const、volatile、define、typedef的用途 4、链表(比如链表的插入、删除和排序) 5、排序(考查冒泡法的较多) 6、可重入函数 、malloc函数 7、指针(常考函数指针,函数指针,数组指针,指针数组和

如何让你的一天有36小时

你经常听人说“真希望一天能多几个小时”或者类似的话吗?当然,现实中我们每天只有24小时。这么说吧,人和人怎样度过这24个小时是完全不同的。到现在这样的说法已经成了陈词滥调,但我们的24小时和Thomas Edison与Mother Theresa曾拥有的相同,和Oprah Winfrey与Bill Gates 今天拥有的也相同。就像老歌里唱的,“It’s in the way that yo

我的电影好成绩都是通过努力得来的

我不聪明的电影 今天的我不聪明的电影,我肯定得累死了,我幻想着,妈妈用手摸摸我的头,他们总是以耐心的态度,我要看大海,可以去找伙伴们去玩了,一个笑,终于,我心中突然蹦出一个强烈的欲望。 我成功了,但是没有人来叫妈妈,又听到这个广告词,它让我真切地体会到了老舍先生写的不劳动连棵花也养不活的深刻含义,嗯还有那个张林海,另一个舒适的家,它就会很不高兴地大声汪汪叫,我还在那里唠叨,经过妈妈的一番指导

今天又有了别的收获。青云怎么这么厉害呢- -。。感觉无论付出多么大的努力,和他差不多就行~~

1.第一个收获就是一个宏这个宏第一个参数是函数的类型,第二个是名字,第三个其实就是setRow(),getRow(),两个方法,为的就是让我们得到对象。嘿嘿,收获不小~~ 2.比如我们定义了一个宏#define WC (6) 我们调用一个方法,suShi->m_imgIndex=rand()%WC  ;表示取0-WC-1的整数值。。 3.为了更好的适配各种环境在applicatio

工程师 - status和state的区别

"Status"和 "state"是相关的概念,但有不同的含义,尤其是在计算、系统和编程方面: 1. Status:     * 定义: 状态是指系统、进程或实体在某一特定时间点的当前状态或情况。     * 使用方法: 它通常描述一项操作的状态,如是否正在进行、是否已成功完成、是否遇到错误或是否正在等待输入。     * 举例说明: 在编程中,函数可能会返回一个状态代码,

二本毕业,我是如何成为BAT-安卓开发工程师?

1.对基础原理不断挖掘 进入公司,我的职位是Linux应用开发工程师,做App网络传输模块,本质上就是把本地的数据通过socket传输到服务端。用到的技术是C语言,网络编程,多线程编程。 那时是最痛苦的几个月,因为非计算机出生,很多东西都不会,经常程序段错误,都不能定位到问题代码。 当时处于试用期间,秉承着不成功则成仁的心态开始恶补相关的基础知识以及代码规范。那时网络上没有现成的视频资料,艰

给Android工程师的音视频教程之一文弄懂MediaCodec

更多音视频知识请关注公众号:进击的代码家 音视频学习项目:LearnVideo AndroidMediaCodecDemo 简介 MediaCodec是Android提供的用于对音视频进行编解码的类,是Android Media基础框架的一部分,一般和 MediaExtractor, MediaMuxer, Surface和AudioTrack 一起使用。 MediaCodec的编解码流程

SQL对时间的操作,比如在当前时间上增加减少一天,在当前的时间上增加减少一个月

select getdate() select convert(varchar(10),dateadd(month,-1,getdate()),120)  select convert(varchar(10),dateadd(dd,1,getdate()),120)  结果如下: 申明:以上文字为“武汉汉码科技有限公司”原创,转载时务必注明出处。 技术

基于感知哈希算法的视觉目标跟踪

偶然看到这三篇博文[1][2][3],提到图片检索网站TinEye和谷歌的相似图片搜索引擎的技术原理。以图搜图搜索引擎的使命是:你上传一张图片,然后他们尽全力帮你把互联网上所有与它相似的图片搜索出来。当然了,这只是他们认为的相似,所以有时候搜索结果也不一定对。事实上,以图搜图三大搜索引擎除了上面的老牌的TinEye和Google外,还有百度上线不算很久的新生儿:百度识图。之前听余凯老师的一个D

动手学深度学习(Pytorch版)代码实践 -计算机视觉-37微调

37微调 import osimport torchimport torchvisionfrom torch import nnimport liliPytorch as lpimport matplotlib.pyplot as pltfrom d2l import torch as d2l# 获取数据集d2l.DATA_HUB['hotdog'] = (d2l.DATA_U