经典网络VGG16

2024-03-25 15:40
文章标签 经典 网络 vgg16

本文主要是介绍经典网络VGG16,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、经典网络VGG16 basic

       VGG是由Simonyan 和Zisserman在文献《Very Deep Convolutional Networks for Large Scale Image Recognition》中提出卷积神经网络模型,其名称来源于作者所在的牛津大学视觉几何组(Visual Geometry Group)的缩写。

     针对VGG16进行具体分析发现,VGG16共包含:

  • 13个卷积层(Convolutional Layer),分别用conv3-XXX表示
  • 3个全连接层(Fully connected Layer),分别用FC-XXXX表示
  • 5个池化层(Pool layer),分别用maxpool表示

       其中,卷积层和全连接层具有权重系数,因此也被称为权重层,总数目为13+3=16,这即是VGG16中16的来源。(池化层不涉及权重,因此不属于权重层,不被计数)。

      conv3-64的全称是convolution kernel_size=3, the number of kernel=64,该层有64个3*3的卷积和实施卷积操作。每一个卷积层都对输入图像进行了padding操作,padding的尺寸需要正好保证输出图像的尺寸与输入图像相同。

      FC4096全称是Fully Connected 4096,是输出层连接4096个神经元的全连接层。

 2、针对VGG16具体解释

      1)block1解释

       VGG16的输入图像为224*224*3,第一个conv3-64的意思是由64个3*3*3(3代表通道数)的卷积核去卷积输入图像,1个3*3*3的卷积核与图像224*224*3卷积,再通过padding后得到1个224*224大小的矩阵图像,那么64个3*3*3的卷积核去卷积输出的结果为224*224*64的矩阵图像组。针对输入224*224*64的矩阵图像组,第二个conv3-64的含义是由64个3*3*64的矩阵卷积核组去卷积矩阵图像组,由于1个224*224*64的矩阵图像组和1个3*3*64的矩阵卷积核组得到1个224*224大小的矩阵图像,故block1的最终输出结果就是224*224*64。

       block1中的param分别为(第一个conv3-64:(3*3*3)*64;第二个conv3-64:(3*3*64)*64)

      2)经过block1后的maxpooling1的输出层数据为为112*112*64

      3)block2解释

       block2的输入数据是112*112*64,conv3-128代表的意思是由128个3*3*64(64代表通道数)的卷积核去卷积输入数据,与之前讲述相同,此时得到112*112*128矩阵图像组。

       block2中的param分别是(第一个conv3-128:(3*3*64)*128;第二个conv3-128:(3*3*128)*128)

     4)经过block2后的maxpooling2的输出层数据为56*56*128

     5)block3解释

      block3的输入数据是56*56*128,conv3-256代表的意思是由256个3*3*128(128代表通道数)的卷积核去卷积输入数据,与之前讲述相同,此时得到56*56*256矩阵图像组。

      block3的param分别是(第一个conv3-256:(3*3*128)*256;第二个conv3-256:(3*3*256)*256;第二个conv3-256:(3*3*256)*256)

      6)经过block3后的maxpooling3的输出层数据为28*28*256   

      7)block4、block5以此类推

      8)block5后maxpooling5的输出层数据为7*7*512

      9)FC-4096层的输入数据为7*7*512,全连接层有4096个神经元。

           FC-4096中的param为7*7*512*4096

3、VGG16的参数

图中蓝色是计算权重参数数量的部分;红色是计算所需存储容量的部分。

VGG16具有如此之大的参数数目,可以预期它具有很高的拟合能力;但同时缺点也很明显:

  • 即训练时间过长,调参难度大。
  • 需要的存储容量大,不利于部署。例如存储VGG16权重值文件的大小为500多MB,不利于安装到嵌入式系统中。

4、VGG16的具体结构

       首先需要解释为什么把一个224*224*3的3通道的RGB图像->变成了224*224*64有着64通道的图像组合?

       答:这里是拿64组3*3*3的卷积核去卷积这一个RGB图像。一组3*3*3的卷积核去卷积一组224*224*3的图像(27个数求和,然后扫过去),借助padding后,得到的是一个224*224的图像,那么64组卷积和就得到64组224*224的图像,即224*224*64这一个64通道的图像组合。

 

5、关于VGG16网络的迁移学习

        vgg16对应的供keras使用的模型人家已经帮我们训练好,我们将学习好的 VGG16 的权重迁移(transfer)到自己的卷积神经网络上作为网络的初始权重,这样我们自己的网络不用从头开始从大量的数据里面训练,从而提高训练速度。这里的迁移就是平时所说的迁移学习。

 

 

参考文章:

【1】http://deanhan.com/2018/07/26/vgg16/

【2】https://www.cnblogs.com/lfri/p/10493408.html

这篇关于经典网络VGG16的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/845463

相关文章

SSID究竟是什么? WiFi网络名称及工作方式解析

《SSID究竟是什么?WiFi网络名称及工作方式解析》SID可以看作是无线网络的名称,类似于有线网络中的网络名称或者路由器的名称,在无线网络中,设备通过SSID来识别和连接到特定的无线网络... 当提到 Wi-Fi 网络时,就避不开「SSID」这个术语。简单来说,SSID 就是 Wi-Fi 网络的名称。比如

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

ASIO网络调试助手之一:简介

多年前,写过几篇《Boost.Asio C++网络编程》的学习文章,一直没机会实践。最近项目中用到了Asio,于是抽空写了个网络调试助手。 开发环境: Win10 Qt5.12.6 + Asio(standalone) + spdlog 支持协议: UDP + TCP Client + TCP Server 独立的Asio(http://www.think-async.com)只包含了头文件,不依

poj 3181 网络流,建图。

题意: 农夫约翰为他的牛准备了F种食物和D种饮料。 每头牛都有各自喜欢的食物和饮料,而每种食物和饮料都只能分配给一头牛。 问最多能有多少头牛可以同时得到喜欢的食物和饮料。 解析: 由于要同时得到喜欢的食物和饮料,所以网络流建图的时候要把牛拆点了。 如下建图: s -> 食物 -> 牛1 -> 牛2 -> 饮料 -> t 所以分配一下点: s  =  0, 牛1= 1~

poj 3068 有流量限制的最小费用网络流

题意: m条有向边连接了n个仓库,每条边都有一定费用。 将两种危险品从0运到n-1,除了起点和终点外,危险品不能放在一起,也不能走相同的路径。 求最小的费用是多少。 解析: 抽象出一个源点s一个汇点t,源点与0相连,费用为0,容量为2。 汇点与n - 1相连,费用为0,容量为2。 每条边之间也相连,费用为每条边的费用,容量为1。 建图完毕之后,求一条流量为2的最小费用流就行了

poj 2112 网络流+二分

题意: k台挤奶机,c头牛,每台挤奶机可以挤m头牛。 现在给出每只牛到挤奶机的距离矩阵,求最小化牛的最大路程。 解析: 最大值最小化,最小值最大化,用二分来做。 先求出两点之间的最短距离。 然后二分匹配牛到挤奶机的最大路程,匹配中的判断是在这个最大路程下,是否牛的数量达到c只。 如何求牛的数量呢,用网络流来做。 从源点到牛引一条容量为1的边,然后挤奶机到汇点引一条容量为m的边

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络

配置InfiniBand (IB) 和 RDMA over Converged Ethernet (RoCE) 网络 服务器端配置 在服务器端,你需要确保安装了必要的驱动程序和软件包,并且正确配置了网络接口。 安装 OFED 首先,安装 Open Fabrics Enterprise Distribution (OFED),它包含了 InfiniBand 所需的驱动程序和库。 sudo

【机器学习】高斯网络的基本概念和应用领域

引言 高斯网络(Gaussian Network)通常指的是一个概率图模型,其中所有的随机变量(或节点)都遵循高斯分布 文章目录 引言一、高斯网络(Gaussian Network)1.1 高斯过程(Gaussian Process)1.2 高斯混合模型(Gaussian Mixture Model)1.3 应用1.4 总结 二、高斯网络的应用2.1 机器学习2.2 统计学2.3

网络学习-eNSP配置NAT

NAT实现内网和外网互通 #给路由器接口设置IP地址模拟实验环境<Huawei>system-viewEnter system view, return user view with Ctrl+Z.[Huawei]undo info-center enableInfo: Information center is disabled.[Huawei]interface gigabit