【Tensorflow tf 掏粪记录】笔记六——DCGAN

2023-11-22 11:20

本文主要是介绍【Tensorflow tf 掏粪记录】笔记六——DCGAN,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

DC_GAN与之前的生成MNIST数据集的项目一样,同样是利用了GAN神经网络的特性。让机器学会模仿并生成类似的图片。
只是这里不同的是,鉴别器的神经网路由全连接神经网络改成了卷积神经网络。同样的,生成器的神经网络也变成了反卷积神经网络,毕竟这次的SVHM数据集比MNIST数据集复杂。下图是DCGAN论文中关于反卷积的图片:
这里写图片描述

项目代码

https://github.com/IronMastiff/DC_GAN

反卷积


整个项目中最最关键的就是反卷积操作,通过反卷积来生成我们所期待的图片。反卷积操作中少了我们卷积操作中熟悉的各种pooling层。我用tf.layers.conv2d_transpose()来实现的反卷积。在这里我反卷积的步长选择的是2,因为我是希望整个反卷积操作输出的是32 * 32 * 3 的图片。因为SVHM数据集的单个图片的大小就是32 * 32 * 3。当然了卷积padding要使用same,方便自己计算输出的维度大小。

生成器


生成器就是反卷积操作的运用。我用了3层反卷积操作,把输入的一维白噪音变成32 * 32 * 3 的图片。

使用tf.variable_scope()为了以后方便只保存generator的权重。毕竟训练完成后,鉴别器是不需要的。仿照论文,白噪音通过全连接层后进入反卷积层。卷积过程中没有用任何的激活函数,只是在最后使用了tanh作为激活函数。

def generator( z, output_dim, reuse = False, alpha = 0.2, training = True ):with tf.variable_scope( 'generator', reuse = reuse ):# First fully connect layerx1 = tf.layers.dense( z, 4 * 4 * 512 )# Reshape it to start the convelutional stackx1 = tf.reshape( x1, ( -1, 4, 4, 512 ) )x1 = tf.layers.batch_normalization( x1, training = training )x1 = tf.maximum( x1, alpha * x1 )# 4 * 4 *  512x2 = tf.layers.conv2d_transpose( x1, 256, 5, strides = 2, padding = 'same' )x2 = tf.layers.batch_normalization( x2, training = training )x2 = tf.maximum( x2, alpha * x2 )# 8 * 8 * 256x3 = tf.layers.conv2d_transpose( x2, 128, 5, strides = 2, padding = 'same' )x3 = tf.layers.batch_normalization( x3, training = training )x3 = tf.maximum( x3, alpha * x3 )# 16 * 16 * 128logits = tf.layers.conv2d_transpose( x3, output_dim, 5, strides = 2, padding = 'same' )# 32 * 32 * output_dimout = tf.tanh( logits )return out

鉴别器

鉴别器还是老样子,输入的是真实的数据集中的图片与生成器生成的图片。鉴别器的任务就是鉴别出图片是生成器生成的还是真实的数据集的图片。

我采用3层卷积操作外加一个全连接层来识别图像的真伪。卷积层采用Leky_Relu作为激活函数,全连接层采用sigmoid作为激活函数。要是鉴别器识别的任务加上图片中的内容的话那就成了半监督学习了。

def discriminator( x, reuse = False, alpha = 0.2 ):with tf.variable_scope( 'discriminator', reuse = reuse ):x1 = tf.layers.conv2d( x, 64, 5, strides = 2, padding = 'same' )relu1= tf.maximum( x1, alpha * x1 )# 16 * 16 * 64x2 = tf.layers.conv2d( relu1, 128, 5, strides = 2, padding = 'same' )bn2 = tf.layers.batch_normalization( x2, training = True )relu2 = tf.maximum( bn2, alpha * bn2 )# 8 * 8 * 128x3 = tf.layers.conv2d( relu2, 256, 5, strides = 2, padding = 'same' )bn3 = tf.layers.batch_normalization( x3, training = True )relu3 = tf.maximum( bn3, bn3 * alpha )# 4 * 4 * 256# Flatten itflat = tf.reshape( relu3, ( -1, 4 * 4 * 256 ) )logits = tf.layers.dense( flat, 1 )out = tf.sigmoid( logits )return out, logits

这篇关于【Tensorflow tf 掏粪记录】笔记六——DCGAN的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/409766

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Servlet中配置和使用过滤器的步骤记录

《Servlet中配置和使用过滤器的步骤记录》:本文主要介绍在Servlet中配置和使用过滤器的方法,包括创建过滤器类、配置过滤器以及在Web应用中使用过滤器等步骤,文中通过代码介绍的非常详细,需... 目录创建过滤器类配置过滤器使用过滤器总结在Servlet中配置和使用过滤器主要包括创建过滤器类、配置过滤

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

python与QT联合的详细步骤记录

《python与QT联合的详细步骤记录》:本文主要介绍python与QT联合的详细步骤,文章还展示了如何在Python中调用QT的.ui文件来实现GUI界面,并介绍了多窗口的应用,文中通过代码介绍... 目录一、文章简介二、安装pyqt5三、GUI页面设计四、python的使用python文件创建pytho

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

Node.js学习记录(二)

目录 一、express 1、初识express 2、安装express 3、创建并启动web服务器 4、监听 GET&POST 请求、响应内容给客户端 5、获取URL中携带的查询参数 6、获取URL中动态参数 7、静态资源托管 二、工具nodemon 三、express路由 1、express中路由 2、路由的匹配 3、路由模块化 4、路由模块添加前缀 四、中间件

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2