罗斯基白话:TensorFlow+实战系列(四)变量管理

2023-10-15 12:20

本文主要是介绍罗斯基白话:TensorFlow+实战系列(四)变量管理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

白话TensorFlow +实战系列(一)
变量管理

 

       这篇文章主要记录常用的两种管理变量的方法。个人感觉变量管理是比较重要的,特别是当创建一个复杂的神经网络的时候,变量一旦增多,如果不好好管理这些变量,代码的可读性会变得比较差,到最后可能自己都不知道变量到底指的是啥。所以,这次总结了两种常用的管理变量方法。

       

1)基于字典的方法创建变量

       这种方法其实就是用字典的方式,key就是你取的网络层名字,value就是神经网络各层的变量。如要创建有两个隐藏层的神经网络,各层的变量可由如下代码管理:



 

其中layer1表示的是输入层到第一层隐藏层的变量

layer2表示第一层隐藏层到第二层隐藏层的变量

out表示第二层隐藏层到输出层的变量

 

这样我们就将各层的变量通过字典的形式封装起来,当构建神经网络的时候,我们可以直接调用,示例如下:



 

如图通过直接调用w["layer1"]就可以获取layer1的权重,以此类推。

这样就成功的创建了一个全连接神经网络

 

2)变量共享

TensorFlow提供了一种更简单的方法管理变量,即变量共享。该方法主要是通过tf.get_variable()与tf.variable_scope()函数来实现。下面分别说说怎么用

 

1.tf.get_variable()

该函数可以用于创建变量,也可以用于获取已经创建的变量。

当用于创建变量的时候,他的作用与tf.Variable()可以理解成一样,只是参数的设置位置不同而已。

如图,以下这两个变量创建的形式一样:



 

这两个都是创建一个2*3的张量,不同的是,tf.Variable()张量名称这个参数是可选的,tf.get_variable()是必填的,并且tf.get_variable()是用initializer= ....来初始化张量的类型。

其中tf.random_normal_initializer()初始化函数只是在tf.random_normal后面加个initializer()而已,其他的如tf.constant也是加个变成 tf.constant_initializer(),其他相似的函数类似,就不一一列举。

 

当需要用tf.get_variable()获取变量时,就需要通过tf.variable_scope()来创建一个上下文管理器,这个函数包含一个reuse参数,是一个布尔型参数,当reuse= True时,指明在该管理器中,tf.get_variable()用于获取已经创建的变量;当reuse = False时,指明在该管理器中,tf.get_variable()用于创建变量。

 

如图,在命名空间foo中创建一个变量v1:



 

接着在命名空间foo中获取变量v1:



打印结果为True,表明已经获取到之前创建的v1。

 

接下来用变量共享的方法来创建之前的神经网络,代码如下:




这样代码的可读性会比较强。

当需要用训练好的网络时,直接调用network(x_input, reuse = True)即可。

这篇关于罗斯基白话:TensorFlow+实战系列(四)变量管理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/217662

相关文章

Python与DeepSeek的深度融合实战

《Python与DeepSeek的深度融合实战》Python作为最受欢迎的编程语言之一,以其简洁易读的语法、丰富的库和广泛的应用场景,成为了无数开发者的首选,而DeepSeek,作为人工智能领域的新星... 目录一、python与DeepSeek的结合优势二、模型训练1. 数据准备2. 模型架构与参数设置3

mac安装nvm(node.js)多版本管理实践步骤

《mac安装nvm(node.js)多版本管理实践步骤》:本文主要介绍mac安装nvm(node.js)多版本管理的相关资料,NVM是一个用于管理多个Node.js版本的命令行工具,它允许开发者在... 目录NVM功能简介MAC安装实践一、下载nvm二、安装nvm三、安装node.js总结NVM功能简介N

Java实战之利用POI生成Excel图表

《Java实战之利用POI生成Excel图表》ApachePOI是Java生态中处理Office文档的核心工具,这篇文章主要为大家详细介绍了如何在Excel中创建折线图,柱状图,饼图等常见图表,需要的... 目录一、环境配置与依赖管理二、数据源准备与工作表构建三、图表生成核心步骤1. 折线图(Line Ch

Java使用Tesseract-OCR实战教程

《Java使用Tesseract-OCR实战教程》本文介绍了如何在Java中使用Tesseract-OCR进行文本提取,包括Tesseract-OCR的安装、中文训练库的配置、依赖库的引入以及具体的代... 目录Java使用Tesseract-OCRTesseract-OCR安装配置中文训练库引入依赖代码实

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

在Java中使用ModelMapper简化Shapefile属性转JavaBean实战过程

《在Java中使用ModelMapper简化Shapefile属性转JavaBean实战过程》本文介绍了在Java中使用ModelMapper库简化Shapefile属性转JavaBean的过程,对比... 目录前言一、原始的处理办法1、使用Set方法来转换2、使用构造方法转换二、基于ModelMapper

Java实战之自助进行多张图片合成拼接

《Java实战之自助进行多张图片合成拼接》在当今数字化时代,图像处理技术在各个领域都发挥着至关重要的作用,本文为大家详细介绍了如何使用Java实现多张图片合成拼接,需要的可以了解下... 目录前言一、图片合成需求描述二、图片合成设计与实现1、编程语言2、基础数据准备3、图片合成流程4、图片合成实现三、总结前

nginx-rtmp-module构建流媒体直播服务器实战指南

《nginx-rtmp-module构建流媒体直播服务器实战指南》本文主要介绍了nginx-rtmp-module构建流媒体直播服务器实战指南,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. RTMP协议介绍与应用RTMP协议的原理RTMP协议的应用RTMP与现代流媒体技术的关系2

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)