TensorFlow Saver类 保存模型与恢复模型

2024-06-22 06:58

本文主要是介绍TensorFlow Saver类 保存模型与恢复模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

因工程需求,今天想找一下Saver类如何保存部分参数或者是恢复部分参数,一直没找到有效的帖子,所以自己来总结性的写一个吧

常规的保存与恢复如下

saver = tf.train.Saver(tf.trainable_variables(), max_to_keep=3) 定义一个Saver对象 (max_to_keep指我们总共保存多少个模型)
saver.save(sess, 'model/model.ckpt', global_step=step)(step是指当前训练到哪一步了,只是为了区分名字,会组装到ckpt文件名里去)

每次保留都会生成三个文件,data文件是权重文件,index是一个索引文件,meta文件保留的图的结构

恢复图结构:

saver=tf.train.import_meta_graph('model.ckpt-1000.meta')(图结构就进入了sess了)

保留部分参数

v1 = tf.Variable(1. , name="v1")
v2 = tf.Variable(2. , name="v2")
a = tf.add(v1, v2)
saver = tf.train.Saver("v1":v1,"v2": v2}) 
saver.save(sess, 'model/model.ckpt', global_step=step)

恢复部分参数

saver = tf.train.Saver({"v1": u1, "v2": u2})
with tf.Session() as sess:  saver.restore(sess, "./Model/model.ckpt")  

把model.ckpt中u1 u2的值分别赋给v1 v2,以便在新模型中使用,恢复部分参数更多是使用下面的一个方法


扩展原始模型

graph = tf.train.import_meta_graph(dir + '/vgg/results/vgg-16.meta')
graph = tf.get_default_graph()
output_conv =vgg_graph.get_tensor_by_name('conv1_2:0')
output_conv_sg = tf.stop_gradient(output_conv)     #从此处进行截断,进行后续新的处理
# Build further operations
output_conv_shape = output_conv_sg.get_shape().as_list()
W1=tf.get_variable('W1',shape[1,1,output_conv_shape[3],32],initializer=tf.random_normal_initializer(stddev=1e-1))
z1 = tf.nn.conv2d(output_conv_sg, W1, strides=[1, 1, 1, 1], padding='SAME') 
a = tf.nn.relu(z1)

这样就可以在别人训练好的模型的基础上采用一部分底层的东西运用到自己的模型上,因为像一个训练好的模型最开始的几层提取的都是边边角角的信息,在别的同样的自然场景下还是可以用这几层已经训练好的权重,会更快的收敛,加快训练速度




这篇关于TensorFlow Saver类 保存模型与恢复模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1083600

相关文章

使用C#导出Excel数据并保存多种格式的完整示例

《使用C#导出Excel数据并保存多种格式的完整示例》在现代企业信息化管理中,Excel已经成为最常用的数据存储和分析工具,从员工信息表、销售数据报表到财务分析表,几乎所有部门都离不开Excel,本文... 目录引言1. 安装 Spire.XLS2. 创建工作簿和填充数据3. 保存为不同格式4. 效果展示5

Java领域模型示例详解

《Java领域模型示例详解》本文介绍了Java领域模型(POJO/Entity/VO/DTO/BO)的定义、用途和区别,强调了它们在不同场景下的角色和使用场景,文章还通过一个流程示例展示了各模型如何协... 目录Java领域模型(POJO / Entity / VO/ DTO / BO)一、为什么需要领域模

深入理解Redis线程模型的原理及使用

《深入理解Redis线程模型的原理及使用》Redis的线程模型整体还是多线程的,只是后台执行指令的核心线程是单线程的,整个线程模型可以理解为还是以单线程为主,基于这种单线程为主的线程模型,不同客户端的... 目录1 Redis是单线程www.chinasem.cn还是多线程2 Redis如何保证指令原子性2.

Mysql利用binlog日志恢复数据实战案例

《Mysql利用binlog日志恢复数据实战案例》在MySQL中使用二进制日志(binlog)恢复数据是一种常见的用于故障恢复或数据找回的方法,:本文主要介绍Mysql利用binlog日志恢复数据... 目录mysql binlog核心配置解析查看binlog日志核心配置项binlog核心配置说明查看当前所

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型(阻塞、非阻塞、IO复用、信号驱动、异步),重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

Java使用HttpClient实现图片下载与本地保存功能

《Java使用HttpClient实现图片下载与本地保存功能》在当今数字化时代,网络资源的获取与处理已成为软件开发中的常见需求,其中,图片作为网络上最常见的资源之一,其下载与保存功能在许多应用场景中都... 目录引言一、Apache HttpClient简介二、技术栈与环境准备三、实现图片下载与保存功能1.

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结