【几分钟】快速熟悉torch.save()、torch.load()、torch.nn.Module.load_state_dict()

2024-02-09 15:20

本文主要是介绍【几分钟】快速熟悉torch.save()、torch.load()、torch.nn.Module.load_state_dict(),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【几分钟】快速熟悉torch.save()、torch.load()、torch.nn.Module.load_state_dict()


🌵文章目录🌵

  • 🌳引言🌳
  • 🌳torch.save()详解🌳
  • 🌳torch.load()详解🌳
  • 🌳torch.nn.Module.load_state_dict()详解🌳
  • 🌳保存并加载模型的几种方式🌳
  • 🌳总结🌳
  • 🌳结尾🌳


🌳引言🌳

在PyTorch中,模型训练完成后通常需要保存以便后续使用或进行进一步的训练。PyTorch提供了几种方法来实现模型的保存和加载,其中torch.save(), torch.load()torch.nn.Module.load_state_dict()是最常用的函数。本文将用几分钟的时间带您快速熟悉这三个函数的使用方法和注意事项。


🌳torch.save()详解🌳

torch.save()函数用于保存模型的状态或整个模型。其用法如下:

torch.save(obj, f)
  • obj: 要保存的对象,可以是模型的状态字典、整个模型等。
  • f: 保存文件的路径。

当有保存模型的需求时,通常推荐只保存模型的参数(即状态字典),而不是整个模型实例。这样可以避免保存模型定义时的额外信息,比如优化器的状态等,保存模型的示例如下:

# 保存模型的状态字典
torch.save(model.state_dict(), 'model_state_dict.pth')# 如果需要保存整个模型,可以这样做,但通常不推荐
torch.save(model, 'model.pth')

🌳torch.load()详解🌳

torch.load()函数用于加载之前保存的模型或状态字典。其用法如下:

torch.load(f, map_location=None)
  • f: 加载文件的路径。
  • map_location: 指定加载模型到哪个设备上,比如CPU或特定的GPU。

加载模型时,需要根据保存时的方式选择加载整个模型还是仅加载状态字典

# 加载状态字典
state_dict = torch.load('model_state_dict.pth')# 加载整个模型(如果之前是这样保存的)
model = torch.load('model.pth')

🌳torch.nn.Module.load_state_dict()详解🌳

torch.nn.Module.load_state_dict()是PyTorch模型类(继承自torch.nn.Module)的一个方法,用于加载状态字典。其用法如下:

model.load_state_dict(state_dict, strict=True)
  • state_dict: 要加载的状态字典。
  • strict: 是否严格检查加载的状态字典与模型当前的状态字典是否完全匹配。默认为True。

使用load_state_dict()加载状态字典时,需要先实例化模型类,然后调用此方法加载之前保存的状态

# 实例化模型类
model = MyModel()# 加载状态字典
model.load_state_dict(torch.load('model_state_dict.pth'))

🌳保存并加载模型的几种方式🌳

  1. 仅保存和加载状态字典

    这是推荐的方式,因为它只保存和加载模型的参数,不包含其他不必要的信息。

# 保存
torch.save(model.state_dict(), 'model_state_dict.pth')# 加载
model = MyModel()
model.load_state_dict(torch.load('model_state_dict.pth'))
  1. 保存和加载整个模型

    这种方式会保存模型的所有信息,包括参数、优化器状态等。但这种方式不够灵活,通常不推荐。

# 保存
torch.save(model, 'model.pth')# 加载
model = torch.load('model.pth')

🌳总结🌳

在PyTorch中,模型的保存和加载主要通过torch.save(), torch.load()torch.nn.Module.load_state_dict()实现。推荐的做法是只保存和加载模型的状态字典,这样更加灵活且只包含模型的核心信息。在加载模型时,需要先实例化模型类,然后使用load_state_dict()方法加载状态字典。


🌳结尾🌳

亲爱的读者,首先感谢抽出宝贵的时间来阅读我们的博客。我们真诚地欢迎您留下评论和意见💬
俗话说,当局者迷,旁观者清。的客观视角对于我们发现博文的不足、提升内容质量起着不可替代的作用。
如果博文给您带来了些许帮助,那么,希望能为我们点个免费的赞👍👍/收藏👇👇您的支持和鼓励👏👏是我们持续创作✍️✍️的动力
我们会持续努力创作✍️✍️,并不断优化博文质量👨‍💻👨‍💻,只为给带来更佳的阅读体验。
如果有任何疑问或建议,请随时在评论区留言,我们将竭诚为你解答~
愿我们共同成长🌱🌳,共享智慧的果实🍎🍏!


万分感谢🙏🙏点赞👍👍、收藏⭐🌟、评论💬🗯️、关注❤️💚~

这篇关于【几分钟】快速熟悉torch.save()、torch.load()、torch.nn.Module.load_state_dict()的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/694574

相关文章

电脑桌面文件删除了怎么找回来?别急,快速恢复攻略在此

在日常使用电脑的过程中,我们经常会遇到这样的情况:一不小心,桌面上的某个重要文件被删除了。这时,大多数人可能会感到惊慌失措,不知所措。 其实,不必过于担心,因为有很多方法可以帮助我们找回被删除的桌面文件。下面,就让我们一起来了解一下这些恢复桌面文件的方法吧。 一、使用撤销操作 如果我们刚刚删除了桌面上的文件,并且还没有进行其他操作,那么可以尝试使用撤销操作来恢复文件。在键盘上同时按下“C

hdu 4565 推倒公式+矩阵快速幂

题意 求下式的值: Sn=⌈ (a+b√)n⌉%m S_n = \lceil\ (a + \sqrt{b}) ^ n \rceil\% m 其中: 0<a,m<215 0< a, m < 2^{15} 0<b,n<231 0 < b, n < 2^{31} (a−1)2<b<a2 (a-1)^2< b < a^2 解析 令: An=(a+b√)n A_n = (a +

v0.dev快速开发

探索v0.dev:次世代开发者之利器 今之技艺日新月异,开发者之工具亦随之进步不辍。v0.dev者,新兴之开发者利器也,迅速引起众多开发者之瞩目。本文将引汝探究v0.dev之基本功能与优势,助汝速速上手,提升开发之效率。 何谓v0.dev? v0.dev者,现代化之开发者工具也,旨在简化并加速软件开发之过程。其集多种功能于一体,助开发者高效编写、测试及部署代码。无论汝为前端开发者、后端开发者

状态模式state

学习笔记,原文链接 https://refactoringguru.cn/design-patterns/state 在一个对象的内部状态变化时改变其行为, 使其看上去就像改变了自身所属的类一样。 在状态模式中,player.getState()获取的是player的当前状态,通常是一个实现了状态接口的对象。 onPlay()是状态模式中定义的一个方法,不同状态下(例如“正在播放”、“暂停

利用Django框架快速构建Web应用:从零到上线

随着互联网的发展,Web应用的需求日益增长,而Django作为一个高级的Python Web框架,以其强大的功能和灵活的架构,成为了众多开发者的选择。本文将指导你如何从零开始使用Django框架构建一个简单的Web应用,并将其部署到线上,让世界看到你的作品。 Django简介 Django是由Adrian Holovaty和Simon Willison于2005年开发的一个开源框架,旨在简

CentOs7上Mysql快速迁移脚本

因公司业务需要,对原来在/usr/local/mysql/data目录下的数据迁移到/data/local/mysql/mysqlData。 原因是系统盘太小,只有20G,几下就快满了。 参考过几篇文章,基于大神们的思路,我封装成了.sh脚本。 步骤如下: 1) 先修改好/etc/my.cnf,        ##[mysqld]       ##datadir=/data/loc

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

UE5 半透明阴影 快速解决方案

Step 1: 打开该选项 Step 2: 将半透明材质给到模型后,设置光照的Shadow Resolution Scale,越大,阴影的效果越好

快速排序(java代码实现)

简介: 1.采用“分治”的思想,对于一组数据,选择一个基准元素,这里选择中间元素mid 2.通过第一轮扫描,比mid小的元素都在mid左边,比mid大的元素都在mid右边 3.然后使用递归排序这两部分,直到序列中所有数据均有序为止。 public class csdnTest {public static void main(String[] args){int[] arr = {3,

类的load方法和initialize方法对比

1. load方法在main()之前被调用,而initialize方法在main()之后调用 load方法实际是在load_images过程中被调用的。load_images会将当前应用依赖的所有镜像(动态库)加载到内存,在在加载中首先是对镜像进行扫描,将所有包含 load 方法的类加入列表 loadable_classes ,然后从这个列表中逐一调用其所包含的 load 方法。 +[XXCl