【Python/Pytorch - 网络模型】-- 手把手搭建3D VGG感知损失模型

2024-06-13 19:36

本文主要是介绍【Python/Pytorch - 网络模型】-- 手把手搭建3D VGG感知损失模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
文章目录

文章目录

  • 00 写在前面
  • 01 基于Pytorch版本的3D VGG代码
  • 02 论文下载

00 写在前面

感知损失:对于提升图片的肉眼可见细节,效果十分明显;对于一些指标如(SSIM、PSNR)这些,效果不明显。

在01中,可以根据3D VGG的网络结构,进行模块化编程,主要包括VGG3D模块。

在模型调试过程中,可以先通过简单测试代码,进行代码调试。

01 基于Pytorch版本的3D VGG代码

# 库函数调用
import torch
import torch.nn as nn# VGG3D模块
class CustomVGG3D(nn.Module):def __init__(self, in_channels=3, out_channels=2):super(CustomVGG3D, self).__init__()self.features = nn.Sequential(nn.Conv3d(in_channels, 64, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),nn.Conv3d(64, 64, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),nn.Conv3d(64, 128, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),nn.Conv3d(128, 128, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),nn.Conv3d(128, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),nn.Conv3d(256, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),nn.Conv3d(256, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),nn.Conv3d(256, 256, kernel_size=(3, 3, 3), padding=(1, 1, 1)),nn.ReLU(inplace=True),# nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),# nn.Conv3d(256, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),# nn.ReLU(inplace=True),# nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),# nn.ReLU(inplace=True),# nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),# nn.ReLU(inplace=True),# nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),# nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),# nn.ReLU(inplace=True),# nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),# nn.ReLU(inplace=True),# nn.Conv3d(512, 512, kernel_size=(3, 3, 3), padding=(1, 1, 1)),# nn.ReLU(inplace=True),# nn.MaxPool3d(kernel_size=(2, 2, 2), stride=(2, 2, 2)),)self.classifier = nn.Sequential(nn.Linear(512 * 8 * 8 * 1, 4096),nn.ReLU(True),nn.Linear(4096, 4096),nn.ReLU(True),nn.Linear(4096, out_channels),nn.Sigmoid())def forward(self, x):x = self.features(x)# x = x.view(x.size(0), -1)# x = self.classifier(x)return x# 测试代码
# if __name__ == '__main__':
#     x = torch.ones([2, 4, 256, 256, 32])
#     model = CustomVGG3D(in_channels=4, out_channels=1)
#     f = model(x)
#     print(f)

02 论文下载

Very deep convolutional neural network based image classification using small training sample size
arXiv: VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

这篇关于【Python/Pytorch - 网络模型】-- 手把手搭建3D VGG感知损失模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1058231

相关文章

轻量级在线服装3D定制引擎Myway简介

我写的面向web元宇宙轻量级系列引擎中的另外一个,在线3D定制引擎Myway 3D。 用于在线商品定制,比如个性化服装的定制、日常用品(如杯子)、家装(被套)等物品的在线定制。 特性列表: 可更换衣服款式,按需定制更换模型可实时更改材质颜色可实时添加文本,并可实时修改大小、颜色和角度,支持自定义字体可实时添加艺术图标,并可实时修改大小、颜色和角度,支持翻转、各种对齐可更改衣服图案,按需求定制

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

【Altium】查找PCB上未连接的网络

【更多软件使用问题请点击亿道电子官方网站】 1、文档目标: PCB设计后期检查中找出没有连接的网络 应用场景:PCB设计后期,需要检查是否所有网络都已连接布线。虽然未连接的网络会有飞线显示,但是由于布线后期整板布线密度较高,虚连,断连的网络用肉眼难以轻易发现。用DRC检查也可以找出未连接的网络,如果PCB中DRC问题较多,查找起来就不是很方便。使用PCB Filter面板来达成目的相比DRC

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

Python 字符串占位

在Python中,可以使用字符串的格式化方法来实现字符串的占位。常见的方法有百分号操作符 % 以及 str.format() 方法 百分号操作符 % name = "张三"age = 20message = "我叫%s,今年%d岁。" % (name, age)print(message) # 我叫张三,今年20岁。 str.format() 方法 name = "张三"age

通信系统网络架构_2.广域网网络架构

1.概述          通俗来讲,广域网是将分布于相比局域网络更广区域的计算机设备联接起来的网络。广域网由通信子网于资源子网组成。通信子网可以利用公用分组交换网、卫星通信网和无线分组交换网构建,将分布在不同地区的局域网或计算机系统互连起来,实现资源子网的共享。 2.网络组成          广域网属于多级网络,通常由骨干网、分布网、接入网组成。在网络规模较小时,可仅由骨干网和接入网组成

Toolbar+DrawerLayout使用详情结合网络各大神

最近也想搞下toolbar+drawerlayout的使用。结合网络上各大神的杰作,我把大部分的内容效果都完成了遍。现在记录下各个功能效果的实现以及一些细节注意点。 这图弹出两个菜单内容都是仿QQ界面的选项。左边一个是drawerlayout的弹窗。右边是toolbar的popup弹窗。 开始实现步骤详情: 1.创建toolbar布局跟drawerlayout布局 <?xml vers

一道经典Python程序样例带你飞速掌握Python的字典和列表

Python中的列表(list)和字典(dict)是两种常用的数据结构,它们在数据组织和存储方面有很大的不同。 列表(List) 列表是Python中的一种有序集合,可以随时添加和删除其中的元素。列表中的元素可以是任何数据类型,包括数字、字符串、其他列表等。列表使用方括号[]表示,元素之间用逗号,分隔。 定义和使用 # 定义一个列表 fruits = ['apple', 'banana

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请尝试使用 st.altair_chart 指定所需的图表。 Function signa

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达