G6 - CycleGAN实战

2024-06-15 05:28
文章标签 实战 cyclegan g6

本文主要是介绍G6 - CycleGAN实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 🍨 本文为[🔗365天深度学习训练营](https://mp.weixin.qq.com/s/0dvHCaOoFnW8SCp3JpzKxg) 中的学习记录博客
  • 🍖 原作者:[K同学啊](https://mtyjkh.blog.csdn.net/)

目录

  • 理论知识
    • CycleGAN能做什么
  • 模型结构
    • 损失函数
  • 模型效果
  • 总结与心得体会


理论知识

CycleGAN能做什么

CycleGAN的一个重要的应用领域就是Domain Adapation(域迁移:可以通俗的理解 为画风迁移)。

比如可以把一张普通的风景照变化成梵高的画作,或者将游戏画面变化成真实世界的画面,将一匹正常肤色的马转换为斑马等。
在这里插入图片描述

模型结构

CycleGAN由左右两个GAN网络组成。

G(AB)负责把A类物体(斑马)转换成B类物体(正常的马)
G(BA)负责把B类物体(正常的马)还原成A类物体(斑马)

然后由一个判别器网络D来判别B类物体的真实性

损失函数

CycleGAN的Loss由三部分组成,即:
L o s s = L o s s G A N + L o s s c y c l e + L o s s i d e n t i t y Loss=Loss_{GAN}+Loss_{cycle}+Loss_{identity} Loss=LossGAN+Losscycle+Lossidentity
其中:

  • L o s s G A N Loss_{GAN} LossGAN 用于保证生成器和判别器相互进货,进行保证生成器能产生更真实的图片,这部分与其它的GAN网络无异。
  • L o s s c y c l e Loss_{cycle} Losscycle 用于保证生成器的输出图片与输入图片只是风格不同,而内容相同。即保证:将由图像 x x x生成的图像 Y ^ \hat{Y} Y^再放入生成器 F F F中,使生成的图像 x ^ \hat{x} x^尽可能与原始图像 x x x相似。
  • L o s s i d e n t i t y Loss_{identity} Lossidentity 是映射损失,即用真实的A当做输入,查看生成器是否会原封不到的输出

三种损失函数所捕捉的损失类型如图所示:
三种不同的损失函数

模型效果

直接下载UP提供的软件包,解压data.zip和cyclegan.zip

通过执行 python cyclegan.py来训练模型,默认参数是训练400个epoch需要训练一天时间以上,我们临时修改为训练4个epoch

# 还需要设置一下开始衰减的epoch,只要比n_epochs小就好,这里设置为2
python cyclegan.py --n_epochs 4 --decay_epoch 2

运行日志

模型效果
由于训练时间太短,只是稍微有些莫奈的味道

总结与心得体会

通过对CycleGAN的学习,我理解CycleGAN其实是训练了较前作来说是完整的GAN模型,G模型用来做从通过A生成B,F模型用来做通过B生成A。如果只是分别看GAN的损失,的确是两个不相关的模型,但是作者通过Cycle损失和Identity损失,将两个模型联合在一起进行训练,训练好的生成器G和生成器F就可以实现相反的两种转换。

通过前面的视频也可以看出,不同的帧之间,不一定具有一致性, 所以将一个图像模型直接转换为视频模型,有一个需要考虑的点就是前后帧的一致性问题,这应该是视频生成模型的共性问题。

这篇关于G6 - CycleGAN实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1062547

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

滚雪球学Java(87):Java事务处理:JDBC的ACID属性与实战技巧!真有两下子!

咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java SE啦,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好习惯,别被干货淹没了哦~ 🏆本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,助你一臂之力,带你早日登顶🚀,欢迎大家关注&&收藏!持续更新中,up!up!up!! 环境说明:Windows 10

springboot实战学习(1)(开发模式与环境)

目录 一、实战学习的引言 (1)前后端的大致学习模块 (2)后端 (3)前端 二、开发模式 一、实战学习的引言 (1)前后端的大致学习模块 (2)后端 Validation:做参数校验Mybatis:做数据库的操作Redis:做缓存Junit:单元测试项目部署:springboot项目部署相关的知识 (3)前端 Vite:Vue项目的脚手架Router:路由Pina:状态管理Eleme

深度学习实战:如何利用CNN实现人脸识别考勤系统

1. 何为CNN及其在人脸识别中的应用 卷积神经网络(CNN)是深度学习中的核心技术之一,擅长处理图像数据。CNN通过卷积层提取图像的局部特征,在人脸识别领域尤其适用。CNN的多个层次可以逐步提取面部的特征,最终实现精确的身份识别。对于考勤系统而言,CNN可以自动从摄像头捕捉的视频流中检测并识别出员工的面部。 我们在该项目中采用了 RetinaFace 模型,它基于CNN的结构实现高效、精准的

项目实战系列三: 家居购项目 第四部分

购物车 🌳购物车🍆显示购物车🍆更改商品数量🍆清空购物车&&删除商品 🌳生成订单 🌳购物车 需求分析 1.会员登陆后, 可以添加家居到购物车 2.完成购物车的设计和实现 3.每添加一个家居,购物车的数量+1, 并显示 程序框架图 1.新建src/com/zzw/furns/entity/CartItem.java, CartItem-家居项模型 /***

Birt报表开发实战

我就截图描述得了,没什么含金量,看图基本明白的。 1.开始 a.创建报表文件 b.数据源配置 c.配置数据集 2.网格报表 拖拉式操作,很方便 3.预览效果 其他报表的操作也基本不难,就不扯了! 2.级联参数 官方视频教程:http://demo.actuate.com/demos/cascade/cascade.html

[yolov5] --- yolov5入门实战「土堆视频」

1 项目介绍及环境配置 下载yolov5 tags 5.0源码,https://github.com/ultralytics/yolov5/tree/v5.0,解压 Pycharm 中创建conda虚拟环境 激活conda虚拟环境 根据作者提供的requirements.txt文件,pip install -r requirements.txt 如果作者没有提供requirement.txt文件