图像空间人脸正面化代码运行小结

2023-10-18 05:58

本文主要是介绍图像空间人脸正面化代码运行小结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

因为组里实验的需要,我在这几天找了一些图像空间人脸正面化的方法进行了从侧面人脸到正面人脸的生成正面的人脸图像。

总体来说图像空间人脸正面化的方法开源程度不高,甚至可以说算小的。这些天,我看了DRGAN、TPGAN、DAGAN、Rotate and Render(三维的)这些算是图像空间人脸正面化的开源方法了,但是TPGAN和DAGAN都没有提供预训练模型,只提供了开源的代码,而人脸正面化训练消耗的时间和资源都是很大的,还有图片的预处理也是很相比于其他任务来说也是要求很高的,对于我们只想利用人脸正面化结果来说,这些开源的作用不大。

我在github上又找了两个其他人自己复现的TP-GAN的项目,代码和模型的开源都有,但是运行出来的效果不是很理想,所以就没有采用了。

其中最良心的要数DR-GAN了。DR-GAN中不但提供了预训练的模型,而且还有图像的预处理过程,及训练自己数据和做预测的详细步骤介绍。所以用DR-GAN运行出自己想要的结果是很容易的事情。DR-GAN的代码书写规范也是一个很好代码编写学习典范。

最后说说我运行的Rotate-and-Render-master,这是一篇2020年发表的使用三维的方法进行人脸正面化的方法,因为是最近发表,效果上肯定不会差。而且这篇文章从代码到模型,再到训练和推理步骤都很详细。但是对于没有接触过三维的同学来说代码和环境的配置可能有些吃力。

 

注:推荐使用Linux配置环境并运行程序,因为有些库文件在windows上很难安装或者只能在Linux安装。

 

附使用的代码地址:

DR-GAN:https://github.com/tranluan/DR-GAN

第三方TP-GAN:https://github.com/yh-iro/Keras_TP-GAN

https://github.com/scaleway/frontalization

Rotate-and-Render:https://github.com/Hangz-nju-cuhk/Rotate-and-Render

这篇关于图像空间人脸正面化代码运行小结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/230619

相关文章

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

XTU 1233 n个硬币连续m个正面个数(dp)

题面: Coins Problem Description: Duoxida buys a bottle of MaiDong from a vending machine and the machine give her n coins back. She places them in a line randomly showing head face or tail face o

分布式系统的个人理解小结

分布式系统:分的微小服务,以小而独立的业务为单位,形成子系统。 然后分布式系统中需要有统一的调用,形成大的聚合服务。 同时,微服务群,需要有交流(通讯,注册中心,同步,异步),有管理(监控,调度)。 对外服务,需要有控制的对外开发,安全网关。

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

【高等代数笔记】线性空间(一到四)

3. 线性空间 令 K n : = { ( a 1 , a 2 , . . . , a n ) ∣ a i ∈ K , i = 1 , 2 , . . . , n } \textbf{K}^{n}:=\{(a_{1},a_{2},...,a_{n})|a_{i}\in\textbf{K},i=1,2,...,n\} Kn:={(a1​,a2​,...,an​)∣ai​∈K,i=1,2,...,n

UMI复现代码运行逻辑全流程(一)——eval_real.py(尚在更新)

一、文件夹功能解析 全文件夹如下 其中,核心文件作用为: diffusion_policy:扩散策略核心文件夹,包含了众多模型及基础库 example:标定及配置文件 scripts/scripts_real:测试脚本文件,区别在于前者倾向于单体运行,后者为整体运行 scripts_slam_pipeline:orb_slam3运行全部文件 umi:核心交互文件夹,作用在于构建真

【python计算机视觉编程——7.图像搜索】

python计算机视觉编程——7.图像搜索 7.图像搜索7.1 基于内容的图像检索(CBIR)从文本挖掘中获取灵感——矢量空间模型(BOW表示模型)7.2 视觉单词**思想****特征提取**: 创建词汇7.3 图像索引7.3.1 建立数据库7.3.2 添加图像 7.4 在数据库中搜索图像7.4.1 利用索引获取获选图像7.4.2 用一幅图像进行查询7.4.3 确定对比基准并绘制结果 7.

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

win7系统中C盘空间缩水的有效处理方法

一、深度剖析和完美解决   1、 休眠文件 hiberfil.sys :   该文件在C盘根目录为隐藏的系统文件,隐藏的这个hiberfil.sys文件大小正好和自己的物理内存是一致的,当你让电脑进入休眠状态时,Windows 7在关闭系统前将所有的内存内容写入Hiberfil.sys文件。   而后,当你重新打开电脑,操作系统使用Hiberfil.sys把所有信息放回内存,电脑

求空间直线与平面的交点

若直线不与平面平行,将存在交点。如下图所示,已知直线L过点m(m1,m2,m3),且方向向量为VL(v1,v2,v3),平面P过点n(n1,n2,n3),且法线方向向量为VP(vp1,vp2,vp3),求得直线与平面的交点O的坐标(x,y,z): 将直线方程写成参数方程形式,即有: x = m1+ v1 * t y = m2+ v2 * t