老黄终于不穿皮衣了,分享一个AI换装AI试衣软件!

2024-05-13 23:36

本文主要是介绍老黄终于不穿皮衣了,分享一个AI换装AI试衣软件!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

用AI实现在线试衣,或者在线换装,这不是一个新概念,肯定有人这么想过,但并不是所有人能都能轻松做到啊!

今天就来分享一个人人都可以实现的方法,而且是那种傻瓜式的不用付钱的那种,甚至可以把软件在直接装在本地电脑上运行,无拘无束的玩耍。

下面就先来看几个例子。

让皮衣刀客老黄,穿点不一样的!

一换女装老黄要变苏妈的赶脚… haha !

另外可以看到,即便是T恤上带文字,也能做到很好的效果!

给泰勒换个上衣!

应该说,毫无违和感。

当然也可以找一张生活化的照片,自己给自己换个衣服!

不给原图的话,真的看不出这T恤是P上去的。

看了几个例子效果还不错吧。当然,单论结果的话,PS玩家也能做出来。

那么AI有什么优势呢?简单咯!

AI加持下完成这些操作非常简单,只要上传图片,点一下,即可完成。

这比PS简单多了,所以AI绘画出来之后,阿逗比都没人玩了。

下面就来具体介绍下如何操作。

今天用到的软件(开源项目)叫IDM-VTON ,主页的一句话介绍是,在自然环境中改善扩散模型以实现真实的虚拟试穿

从介绍来看,主打一个逼真

这个软件可以通过两种方式运行。

一种是使用官方演示Demo在线运行。

另一种是自己配置安装在电脑上运行。

今天先介绍第一种“轻量级”玩法,只要有浏览器就行,对电脑配置没什么要求。

直接打开网址:

https://huggingface.co/spaces/yisol/IDM-VTON

打开之后,立马就可以看到主界面了。界面非常节俭,很好理解。

你只要上传模特和衣服的照片,点一下下面的TRY-ON按钮。

然后等个十几秒钟就可以了。

如果你没有照片,可以用网页上提供的示例图片(Example),进行快速体验。

只要点一下照片,会自动放到对应的区域。

执行成功之后,会生成两张照片。

左边是自动遮罩的照片,右边是最终效果图。

从这两张图片,我们可以清楚的知道,这个应用的本质还是区域替换或者区域生成。

替换的区域由遮罩决定,而自动生成的遮罩往往无法适用于任何场景。

所以,有时候我们需要手动画遮罩。

下面就简单说一下,手动遮罩的使用方法。

①点击画笔

②涂抹衣服区域

③去掉自动遮罩前面的勾选。

这样就可以替换自定义区域了。

另外说一下④自动裁剪和缩放选项,如果你提供的照片比例和样例差的比较多,可能生成的图片会有些奇怪,这种情况下可以勾选这个选项。

另外在Try-on按钮下,还有两个选项扩展选项Denoising Step 和Seed

让GPT4来给解释一下。

Denoising Steps(去噪步数)

扩散模型工作的基本原理是先引入噪声来扰乱图像,然后逐步去除这些噪声来生成图像。在这个过程中,”Denoising Steps” 指的是去噪阶段的具体步数。这些步数决定了模型将如何逐步从包含大量噪声的图像中恢复出清晰的图像。

  • 更多的去噪步骤:通常意味着生成过程更平滑,可以更细致地控制噪声的减少,可能会得到更高质量的图像。
  • 较少的去噪步骤:生成速度更快,但可能会牺牲一些图像质量。

Seed(种子)

在生成图像的过程中,“Seed”指的是随机数生成器的种子。这个种子决定了生成图像的随机性的起始点。通过设置相同的种子,可以确保每次生成的图像是一致的,即使在不同的时间或不同的机器上运行相同的代码和参数。

  • 使用相同的种子:可以重复生成完全相同的图像。
  • 改变种子值:每次生成的图像会有所不同,即使是在相同的模型和参数配置下。

在实践中,调整这些参数可以帮助你控制生成图像的过程和质量,实现更符合需求的结果。

之前玩过SD等绘画软件的,对这些参数应该比较熟悉。

这个用起来非常简单,基本上只要给网址,大家都能轻松使用。

但是还是有两个老问题

一个是你可能根本打不开这个网址,这个懂得都懂,不懂我也不能给你解释。

另外一个是,在线资源有限,你可能抢不到算力,也可能这个页面突然就消失了。

所以,我们还是有必要搞个完全离线的版本

我本地安装配置已经搞好,RTX3090上十几秒就能出一张图,效率也挺高。

下一篇,给大家分享一下安装配置过程和完全离线的一键运行包!

相关网址

github:https://github.com/yisol/IDM-VTON

demo:https://huggingface.co/spaces/yisol/IDM-VTON

website:https://idm-vton.github.io/

博客:老黄终于不穿皮衣了,分享一个AI换装AI试衣软件! – 托尼不是塔克

这篇关于老黄终于不穿皮衣了,分享一个AI换装AI试衣软件!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/987123

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

【专题】2024飞行汽车技术全景报告合集PDF分享(附原数据表)

原文链接: https://tecdat.cn/?p=37628 6月16日,小鹏汇天旅航者X2在北京大兴国际机场临空经济区完成首飞,这也是小鹏汇天的产品在京津冀地区进行的首次飞行。小鹏汇天方面还表示,公司准备量产,并计划今年四季度开启预售小鹏汇天分体式飞行汽车,探索分体式飞行汽车城际通勤。阅读原文,获取专题报告合集全文,解锁文末271份飞行汽车相关行业研究报告。 据悉,业内人士对飞行汽车行业

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

软件设计师备考——计算机系统

学习内容源自「软件设计师」 上午题 #1 计算机系统_哔哩哔哩_bilibili 目录 1.1.1 计算机系统硬件基本组成 1.1.2 中央处理单元 1.CPU 的功能 1)运算器 2)控制器 RISC && CISC 流水线控制 存储器  Cache 中断 输入输出IO控制方式 程序查询方式 中断驱动方式 直接存储器方式(DMA)  ​编辑 总线 ​编辑

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti