comfyui虚拟试衣、ai换装、电商换装源码

2024-06-19 02:04

本文主要是介绍comfyui虚拟试衣、ai换装、电商换装源码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、AI换装技术博客

1. 项目介绍

IDM-VTON 是一个虚拟试衣模型,可以在 ComfyUI 中进行部署。相比于其他虚拟试衣模型,如 OOTDiffusion,IDM-VTON 提升了图像保真度和细节保留,更强调真实感,而且就算是侧面的模特或者背面的模特都能上身,已经完全达到了商用的水平。该项目简化了部署过程,是一个不错的选择。

项目地址
GitHub项目地址:https://github.com/TemryL/ComfyUI-IDM-VTON
Huggingface模型地址:https://huggingface.co/yisol/IDM-VTON
体验地址:https://pcai.wailikeji.com

2.配置要求

  • 显存:建议 16G 以上,12G 也可以运行但速度较慢。
  • 模型下载:第一次运行工作流时模型会自动下载,约 26G。请确保网络环境良好并设置好代理。

3. 插件安装与模型下载

3.1插件安装

在 ComfyUI 中部署 IDM-VTON 的过程较为简单。首先,在管理器中搜索 “ComfyUI-IDM-VTON” 并进行安装。安装完成后重启 ComfyUI 即可。
在这里插入图片描述
在这里插入图片描述

3.2模型下载

下载地址 :
https://huggingface.co/yisol/IDM-VTON/tree/main
下载到的目录:
在这里插入图片描述

二、使用教程

1. 工作流配置

IDM-VTON 的主要工作流涉及使用 segment anything 插件来对衣服进行遮罩,然后用 IDM-VTON 对遮罩区域的衣服进行替换。为了更好地控制人物姿势,还可以使用 ControlNet 插件。

2. 辅助插件安装

在 ComfyUI 管理器中安装segment anything和ControlNet插件。同上面安装ComfyUI-IDM-VTON一样,通过管理器进行安装,此处不再赘述。

3. 配置提示词

在提示词中指定需要进行蒙版遮罩的部位。例如,要替换上半身的T恤,在提示词中写 “T-shirt” 或 “shirt” 即可,如果shirt识别不出来,也可以试下用"clothing"。
在这里插入图片描述

4. 精度设置

根据本地配置选择合适的精度:

  • bfloat16:最省内存且速度最快,但精度有所损失。
  • float16:平衡内存和精度。
  • float32:最高精度,但内存消耗大。
    在这里插入图片描述

三、示例效果

1. 更换T恤

通过配置正面提示词,上传衣服图片,生成的效果如下:
在这里插入图片描述
侧面效果也很好噢!这个就是与OOTDiffusion的区别所在!
像下面这种模特图片不好通过提示词扣除蒙版,也不要紧,我们可以去掉 segment anything 的节点,直接加载图像链接遮罩,手动绘制蒙版,就可以精准控制上身的效果!

3. 更换牛仔裤

同样的流程,可以轻松更换下半身的牛仔裤:
在这里插入图片描述
在这里插入图片描述

4. 手动遮罩

如果 segment anything 插件无法满足需求,可以手动画遮罩。加载图像后,右键点击图片,在遮罩编辑器中打开进行编辑。
在这里插入图片描述
手动绘制遮罩后效果展示:
在这里插入图片描述

四、Comfyui工作流与绘图应用源码获取

对应的工作流我也已经整理好了!一个是自动换装,一个是手动换装!

我们项目中也接入了IDM-VTON的ai换装工作流。绘图中接入了comfyui、dalle、mj实现了电商换装、换脸、ai抠图、图片变高清、智能扩图、艺术二维码等功能。另外还接入了国内外各大平台的gpt聊天模型,使用milvus作为向量数据库,可上传知识库文档。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
项目体验地址:
https://pcai.wailikeji.com/

需要工作流文件或者整个项目源码的联系我v:bjxueai

这篇关于comfyui虚拟试衣、ai换装、电商换装源码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1073700

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti