Differential Diffusion,赋予每个像素它应有的力量,以及在comfyui中的测试效果

本文主要是介绍Differential Diffusion,赋予每个像素它应有的力量,以及在comfyui中的测试效果,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

🥽原论文要点

首先是原论文地址:https://differential-diffusion.github.io/paper.pdf

其次是git介绍地址:GitHub - exx8/differential-diffusion

感兴趣的朋友们可以自行阅读。

首先,论文开篇就给了一个例子:

我们的方法根据给定的图片和文本提示,以不同的程度改变图像的不同区域。这种可控性允许我们再现渐进的过程(例如,左下角的火),并且能够在不同编辑强度之间无缝融合。

引导用的提示词从左到右分别是:“海底的生命之树”,“云端之上的宫殿”,“3D深度外太空星云背景”,“火”,“彩虹的异想天开的插图”,“幻想艺术”。

从这个开篇例子就可以看出,这个算法可以实现图像重绘过程中,更好的调整重绘画面与原图的融合程度。

这种对变化量的精细控制开启了多种新的编辑能力,例如控制单个对象被修改的程度,或者引入逐渐的空间变化的能力。此外,这篇文章展示了框架在软修复方面的有效性——在确保无缝集成的同时微妙调整周围区域以完成图像的部分。

同时,这个框架仅在推理期间运行,不需要模型训练或微调。

原作者提出的一个重要洞察是,在扩散的推理过程中选择性地在不同的时间步骤修改各个区域,我们可以在空间基础上控制对原始图像的忠实度。

以在照片的树林区域引入野火为例。由于火是连续的现象,我们不希望进行突然和完全的转变,例如用烧焦的树桩替换所有树木。相反,我们希望以可控的方式在照片中的不同区域引入不同程度的火势(图1右下角)。 

论文中很重要的一个思路可以用这张图来概括:

随时间的分解。观察变化图如何决定推理过程——区域越暗,越早从残留中复制。或者换句话说,区域越暗,画面中添加的噪声越多,而画面越浅,推理的时候参与的时间越靠后,同时还会从原图中取得信息进行参与计算和推理。

 看一组图片:

嵌套掩码的消融研究。我们的结果显示了更复杂的内容,与场景融合得更好,且模糊度更低。注意过渡(第一行:墙上的锐利过渡)和位置(第二行:建筑物位于湖中)的差异。每一行的种子是固定的。提示词分别为:“一幅精美的艺术画作”,“一个城市天际线...”。

推理过程的示意图。

顶部:当前时间步骤的原始图像添加噪声。

底部:扩散模型去噪的中间图像。箭头附近的掩码表示从每张图片复制的区域。跟随箭头来识别原始来源对输出图像的影响,并观察其与分解掩码和变化图的相关性。提示是“哥特式绘画”。

 文中提到一种比较重要的技术是“软修复”

没有柔化的修复有时会因为与周围背景在风格和光照上的明显差异而显得不自然地叠加。"软修复"是在完成画面部分的同时轻轻修改周围区域以保证平滑融合的过程。我们扩展了我们的框架以支持软修复,允许用户输入一个二进制掩码和一个标量值来确定过渡的柔和度。我们根据柔和度参数对掩码进行高斯模糊,将其转换成变化图,然后由我们的标准框架处理。与以前的方法相比,我们的方法实现了更优秀的软修复编辑(如上图)。

文中提到第二个必要重要的技术是“强度扇” 

在使用扩散模型编辑图像时,找到保留某些元素和改变其他元素之间的完美平衡可能是一个挑战。通常,选择正确的编辑强度可能并不直观,尤其是因为最佳设置会因输入提示和图像的不同而变化。为了简化这个过程,我们提出了一个名为“强度扇”的新可视化工具。这个扇形是一个修改后的图像,通过将其划分为多个列来创建,每个列都以不同的强度级别进行编辑。这使用户能够同时观察多个强度设置,从而简化了比较和调整编辑强度的任务(见上图)。

论文中提到的,重点就是以上这些了。

那么实际测试效果会如何呢?

🥟实测效果

先搭建一组测试节点。

比较简单,相信学过基础课程的朋友都能自己手动搭出来。

(如果还没学过的可以看下文章最后的链接,感谢大家支持先~~~~~😄) 

提示:一朵玫瑰

提示:粉色的云彩; 

 粉色猫头的瓶盖

金色瓶盖

 在雨林中 (选择了背景)

总体来说,效果还可以,比默认的好,比上次推荐的brushnet,貌似没那么惊艳。

如果有局部重绘的场景,不妨试试看。

好了,记得点赞点关注哦,感谢大家的支持~~~~~ 

✨写在最后

如果对comfyui还不熟悉的话,最近面向ComfyUI的新手,写了一门系统性入门图文课程,现在已经更新完成了,内容主要包括如何下载软件、如何搭建自己的工作流、关键基础节点讲解、遇到报错怎么解决等等,如果大家在学习过程中遇到什么问题,也可以直接对应的文章下留言,会持续更新相关答疑内容哈。欢迎订阅哦~

https://blog.csdn.net/jumengxiaoketang/category_12683612.html

​​​

感谢大家的支持~

这篇关于Differential Diffusion,赋予每个像素它应有的力量,以及在comfyui中的测试效果的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1146817

相关文章

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

防近视护眼台灯什么牌子好?五款防近视效果好的护眼台灯推荐

在家里,灯具是属于离不开的家具,每个大大小小的地方都需要的照亮,所以一盏好灯是必不可少的,每个发挥着作用。而护眼台灯就起了一个保护眼睛,预防近视的作用。可以保护我们在学习,阅读的时候提供一个合适的光线环境,保护我们的眼睛。防近视护眼台灯什么牌子好?那我们怎么选择一个优秀的护眼台灯也是很重要,才能起到最大的护眼效果。下面五款防近视效果好的护眼台灯推荐: 一:六个推荐防近视效果好的护眼台灯的

从0到1,AI我来了- (7)AI应用-ComfyUI-II(进阶)

上篇comfyUI 入门 ,了解了TA是个啥,这篇,我们通过ComfyUI 及其相关Lora 模型,生成一些更惊艳的图片。这篇主要了解这些内容:         1、哪里获取模型?         2、实践如何画一个美女?         3、附录:               1)相关SD(稳定扩散模型的组成部分)               2)模型放置目录(重要)

音视频入门基础:WAV专题(10)——FFmpeg源码中计算WAV音频文件每个packet的pts、dts的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以打印WAV音频文件每个packet(也称为数据包或多媒体包)的信息,这些信息包含该packet的pts、dts: 打印出来的“pts”实际是AVPacket结构体中的成员变量pts,是以AVStream->time_base为单位的显

Verybot之OpenCV应用一:安装与图像采集测试

在Verybot上安装OpenCV是很简单的,只需要执行:         sudo apt-get update         sudo apt-get install libopencv-dev         sudo apt-get install python-opencv         下面就对安装好的OpenCV进行一下测试,编写一个通过USB摄像头采

BIRT 报表的自动化测试

来源:http://www.ibm.com/developerworks/cn/opensource/os-cn-ecl-birttest/如何为 BIRT 报表编写自动化测试用例 BIRT 是一项很受欢迎的报表制作工具,但目前对其的测试还是以人工测试为主。本文介绍了如何对 BIRT 报表进行自动化测试,以及在实际项目中的一些测试实践,从而提高了测试的效率和准确性 -------

Tomcat下载压缩包解压后应有如下文件结构

1、bin:存放启动和关闭Tomcat的命令的路径。 2、conf:存放Tomcat的配置,所有的Tomcat的配置都在该路径下设置。 3、lib:存放Tomcat服务器的核心类库(JAR文件),如果需要扩展Tomcat功能,也可将第三方类库复制到该路径下。 4、logs:这是一个空路径,该路径用于保存Tomcat每次运行后产生的日志。 5、temp:保存Web应用运行过程中生成的临时文件