Stable Diffusion WebUI 附加功能/图片放大(Extras):单张图片/批量处理/从目录进行批量处理

本文主要是介绍Stable Diffusion WebUI 附加功能/图片放大(Extras):单张图片/批量处理/从目录进行批量处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~

篇文章主要讲解 Stable Diffusion WebUI 的附加功能/图片放大(Extras)的使用,主要包括:单张图片、批量处理、从目录进行批量处理。文章中包含大量的图片和示例,非常适合新手同学,希望对你有所帮助!

文章目录

  • 一、单张图像
    • 1. 来源(Source)
    • 2. 缩放比例(Scale by)
    • 3. 指定分辨率缩放(Scale to)
    • 4. 放大算法1(Upscale 1)
    • 5. 放大算法2(Upscale 2)
    • 6. 面部修复(GFPGAN 和 CodeFormer)
  • 二、批量处理
  • 三、从目录进行批量处理


Stable Diffusion WebUI 的附加功能(Extras)是一个强大的工具,它主要用于优化、清晰化和扩展图像。通过调节Extras中的相关参数,用户可以将小图、模糊的图或有噪点的图放大、清晰化处理为更大的图。这一过程中,不仅原图中的图像信息得以保留,而且由于分辨率的提高,图像内容也会得到进一步的细化和增加。

Extras在 Stable Diffusion WebUI 中的位置通常放在第三个标签,这也代表它往往是 AI 生成图像的第三大步骤。在实际应用中,用户通常首先使用tex2img功能大批量地生成小图(512像素),然后从中筛选出接近满意的结果,接着通过img2img功能进行调整,最后再利用Extras功能生成最终的大图。这一流程已被众多从业者证明为最高效的方法。

image.png
Extras提供三个选项卡:单张图像、批量处理、从目录进行批量处理。我们依次来看下它们的功能,并使用实例来演示:

一、单张图像

单张图像(Single Image)这一选项允许用户一次只处理一张图片。用户可以选择一张需要优化的图片,然后通过Extras中的相关参数进行超分辨率处理、清晰化或其他图像处理操作。当用户只需要处理单张图片,或者想要对每张图片进行个别调整时,可以选择这个功能。

1. 来源(Source)

来源(Source)用于上传待处理的图片。可以点击上传图片;或者将图片拖放至此;还可以从其它地方发送到“附加功能”,例如:文生图、图生图、图库浏览器等界面。
image.png
今天又生成了一批小姐姐,从中选择一个最漂亮的,上传至此:
image.png
本图像分辨率:512 x 768
00079-2506701637.png

2. 缩放比例(Scale by)

缩放比例(Scale by)表示图像放大的倍数,最低1倍,最高8倍,默认4倍:
image.png
例如,下图放大了4倍(2048 x 3072):
00031.png

3. 指定分辨率缩放(Scale to)

指定分辨率缩放(Scale to)表示自定义分辨率。如果自定义的比例与原图不相同,一定要勾选“裁剪”,否则图像将被拉伸变形。
image.png
例如,下图为 512 x 512
00032.png

4. 放大算法1(Upscale 1)

放大算法(Upscaler)是一种用于增强图像分辨率或尺寸的技术。在 Stable Diffusion 中,放大算法旨在将低分辨率的图像无损或尽可能少地损失细节地放大到更高的分辨率。这通常涉及到复杂的数学和机器学习技术,以确保放大后的图像在视觉效果上尽可能接近原始高清图像。
image.png
这些放大算法各有优缺点,我们不过多介绍,对于新手而言,这里只使用两个即可:

  • R-ESRGAN 4x+ Anime6B:绘制二次元漫画风格时使用。
  • R-ESRGAN 4x+:绘制其它风格时使用。
    R-ESRGAN 4x+ 算法放大效果:
    在这里插入图片描述

5. 放大算法2(Upscale 2)

这里还有个放大算法2(Upscale 2),这是因为可以结合两个放大算法来放大图片。后面的“放大算法2可见度”就表示两者使用的占比。可见度为0时,表示使用放大算法1;可见度为0.3时,表示70%使用放大算法1,30%使用放大算法2;可见度为1时,表示使用放大算法2。
image.png

6. 面部修复(GFPGAN 和 CodeFormer)

在附加功能里,还提供了两个面部修复功能 GFPGANCodeFormer。经过我的测试,这两个无法修复畸形脸,只能修复模糊的脸:
image.png
使用一张模糊的照片,下面对比一下他们的修复效果:

  • GFPGAN

image.png

  • CodeFormer

image.png

二、批量处理

批量处理(Batch Process)功能允许用户一次性上传多张图片进行处理。用户可以选择一个包含多张图片的文件夹,然后应用相同的处理参数对所有图片进行批量操作。当用户需要处理大量图片,并且希望所有图片都应用相同的处理效果时,这个功能会非常有用。它大大提高了处理效率,减少了重复操作的时间。

点击上传:
image.png
这里可以选择多个照片:
image.png
点击“生成”按钮后,会逐个放大选中的照片:
image.png

三、从目录进行批量处理

从目录进行批量处理(Batch from Directory)功能允许用户不打开图片,而是直接选择包含图片的目录所在位置,然后处理该目录下的所有图片。用户还可以在设置中选择是否保留原来的文件名,以便在处理后能够方便地识别和管理图片。当用户需要处理整个目录下的图片,并且不希望手动选择每一张图片时,可以使用这个功能。它特别适用于那些有大量图片需要处理的场景,如批量优化图片库或处理项目中的所有图片。

这里需要填写两个目录(路径中不要有中文):输入目录为原图片目录;输出目录为放大后的图片目录,需要提前创建好。
image.png
输入目录,用来存放原图:
image.png
输出目录,用来存放放大后的照片,文件名与原图文件名保持一致:
image.png

这篇关于Stable Diffusion WebUI 附加功能/图片放大(Extras):单张图片/批量处理/从目录进行批量处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/869189

相关文章

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

Spring框架5 - 容器的扩展功能 (ApplicationContext)

private static ApplicationContext applicationContext;static {applicationContext = new ClassPathXmlApplicationContext("bean.xml");} BeanFactory的功能扩展类ApplicationContext进行深度的分析。ApplicationConext与 BeanF

JavaFX应用更新检测功能(在线自动更新方案)

JavaFX开发的桌面应用属于C端,一般来说需要版本检测和自动更新功能,这里记录一下一种版本检测和自动更新的方法。 1. 整体方案 JavaFX.应用版本检测、自动更新主要涉及一下步骤: 读取本地应用版本拉取远程版本并比较两个版本如果需要升级,那么拉取更新历史弹出升级控制窗口用户选择升级时,拉取升级包解压,重启应用用户选择忽略时,本地版本标志为忽略版本用户选择取消时,隐藏升级控制窗口 2.