Stable Diffusion WebUI 生成参数:宽度/高度/生成批次/每批数量/提示词相关性/随机种子

本文主要是介绍Stable Diffusion WebUI 生成参数:宽度/高度/生成批次/每批数量/提示词相关性/随机种子,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。

大家好,我是水滴~~

本文将继续了解 Stable Diffusion WebUI 的生成参数,主要内容有:宽度、高度、生成批次、每批数量、提示词相关性、随机种子。希望能对你有所帮助。

文章目录

  • 宽度(Width)和高度(Height)
  • 生成批次(Batch count)
  • 每批数量(Batch size)
  • 提示词相关性(CFG Scale)
  • 随机种子(Seed)


宽度(Width)和高度(Height)

在 Stable Diffusion WebUI 中,宽度和高度用于定义生成图片的大小,也就是分辨率,单位为像素,默认为:512×512。

在这里插入图片描述

对于 SD1.5,输出在 512×512 像素左右进行优化。常见纵横比的最佳分辨率通常是:

  • 1:1(方形):512×512、768×768
  • 3:2(横向):768×512
  • 2:3(纵向):512×768
  • 4:3(横向):768×576
  • 3:4(纵向):576×768
  • 16:9(宽屏):912×512
  • 9:16(高):512×912

对于 SDXL,输出在 1024x1024 像素左右进行优化。常见纵横比的最佳分辨率通常是:

  • 1:1(方形):1024×1024、768×768
  • 3:2(横向):1152×768
  • 2:3(纵向):768×1152
  • 4:3(横向):1152×864
  • 3:4(纵向):864×1152
  • 16:9(宽屏):1360×768
  • 9:16(高):768×1360

设置宽度和高度的要求是必须是 8 的倍数。如果想要生成更高像素的图片,建议不要直接调高分辨率,而是使用高分辨率修复,或者使用放大器。

生成批次(Batch count)

生成批次指的是每次运行 Stable Diffusion WebUI 生成图像的组数。通过调整生成批次,可以控制生成图片的数量。具体的生成图像数量 = 生成批次 × 每批数量

下图将【生成批次】设为 6,可以看出右侧输出了 6 张图片(第 1 张图片是它们的宫格图):

在这里插入图片描述

注意:这 6 张图不是同时生成的,而是生成完一个再生成下一个,不会增加显存负担。

每批数量(Batch size)

每批数量是指同时生成多少个图像。增加这个值可以提高算法的性能,但也需要更多的显存。

下图将【生成批次】还原为 1,【每批数量】设为 6,可以看出右侧也输出了 6 张图片:

在这里插入图片描述

需要注意的是,较大的每批数量会消耗更多的显存,因此在显存有限的情况下,建议将每批数量保持为较低的值,以避免显存不足的问题。

下图将【生成批次】和【每批数量】都设为 2,可以看出右侧输出了 4 张图片:

在这里插入图片描述

提示词相关性(CFG Scale)

在 Stable Diffusion 中,CFG(Classifier Free Guidance)表示为无分类器信息引导规模。CFG 是控制稳定扩散应遵循文本提示的紧密程度的设置,即提示词相关性。

在这里插入图片描述

理论上,CFG 值越高,它就越严格地遵循您的提示。默认值为 7,它在创作自由度和遵循您的方向之间提供了良好的平衡。值为 1 将使 Stable Diffusion 几乎完全自由,而高于 15 的值则相当受限制。

使用 CFG 来控制 Stable Diffusion 跟随文本提示的紧密程度听起来很简单,但遗憾的是 Stable Diffusion 并不是那么简单。不同的 CFG 值会带来一些权衡。为了演示它们,这里有一个使用 Euler A 采样器和 20 个采样步数的具体示例:

在这里插入图片描述

从这个例子中你可以注意到一些事情:

  • 色彩饱和度随着 CFG 的增加而增加
  • 对比度随着 CFG 的增加而增加
  • 高于某个 CFG 值时,输出图像会变得更加模糊,导致细节丢失

为了抵消较高 CFG 值时输出图像质量的下降,您通常可以执行以下两项操作:

  • 增加采样器步数:一般经验法则是,采样器步数越多,输出图像的细节就越多,尽管与 CFG 一样,该规则仅适用于特定阈值。请记住,更多的采样器步骤通常会导致更长的处理时间。
  • 更改采样器方法:一些采样器是专门为在较低或较高的 CFG 和采样步骤下最佳运行而开发的。例如,UniPC 可以在 CFG 低至 3 时返回良好的结果,但通常会在 CFG 为 10 左右时看到质量下降。另一方面,DPM++ SDE Karras 通常在 CFG 值大于 7 时产生大量图像细节。

为了获得最佳的输出图像,同时最大限度地减少内存和处理时间,用户需要在 CFG、采样器和采样步数之间找到平衡。

随机种子(Seed)

随机种子是用于初始化模型随机性的数字。通过设置种子,您每次都可以获得相同的输出。

在这里插入图片描述

如果您找到喜欢的图像但想要调整它或提高质量,您可以使用相同的种子,然后进行高分辨率修复。

在生成图后,可以点击“绿色循环箭头”图标来使用上次生成的图片的种子;如果想继续随机生成,可以点击“筛子”图标,或直接将随机种子设为 -1。

在这里插入图片描述

注意:如果您有固定的种子但更改图像的宽度、高度、提示词等信息,那么您将不会看到一致的结果。

这篇关于Stable Diffusion WebUI 生成参数:宽度/高度/生成批次/每批数量/提示词相关性/随机种子的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/825677

相关文章

公共筛选组件(二次封装antd)支持代码提示

如果项目是基于antd组件库为基础搭建,可使用此公共筛选组件 使用到的库 npm i antdnpm i lodash-esnpm i @types/lodash-es -D /components/CommonSearch index.tsx import React from 'react';import { Button, Card, Form } from 'antd'

ABAP怎么把传入的参数刷新到内表里面呢?

1.在执行相关的功能操作之前,优先执行这一段代码,把输入的数据更新入内表里面 DATA: lo_guid TYPE REF TO cl_gui_alv_grid.CALL FUNCTION 'GET_GLOBALS_FROM_SLVC_FULLSCR'IMPORTINGe_grid = lo_guid.CALL METHOD lo_guid->check_changed_data.CALL M

android 带与不带logo的二维码生成

该代码基于ZXing项目,这个网上能下载得到。 定义的控件以及属性: public static final int SCAN_CODE = 1;private ImageView iv;private EditText et;private Button qr_btn,add_logo;private Bitmap logo,bitmap,bmp; //logo图标private st

力扣SQL50 每位经理的下属员工数量 join

Problem: 1731. 每位经理的下属员工数量 👨‍🏫 参考题解 Code select m.Employee_id, m.name,count(*) reports_count,round(avg(e.age),0) average_agefrom Employees ejoin Employees mon e.reports_to = m.Employee_id

高度内卷下,企业如何通过VOC(客户之声)做好竞争分析?

VOC,即客户之声,是一种通过收集和分析客户反馈、需求和期望,来洞察市场趋势和竞争对手动态的方法。在高度内卷的市场环境下,VOC不仅能够帮助企业了解客户的真实需求,还能为企业提供宝贵的竞争情报,助力企业在竞争中占据有利地位。 那么,企业该如何通过VOC(客户之声)做好竞争分析呢?深圳天行健企业管理咨询公司解析如下: 首先,要建立完善的VOC收集机制。这包括通过线上渠道(如社交媒体、官网留言

Java面试八股之JVM参数-XX:+UseCompressedOops的作用

JVM参数-XX:+UseCompressedOops的作用 JVM参数-XX:+UseCompressedOops的作用是启用对象指针压缩(Ordinary Object Pointers compression)。这一特性主要应用于64位的Java虚拟机中,目的是为了减少内存使用。在传统的64位系统中,对象引用(即指针)通常占用8字节(64位),而大部分应用程序实际上并不需要如此大的地址空间

两个基因相关性CPTAC蛋白组数据

目录 蛋白数据下载 ①蛋白数据下载 1,TCGA-选择泛癌数据  2,TCGA-TCPA 3,CPTAC(非TCGA) ②蛋白相关性分析 1,数据整理 2,蛋白相关性分析 PCAS在线分析 蛋白数据下载 CPTAC蛋白组学数据库介绍及数据下载分析 – 王进的个人网站 (jingege.wang) ①蛋白数据下载 可以下载泛癌蛋白数据:UCSC Xena (xena

FastAdmin/bootstrapTable 表格中生成的按钮设置成文字

公司有个系统后台框架用的是FastAdmin,后台表格的操作栏按钮只有图标,想要设置成文字。 查资料后发现其实很简单,主需要新增“text”属性即可,如下 buttons: [{name: 'acceptcompany',title: '复核企业',text:'复核企业',classname: 'btn btn-xs btn-primary btn-dialog',icon: 'fa fa-pe

XMG 自动提示宏 #define keyPath(objc,keyPath) @(((void)objc.keyPath,#keyPath));

1. int a=((void)5,4)  C语言逗号表达式默认会取右边的内容 如果不写void的话 a会被报警告,写上void标明请忽略左边的内容 插曲刚才弄得,已经上线的苹果产品如果需要下架的话,点击 价格与销售范围,然后点击下架。这个产品就会在AppStore 中移除。如果想再让改产品重新在Apple store中显示,那么再次让他上线就可以了。但是会有一定的时间延迟 /