用AI绘画-Stable Diffusion稳定生成指定人物的2-3人场景图,制作小说配图从未如此轻松!

本文主要是介绍用AI绘画-Stable Diffusion稳定生成指定人物的2-3人场景图,制作小说配图从未如此轻松!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大家好,我是设计师阿威

最近,尝试在写故事,然后用sd配图。其中,单人场景很容易生成。

但是多人场景的话,很难稳定生成满意的图像。

今天就教大家一招,用additional networks + controlnet openpose,可以稳定生成2-3人的场景,也分享给大家。

下面以一个双人场景为例

1.安装插件和模型

(1)下载安装好sd插件,additional network。地址:https://github.com/kohya-ss/sd-webui-additional-networks。
(注意:如无法下载,请扫描获取插件安装包哦)

(2)下载安装好sd插件,controlnet 和 Openpose引导模型。
(注意:如无法下载,请扫描获取插件安装包哦)

2.找到你想生成的双人场景真人图,方便 openpose识别人体姿态,比如下面这张图。

3.设置openpose

点击enable启用,pixel pefect,allow preview;

预处理器选择openpose,模型选择openpose,(如果模型这里没有openpose,则记得下载openpose引导模型并放在SD的extensions\sd-webui-controlnet\models文件夹里面后,点击模型右侧的刷新按钮)

Control weight 权重这里设置0.8,让ai控制的姿势更自然一些。

点击预处理器右侧的爆炸图标,就能看到骨架预览图,如果识别出来的骨架图觉得不太满意,需要微调也可以用openpose editor工具对骨架识别并微调动作之后,再放进来controlnet使用。

4.设置additional networks

(1)把你想使用的lora模型,放入SD的extensions\sd-webui-additional-networks\models\lora里面。

(2)启用附加网络,并在下方选择你想要用的lora模型,并分别设置权重为0.8.

(3)接下来就是重点了,展开额外参数extra args

上传一张用ps或者之类的工具制作的人物色块png图片。(除了色块之外,全部背景需要是透明的。)

颜色需要是标准的rgb颜色的红绿黄。

抠图就直接用快速选择工具或者之类的抠图工具,把人物抠出来,再用油漆桶工具填充纯色,再把图片导出成png即可。

5.设置提示词等基本参数

提示词我是随便写的,因为就要一个男生一个女生出现在图像里,其他的就懒得写了,你如果对背景有要求可以加一些更丰富更细致的提示词。

采样器:dpm+2m sde karras

迭代步数step适度调高到25-30

图像尺寸比例参考你原来的底图,避免被压缩裁剪或拉伸变形。然后开始生成。

提醒一下,

如果你的小黑窗出现了报错,那么大概率additional networks出现了问题,虽然画面会出现两个人一男一女没问题,位置姿势也没问题,但你的lora未生效,要指定人物就完全无法做到。

类似下面这种报错。

报错的话,需要重新安装最新的additional networks再试。

而如果类似下面这种,没有lora报错,并且显示了应用蒙版通道apply mask channel,那么代表你这种用不同的lora控制不同的人物是成功且生效的。

6.你会发现生成的男女主基本都是稳定的形象,可以用lora很好控制人物形象和特征,保持人物的统一性,同时生成多人图像也不容易崩。

比如随着剧情推进,女主找上了前男友。(女主不变换男主)

男主一怒之下,找了个小三。(男主不变换女主)

啊这,有点狗血。(没办法,狗血的剧情才有更多人喜欢看)

7.接着,我们再回来教程这里,如果说,两人场景控制人物形象和面容能比较容易实现,那么三人场景能否做到呢?答案是可以的。

比如我们祭出这张李寻欢同学的名场面图片。

同样用上面的处理方式一步一步来生成。

然后我们可以得到这样的图。

如果你喜欢大女主,不想让臭男人左拥右抱,那么可不可以呢?可以。

但是三个人的控制程度比两个人的控制更难一些,很难指定某个人物用特定某个lora,还需要多生成一些图像来抽卡,才能得到相对满意的图像。

但至少,比之前生成2-3人的图像,相对来说已经可控高了不少。

不管你用来做小说配图还是插画什么的,都方便很多。

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

这篇关于用AI绘画-Stable Diffusion稳定生成指定人物的2-3人场景图,制作小说配图从未如此轻松!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1075064

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

android 带与不带logo的二维码生成

该代码基于ZXing项目,这个网上能下载得到。 定义的控件以及属性: public static final int SCAN_CODE = 1;private ImageView iv;private EditText et;private Button qr_btn,add_logo;private Bitmap logo,bitmap,bmp; //logo图标private st

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

SQL Server中,用Restore DataBase把数据库还原到指定的路径

restore database 数据库名 from disk='备份文件路径' with move '数据库文件名' to '数据库文件放置路径', move '日志文件名' to '日志文件存放置路径' Go 如: restore database EaseWe from disk='H:\EaseWe.bak' with move 'Ease

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应

基于 Java 实现的智能客服聊天工具模拟场景

服务端代码 import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintWriter;import java.net.ServerSocket;import java.net.Socket;public class Serv