AI绘画入门指南!一遍就会!AI绘画Stable Diffusion新手入门教程

2024-06-06 06:52

本文主要是介绍AI绘画入门指南!一遍就会!AI绘画Stable Diffusion新手入门教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 我们尝试了一段时间Midjourney,发现其对图片的可控性较弱。于是研究起了Stable Diffusion。

SD的主要优势在于开源,因为开源会有很多无私的大佬分享自己的模型、插件及脚本等,让SD有了更丰富的扩展。在画面统一性和更像本人方面要比MJ容易实现。而缺点就是入门不太容易,不但需要好的显卡这种硬件需要,还需要借助不同的模型来实现不同的风格,需要学习的东西也比较多。

但今天我们毫无保留的给大家揭晓!

如何去部署和安装stable diffusion。

包括在安装之后,如何去汉化我们的stable diffusion,先看结果:

图片

我们会将stable diffusion 部署在谷歌的服务器上 那这么做的原因主要有四点。

第一点,stable diffusion对这个硬件的要求相对较高,他需要一张比较好的显卡和一个比较大的显存,才能在跑图片的时候,给我们更好的体验。所以说如果安装到本地的话,可能很多小伙伴的电脑,跑起来会非常的吃力。

第二点,stable diffusion在本地的部署相对比较复杂。首先,他对这个苹果系统的兼容就不是很好,然后在windows下,我们还需要设置这个Python的环境才能跑。我们在服务器上部署,有一键安装包,相对来说是比较方便的。其实本地他也有这个一键安装包,但是整个一套stable diffusion部署下来,大概要占到10个多g的空间。那我们这10个多g的空间自己留着,他不香吗,对不对?所以我们决定还是把它扔在服务器上。

第三点,就是我们将stable diffusion 部署在服务器上之后,我们就可以在任何的地方访问我们的stable diffusion。这样可能也会更加方便一些。

最后一点,也是最关键的一点就是免费,大家不要一听这个服务器什么的,就可能要付费。我们这个谷歌的服务器其实是免费的!当然大家如果对这个作图有一些专业的需求的话,还是需要对这个服务器进行一些升级。但是,这是在大家掌握了这个基础之后的事情,而且这个服务器的升级其实也非常的便宜。相比下我们买一张显卡可能就需要大几千(NVIDIA RTX4090 24G 目前某东上16999左右),那你有着大几千你拿来我帮你保管,不好吗?好啦,闲话少说,先来学习。

那好,我现在先来说一下我们的准备工作。

第一点,你需要一个顺畅的网络环境,我们会用到谷歌的一些相关服务,相信用过Midjourney的同学,这点已经满足了。

第二点,我们需要一个谷歌账号,还没有谷歌账号的话,可以去谷歌注册一个账号。无论你是否使用大陆手机号,都是可以注册成功。

满足了这两点要求的话,我们就可以开始了!

首先我们进入这个谷歌的主页,在我们头像的左边,有一个谷歌应用的按钮。我们点击一下,然后在它弹出来这个小页面中选择这个云端硬盘

图片

如果你是第一次进入这个云端硬盘,它会有一个欢迎的说明文件,大概在这个页面的中间位置你只需要点下一步就可以, 或者直接关掉它也可以。每一个账号谷歌会给到我们15G的使用空间,这个空间对于我们安装stable diffusion 的程序是完全够的。

图片

01、Stable Diffusion一键安装包的安装

我们开始stable diffusion 的一键安装,进到我们stable Diffusion一键安装包主页,看到这个程序的说明,这里有一个表格,然后这个表格里有3个链接,我们先点击第一个,右键单击在新建标签中打开链接。

图片

然后,我们的浏览器就会新开一个页面,这个页面就是我们的安装程序。我们现在直接点击这个左上角的箭头

安装也可以。但是为了方便我们后期的使用,我们还是先备份一下。我们先点击一下这个上方的 “复制到云端硬盘”。

图片

可以看到他已经在提示,创建副本了。我们稍微等一下,好大概等个这么两三秒吧,他的副本就创建完成了!然后这个页面就会跳转。跳转到我当前的这个页面 如果大家看到上面显示的是什么什么的副本的话 就说明已经备份成功了

图片

图片

我们可以返回我们的云端硬盘看一下 ,可以看到多了一个Install的副本。

图片

我们继续,我们回到这个副本的安装页面。点击这个左上角的运行按钮。

图片

我们继续,我们回到这个副本的安装页面。点击这个左上角的运行按钮。

图片

图片

我们在等待几秒之后,谷歌会跳出一个对话框,向我们请求访问Google硬盘的权限。

图片

图片

然后我们在这个窗口里,选择我们的账号。

图片

在选择账号之后,我们拖到最底下点击这个允许。

图片

那个小窗口就自动关闭了,然后可以看到,现在代码已经开始运行了。我们需要稍微等待一下。我们拖动这个浏览条,拖到页面的最底端 ,我们可以看到脚本已经开始,自动运行了。我们就大概等一个7到8分钟的时间,我们等待这个程序自动的部署完成。因为这是我们的第一次部署 ,他需要下载很多东西,所以这一次部署的时间相对会比较长。在后期我们使用的过程中,是用不了这么长时间的。

图片

另外由于我们现在使用的是这个谷歌的免费账户,所以谷歌对我们这个资源,其实是有一定限制的,如果大家在部署过程中出现失败的情况,可能是因为咱们当下使用的(时间)节点 ,这个资源比较紧缺。我们可以尝试换一个时间,再重新部署一遍。因为这个一键安装的脚本,它本身是没有问题的。如果安装的时候出现了报错 ,那一定是谷歌服务器这边的资源出现了问题 所以我们只需要换一个时间再试一下就可以了。大家可以看到我们这一次的部署用了16分52秒,他已经把这个程序跑完了

图片

我们一定要看到这个绿色的对勾 和这个安装完成的提示 之后再进行下一步的操作。

安装完成之后,大家可以看到,这个使用量已经达到了7.57 GB 然后在我们的云端硬盘里,也多出来了stable diffusion的文件夹。

图片

我们可以打开看一下,就是一些stable diffusion的安装文件我们在这里先不详细的讲解这些文件夹的作用。

图片

我们还是先返回我们的安装步骤,先把安装完成。我们还是找到这个表格,刚才我们点击的是这个第一个链接,现在我们点击这个第二个,还是右键,然后在新建标签中打开。

图片

我们的页面打开之后,我们还是先备份一下,点击这个复制到云端硬盘。在副本创建完成之后,我们还是可以看到 这个显示的是什么什么的副本。

图片

然后这一步的操作,是我们需要用到GPU的。所以我们首先要点击这个上方的修改。

图片

然后找到这个笔记本设置。

图片

然后点进来之后,我们一定要确认,这个当下的硬件加速器是这个GPU,然后我们选择保存。

图片

在确认这一步没有问题之后,我们还是点击这个左上角的运行按钮。我们可以看到,在右上角,这个谷歌又在为我们分配资源。

图片

我们稍微等待一下,在资源分配完成之后,他又会弹出这个请求权限的对话框,我们还是点击连接到谷歌云端硬盘。

图片

然后我们在跳出的窗口中,还是选择我们的账号。

图片

接下来还是拉到最下面然后选择允许。

图片

可以看到我们在选择允许之后,这个程序也开始运作了,我们还是拉到最下面来看一下 好可以看到他已经开始部署了!

图片

这个也需要一定的时间 我们需要等待一下,我们在等待了7分钟之后,我们终于看到了stable diffusion 访问地址。然后这里需要注意的是,虽然我们左上角这个圆圈圈还在转,但是当我们看到这个public web UI的网址之后。实际上这个程序就已经可以使用了。

图片

然后我们现在就来单击这个网址,访问一下我们的stable diffusion 可能我们在第一次访问这个网址的时候会比较慢,我们稍微等待一下,大概再等个三五秒 他这个页面就加载出来了!我们现在看到的就是我们大名鼎鼎的stable diffusion!

图片

其实我们在完成这一步之后,我们就可以在stable diffusion里面作画, 我们现在简单的演示一下。比如我在这里输入一个描述:

Chinese child riding an Cats evil spirit,Cats are 5 times bigger than

humans, wonderful moments, graphic tension, eerie color scheme, high

saturation, third person, random perspective, water marsh by Katsuya

Terada, Chen Uen

也可以简答点输入个a boy 或者 a gril。

我们点击这个右边的按钮,可以看到stable diffusion已经开始运行了,与此同时,我们返回我们的服务器,也可以看到它的运算过程,所以它这个程序的左上角呢,一直是这个转圈圈的状态。我们返回stable diffusion看一下 我们可以看到这张图已经画出来了。

图片

虽然说它这个图很丑。是因为我们现在 没有加载其他模型的原因 但是呢我们现在stable diffusion 是已经可以开始使用了!

2、stable diffusion的汉化

接下来,我们来看一下stable diffusion的汉化。汉化其实有两个方法,最简单的方法就是我们点击这个谷歌浏览器右键翻译。

图片

点击翻译可以看到翻译就已经完成了

图片

这是我们汉化的一种方法。我们还有另一种方法是安装语言包,相比这个外挂翻译的话,语言包可能会更加准确一些。

我们看到这里有一个extension的选项,我们点击这个extension。

图片

进来之后,我们选择这个上方的install from URL,然后我们点击一下

图片

当显示这个页面之后,然后我们直接复制语言包网址的地址,右键把这个地址粘贴进去。

图片

我们点击这个上面的Installed的按钮,看到上图的提升就说明安装完成。重启一下我们的UI就可以看到。

图片

当我们点击了这个重启之后,他就会显示这个无法访问页面,我们这个刷新也是没有用的 但是这个是很正常的大家不要着急,我们先把这个页面关掉,我们返回我们这个云端硬盘,可以看到他现在是一个执行的状态我们稍微等待一下 好现在他又执行完毕了,这个网址又被我们刷出来了。

图片

当我们点击了这个重启之后,他就会显示这个无法访问页面,我们这个刷新也是没有用的 但是这个是很正常的大家不要着急,我们先把这个页面关掉,我们返回我们这个云端硬盘,可以看到他现在是一个执行的状态我们稍微等待一下 好现在他又执行完毕了 这个网址又被我们刷出来了。

图片

图片

打开页面发现还是英文:

图片

虽然我们刚才安装了这个语言包,但是它的语言还是没有变,这是因为我们还没有做设置。我们需要点击这个右上角的setting,也就是设置,然后我们在左边找到这个 user interface的按钮, 我们点击一下。

图片

在进来之后,我们看到页面最下方的最后一个选项,然后我们点击一下,然后我们选择这个Chinese-English 0512。

图片

选择完成之后,我们返回最上面,点击这个应用设定。

图片

我们看到这条提示之后,我们再点击右边的按钮重启一下,然后我们就会发现,我们的页面又不能用了

图片

图片

然后我们还是稍微等待一下,其实他已经在服务器开始运行了,这个阶段可能要等这么两三分钟。大家一定要有耐心,大家如果看到这个程序没有动的话,大家也不要动。这个东西敌不动我不动。我们就多给他一点时间让他自己去跑,我大概等了有1分多钟吧。他这个程序就又被我跑出一条网址。我们看到这条网址的时候,就说明已经可以访问了。

图片

我们再访问看一下,汉化成功, 因为前面选的是包含英文的,所以会有部分英文。

图片

实际上这个网站打开的速度还是很慢,主要受两个因素影响:

第一,就是我们首次打开这个网址的时候 可能会访问慢一点

第二,就是可能,跟这个当前服务器的资源也有关系。页面已经加载出来了。而且我们也看到,这个语言已经为我们设置成了左边是中文,右边是英文。如果大家觉得这个页面的排版,比较别扭的话。我们可以按住键盘上的Ctrl 然后滚动这个鼠标的滚轮,把它缩放一下,可以看到我大概缩放到 80%的时候这个页面基本上正常了

图片

这个是因为他这个中英文的字符太长了,所以他在风格上把这个表格顶爆了,我们只要缩放一下就可以解决,但是不管缩放不缩放,这个都不会影响我们对 stable diffusion(功能上)的使用。

总结

好了新手入门这一期。我们讲了一下如何在云端去部署stable diffusion 以及在我们部署好之后,如何去做一个汉化。

除此之外我还准备了很多stablediffusion视频教学和精品AIGC的PDF资料,这份完整版的AIGC资料我已经打包好,需要的点击下方二维码,即可前往免费领取!

需要的点击下方二维码,即可前往免费领取!

这篇关于AI绘画入门指南!一遍就会!AI绘画Stable Diffusion新手入门教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1035391

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

数论入门整理(updating)

一、gcd lcm 基础中的基础,一般用来处理计算第一步什么的,分数化简之类。 LL gcd(LL a, LL b) { return b ? gcd(b, a % b) : a; } <pre name="code" class="cpp">LL lcm(LL a, LL b){LL c = gcd(a, b);return a / c * b;} 例题:

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学