NoveAI本地环境搭建、AI作画

2023-10-20 14:40

本文主要是介绍NoveAI本地环境搭建、AI作画,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

鉴于按照别人的教程安装过程中遇到各种问题,极其痛苦,所以还是自己也整理总结一份.

1 diffusion vs GAN

所谓扩散算法diffusion是指先将一幅画面逐步加入噪点,一直到整个画面都变成白噪声。记录这个过程,然后逆转过来给AI学习。

AI看到的是什么?一个全是噪点的画面如何一点点变清晰直到变成一幅画,AI通过学习这个逐步去噪点的过程来学会作画。

diffusion和之前大火的GAN模型相比,有什么优势呢?用OpenAI的一篇论文内容来讲,用diffusion生成的图像质量明显优于GAN模型;而且与GAN不同,diffusion不用在鞍点问题上纠结——涉及稳定性问题,只需要去最小化一个标准的凸交叉熵损失即可,这样就大大简化了模型训练过程中,数据处理的难度。

总结来说,目前的训练技术让diffusion直接跨越了GAN领域调模型的阶段,而是直接可以用来做下游任务,是一个新的数学范式在图像领域应用的实例。

2 NovelAI

NovelAI是基于人工智能的绘画创作辅助工具,单纯训练就使用了数千个网站的数十亿张图片。NovelAI是一个商业化的网站,绘画是需要付费的,然而这次其商业模型疑似流出,不管是小白还是画师都能体验一次AI创作的乐趣。这次流出的模型是stable-diffusion-webui。
在这里插入图片描述

3 AI绘画环境搭建

安装Anaconda

进入Anaconda官网https://www.anaconda.com/products/distribution选择相应的操作系统,本文主要介绍在Windows下的安装流程
在这里插入图片描述
下载好之后,运行安装程序,一直点同意或者下一步即可(在选择安装路径时,可以自己更改路径);
安装完成之后,需要配置环境变量
依次点击我的电脑->右键属性->点击高级系统设置->点击环境变量,之后按下图所示配置用户变量
在这里插入图片描述
保存环境变量之后,打开CMD,输入

conda --version

如果输出版本号则说明安装成功,如下所示。

在这里插入图片描述
切换到想要保存项目的目录下,比如:D盘
运行D:即可

下载模型stable-diffusion-webui

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

创建Python3.10的虚拟环境

conda create -n ai_draw python=3.10

进入虚拟环境

conda activate ai_draw

在虚拟环境中安装pytorch

按照该文章中的步骤先安装cuda 和cuDNN,到步骤2.3即可。(我的电脑cuda驱动是11.4,但是我安装的是11.3.一开始安装11.4的,后面一直出问题,后来又重装的11.3)
https://blog.csdn.net/FRIGIDWINTER/article/details/127466470
然后到https://pytorch.org/get-started/locally/选择pytorch版本
我的电脑装得cuda是11.3的,所以这里也选择了CUDA11.3.package选择Pip(这里一开始选的conda,但是使用conda装的PYTORCH一直都是CPU版本,后续还会各种报错,程序无法执行).
在这里插入图片描述
选择好设置之后,把command命令复制粘贴到终端中(此时是在ai_draw的虚拟环境中),等待安装完成。

接着进入stable-diffusion-webui文件夹(是文件目录,不是在终端),找到requirements.txt文件,basicar后加上"==1.3.5",numpy后面加上“==1.22.1”(如果不加的话,默认下载最新版本,运行时报错)。保存。
然后回到终端,运行

cd stable-diffusion-webui

进入到stable-diffusion-webui根目录。
再运行

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

下载模型和权重文件

模型文件:model.cpkt

可通过vpn外网下载https://link.csdn.net/?target=https%3A%2F%2Fcloudflare-ipfs.com%2Fipfs%2Fbafybeicpamreyp2bsocyk3hpxr7ixb2g2rnrequub3j2ahrkdxbvfbvjc4%2Fmodel.ckpt
也可在百度网盘下载(下载后讲里面的两个压缩文件解压,还放在Stable-diffusion文件夹中就行)
链接:https://pan.baidu.com/s/1eQ-89r4efw26beoM0UTY1A?pwd=tkqb
提取码:tkqb

权重文件GFPGANv1.4.pth

无需VPN即可下载https://link.csdn.net/?target=https%3A%2F%2Fgithub.com%2FTencentARC%2FGFPGAN%2Freleases%2Fdownload%2Fv1.3.0%2FGFPGANv1.4.pth
模型文件移动到目录stable-diffusion-webui-master\models\Stable-diffusion,权重文件留在根目录即可
在这里插入图片描述
在这里插入图片描述
根目录运行启动文件

python launch.py

4 体验AI创作

通过第三节的配置,成功后即可在终端看到
在这里插入图片描述
复制红框中的链接,在浏览器中打开即可。
测试最简单的文本生成图像功能:
输入正面标签:

NSFW,anime fine details portrait of a white haired girl ,black eyes,wearing hoodie on the city street background, close-up view, anime masterpiece,4k, sharp high quality anime, artstation Prhololive, uruha_rushia, 1girl, bangs, bare shoulders, red eyes, blue dress, blue green hair,blue sleeves, blush, bow, breasts, chick, collarbone, detached collar, detached sleeves, double bun, eyebrows visible through hair,frills, hair orhament, medium hair, off-shoulder dress 1girl looking_at_viewer upper_body, too many flowers,kyoto animation, bishojo, bare_shoulders black sleeves yellow_eyes emeraldblue_hair, sailor_collar and neckerchief, detached_sleeves frilled_shirt_collar frills grey_shirt headset heart long_hairsleeveless shirt twintails verv long hair wide sleeves highres 2girl, two bishojo snuggled up selfie, with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing a school uniform,golden hour lighting, strong rim light, intense shadowse , Ernst Thoms

输入反面标签:

lowres, bad anatomy, bad hands, text,error, missing fngers,extra digt ,fewer digits,cropped, wort quality ,low quality,normal quality, jpeg artifacts,signature,watermark, username, blurry, bad feet

点击generate等待生成图片

这篇关于NoveAI本地环境搭建、AI作画的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/247762

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

搭建Kafka+zookeeper集群调度

前言 硬件环境 172.18.0.5        kafkazk1        Kafka+zookeeper                Kafka Broker集群 172.18.0.6        kafkazk2        Kafka+zookeeper                Kafka Broker集群 172.18.0.7        kafkazk3

安装nodejs环境

本文介绍了如何通过nvm(NodeVersionManager)安装和管理Node.js及npm的不同版本,包括下载安装脚本、检查版本并安装特定版本的方法。 1、安装nvm curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.0/install.sh | bash 2、查看nvm版本 nvm --version 3、安装

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/