【Stable Diffusion】入门-04:不同模型分类+代表作品+常用下载网站+使用技巧

本文主要是介绍【Stable Diffusion】入门-04:不同模型分类+代表作品+常用下载网站+使用技巧,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 1 模型简介
  • 2 模型文件构成和加载位置
    • 2.1 存储位置
    • 2.2 加载模型
  • 3 模型下载渠道
    • 3.1 HuggingFace
    • 3.2 Civitai
  • 4 模型分类
    • 4.1 二次元模型
    • 4.2 写实模型
    • 4.3 2.5D模型

1 模型简介

拿图片给模型训练的这个过程,通常被叫做“喂图”。模型学习的内容不仅包括对具体事物的形象描绘,还包括对它们的呈现方式(画风)。如果我们喂给模型的图片都是二次元风格的,那你让它画人画风景,它都会画得像一幅二次元插画;如果喂的图片都是真实世界里的照片,那它生成的图片就是偏真实场景的。
使用不同风格的模型,就能生成不同风格的作品。

2 模型文件构成和加载位置

2.1 存储位置

在Stable Diffusion里,模型被存储在./models/Stable-diffusion/文件夹里,如果下载了新的模型文件,需要复制到该文件下,SD就可以自动加载该模型。模型有固定的称呼,叫做checkpoint,即检查点或者关键点模型,可以理解为游戏中的存档,模型训练到某个关键位置时,就会建立一个关键点来保持已经训练的部分,以后方便回滚和继续训练。

模型通常很大,一般占用37GB,文件名后缀通常是`.ckpt`,我们常把这种GB级别的模型叫做“大模型”。还有一种大模型的后缀是`.safetensors`,占用空间会小一点,通常12GB。SD里这两种模型都可以使用。

2.2 加载模型

如果是在WebUI打开的状态下添加了新模型,需要先点击左上角右边那个刷新按钮,新的模型才能被显示进来,再选择对应的模型即可。
选择模型
需要看命令行里的加载进度,跳出这样的提示才算加载成功:

Reusing loaded model v1-5-pruned.ckpt [e1441589a6] to load v1-5-pruned-emaonly.ckpt [cc6cb27103]
Loading weights [cc6cb27103] from D:\Projects\stable-diffusion-webui\models\Stable-diffusion\v1-5-pruned-emaonly.ckpt
Applying attention optimization: Doggettx… done.
Weights loaded in 4.6s (send model to cpu: 0.8s, load weights from disk: 2.8s, apply weights to model: 0.3s, move model to device: 0.6s).
加载进度

模型加载成功后才能开始生图。

有的UI页面在模型选择栏右边有个VAE的选项,全称叫做变分自编码器,负责将加噪后的数据转换成正常的图像。可以粗略理解成AI作画的一种“调色滤镜”,最直观地影响画面的色彩质感。目前大部分新的模型已经把VAE整合进大模型文件里了,少数会没有整合的会推荐使用特定的VAE,使得生成的图片质感更好。VAE文件的放置路径是同models文件下的VAE文件夹里./models/VAE/。可以将VAE模型的文件名修改成和对应大模型一样的名字,再在VAE选项里选择“自动”,这样就可以针对不同模型自动切换VAE。我们使用的UI没有VAE选项,故不做展开介绍。

3 模型下载渠道

市面上大多数SD使用者用来作图的模型,都是由个人训练并发布的,俗称“私炉模型”。大家会把训练AI学习图片生成模型这件事叫做“炼丹”,炼丹有一定的技术门槛和硬件需求,因此只有拥有一口好的“炼丹炉”才能成为炼丹师。由于版权问题,官方的炉在学习的素材来源和尺度上都有着比较大的约束,所以利用私炉作画出图时目前的主流趋势,但它的版权确实会存在争议。

目前AI绘画主流的模型下载网站有两个:Huggingface和Civitai。

3.1 HuggingFace

HuggingFace,俗称抱脸。它是一个允许用户共享AI学习模型和数据集的平台,包含的内容非常广:AI绘画和其他AI领域的内容。
Huggingface

  1. 在最上方的搜索栏里输入Stable Diffusion,可以直接下载发布的历代官方模型。
    sd官方模型

  2. 在左边的工具栏里,点亮Text-to-Image标签,就能筛选出其他用户发布的主要被用于AI作画的问生图模型了,包括许多老牌知名模型:WaifuDiffusion、Anything、DreamShaper等。
    文生图模型

  3. 选择其中一个点进去,会有一个“Model Card”,相当于这个模型的介绍页面;
    model card

  4. 切换到第二个标签“Files and versions”,制作者们会把文件、源代码等文件放到不同的文件夹里。
    Files

  5. 到对应的文件夹里寻找需要的文件,点击就可以下载。
    下载模型

  6. 切换到“Community”,可以进入对这个模型感兴趣的使用者们的交流区,如果有什么建议,或者遇到什么bug,可以到交流区里看看是否有解决方式,或者点击左边的PR & discussions documentation发起讨论。
    交流区

市面上一些知名的模型,都可以来Huggingface搜一下看看。

3.2 Civitai

Civitai,俗称C站,是一个AI绘画模型的分享平台,里面各种模型的展示是非常图像化和具体化的。在C站上访问和下载模型均不需要注册。
Civitai

  1. 点击“Models”进入模型页面,点击右上方模型排序选项,选择“Highest Rate”或者“Most Downloaded”,就可以看到目前最火热的一系列AI绘画模型了。
    排序
  2. 可以对这些模型进一步细分筛选:
    – 基于模型类型,点击右上角小漏斗按钮,可以根据不同选项对模型进行筛选。
    筛选
    – 基于特定内容类型,页面上方有一系列标签,代表着不同的风格类目和内容方向,例如:动画、角色设计、女性、名人、插画、卡通、男性、自然景观等。
    内容类型
  3. 选择其中一个模组,进入后右边是下载按钮,如果有不同的版本,可以到下面的Files选择下载哪个。页面底下的模组介绍,相当于Huggingface里的Model Card,最好在作图前仔细阅读一遍,作者会从很多方面指导你如何使用该模型,例如:适合的风格、关键词、分辨率以及VAE,点击其中的链接都可以直接跳转下载。

下载页面

  1. C站作为模型分享网站,不仅仅分享模型,还分享用这些模型做出来的作品。模型页面的正上方,都有一系列作者使用这个模型生成的例图,点击图片右下方的信息按钮,就会跳出对应的提示词、采样方法、随机种子等等详细的参数。如果你要抄作业,那这就是一份参考答案,可以给你产出最接近模型作者理想中的效果。

作图信息

  1. 再往下翻,可以看到C站上其他用户上传的基于这个模型产出的图片,里面大部分都会同样附上提示词和参数。
    图库

  2. C站的首页还有一系列页面,例如:“Image”页面,点进去,可以欣赏到那些高赞好评的AI绘画作品,并找到它们对应的使用模型和提示词、参数。其他的页面也是一些高赞的作品。

图片网页

4 模型分类

下面介绍几种不同类型模型对应的代表模型和搜索关键词,也可以使用这些搜索关键词在Prompt中激活模型风格特性。

4.1 二次元模型

偏漫画、插画风格的,具有鲜明的绘画笔触质感,代表作:Anything、Counterfeit、Dreamlike Diffusion等。
搜索标签与风格关键词:illustration, painting, sketch, drawing, comic, anime, cartoon.

4.2 写实模型

偏真实系、拟真化程度高的、对现实世界还原强,代表作:Deliberate、Realistic Vision、LOFI等。
搜索标签与风格关键词:photography, photo, realistic, photorealistic, RAW photo.

4.3 2.5D模型

介于二次元和写实模型之间,还原出来的质感效果类似于一些建模软件里能制作出来的三维渲染图,接近目前一些游戏和3D动画的风格,代表作:NeverEnding Dream、Protogen、国风V3等。
搜索标签与风格关键词:3D, render, chibi, digital art, concept art, {realistic}.

这篇关于【Stable Diffusion】入门-04:不同模型分类+代表作品+常用下载网站+使用技巧的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/817893

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

JS常用组件收集

收集了一些平时遇到的前端比较优秀的组件,方便以后开发的时候查找!!! 函数工具: Lodash 页面固定: stickUp、jQuery.Pin 轮播: unslider、swiper 开关: switch 复选框: icheck 气泡: grumble 隐藏元素: Headroom

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

Hadoop数据压缩使用介绍

一、压缩原则 (1)运算密集型的Job,少用压缩 (2)IO密集型的Job,多用压缩 二、压缩算法比较 三、压缩位置选择 四、压缩参数配置 1)为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器 2)要在Hadoop中启用压缩,可以配置如下参数

Makefile简明使用教程

文章目录 规则makefile文件的基本语法:加在命令前的特殊符号:.PHONY伪目标: Makefilev1 直观写法v2 加上中间过程v3 伪目标v4 变量 make 选项-f-n-C Make 是一种流行的构建工具,常用于将源代码转换成可执行文件或者其他形式的输出文件(如库文件、文档等)。Make 可以自动化地执行编译、链接等一系列操作。 规则 makefile文件