超强生图模型，抢先体验！

本文主要是介绍超强生图模型，抢先体验！，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

文生图模型Stable Diffusion 3 Medium开源啦！优刻得GPU云主机目前已上线该模型镜像，开箱即用，即刻体验！具体操作见文末。

近年来，生成式人工智能的快速发展正在改变我们的生活。作为这一领域的前沿技术之一，Stable Diffusion 模型以其强大的生成能力和广泛的应用前景，吸引了无数开发者和企业的关注。

Stable Diffusion 3（以下简写为SD3）作为最新一代的代表性模型，使用了在Diffusion Transformer（“DiT”，Peebles & Xie，2023）的基础之上改进的多模态扩散Transformer（MMDiT）架构，同时考虑到文生图场景下文本和图像两部分，生成效果更佳。

与其他文生图模型相比，该模型具有以下几大独特优势：

1. 生成质量与细节表现

a.高分辨率图像生成：系列模型参数最高可达8B，使得其在生成高分辨率图像方面表现出色，能够生成清晰、细节丰富的高质量效果的图像

b.精细的细节处理：通过改进后模型架构，SD3 在细节处理上更为精细，无论是人物面部特征还是自然景观的纹理，均表现得更加逼真和生动

c. 增强生图质量：SD3 架构具体使用了三种不同的文本嵌入模型(两种CLIP模型和T5)来编码文本表征，帮助其在面对复杂的输入描述时，能够更好地理解和解析文本信息，生成符合使用者预期的图像，减少了不准确或偏差较大的生成结果

2. 计算效率与资源利用

a.高效的计算性能：SD3 模型优化了计算过程，提升了生成速度。这意味着在相同的资源情况下，SD3 能够更快地生成图像，显著提升了使用效率

b.资源友好型架构：SD3 模型系列，提供了8亿到80亿参数版本，无论是在企业级还是消费级显卡都能实现高质量的图片生成，大大降低了其使用门槛

(MMDiT architecture outperforms established text-to-image backbones such as UViT (Hoogeboom et al, 2023) and DiT (Peebles & Xie, 2023), when measuring visual fidelity and text alignment over the course of training.)

如果您也想体验本次开源的SD3 Medium模型，按照以下步骤即可一键开箱：

1.登录UCloud控制台：https://console.ucloud.cn/uhost/uhost/gpu_create

2.选择GPU云主机和模型镜像并创建：在镜像市场选择镜像，搜索Stable Diffusion3 Medium

3.等待几分钟后访问http://{云主机EIP}:8188: 若访问不通需要更换 云主机防火墙放行8188端口

4.随即开始您的创作吧

参考登录页面：