Stable diffusion 3 正式开源

2024-06-14 06:36
文章标签 stable diffusion 开源 正式

本文主要是介绍Stable diffusion 3 正式开源,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

6月12日晚,著名开源大模型平台Stability AI正式开源了,文生图片模型Stable Diffusion 3 Medium(以下简称“SD3-M”)权重。

 SD3-M有20亿参数,平均生成图片时间在2—10秒左右推理效率非常高,同时对硬件的需求比同类型也低,这是一款适合PC、手机、平板的大模型。

此外,SD3-M还与英伟达、AMD合作,特地针对RTX GPU 、TensorRT和最新CPU、MI-300X进行了优化,性能最高可提升50%。

开源地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium

免费在线试用:https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

根据Stability AI的介绍,SD3-M使用的是多模态扩散变换器 (MMDiT)架构,生成的图片质量、排版、复杂文本提示/语义理解和资源效率方面的性能得到了极大提高。

训练数据集方面,SD3-M使用了包含10亿张图片的公开和合成数据进行了预训练,同时针对特定艺术风格和领域,使用了3000万张图片进行了微调以及300万张偏好图片。

所以,SD3-M对用户的文本提示理解和嵌入图片文字的效果将比前两代更好。根据在线demo,为大家展示一下SD3-M的生成效果。

高耸的摩天大楼、飞驰的汽车和充满活力的全息广告构成的未来主义城市景观

图片

日落时宁静的海滩景色,金色的沙滩,温柔的海浪,一对夫妇手牵手散步

图片

郁郁葱葱的热带雨林,茂密的树叶,五颜六色的鸟类,背景是瀑布。

图片

一家20世纪50年代的老式餐厅,配有棋盘地板、红色乙烯基展位和播放经典摇滚乐的自动点唱机。

图片

一个异想天开的幻想世界,漂浮的岛屿,雄伟的龙在天空中飞翔,下面是迷人的森林。

图片

一个时尚现代的厨房,配有不锈钢器具、大理石台面和一扇俯瞰花园的大窗户。

图片

以上只是部分案例,有兴趣的小伙伴可以通过在线demo免费无限生成。目前SD3-M只能用于学术研究无法商业化。如果想商用需要联系Stability AI进行商业授权。

本文素材来源SD3-M官网,如有侵权请联系删除

END

图片

图片

这篇关于Stable diffusion 3 正式开源的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1059643

相关文章

探索Elastic Search:强大的开源搜索引擎,详解及使用

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选,相信大家多多少少的都听说过它。它可以快速地储存、搜索和分析海量数据。就连维基百科、Stack Overflow、

示例:推荐一个基于第三方开源控件库DataGridFilter封装的FilterColumnDataGrid,可以像Excel拥有列头筛选器

一、目的:基于第三方开源控件库DataGridFilter封装的FilterColumnDataGrid,可以像Excel拥有列头筛选器,感兴趣的可以去下方链接地址查看开源控件库地址。本控件封装的目的在于将第三方库的皮肤和样式封装到皮肤库中可统一设置样式,同时生成nuget方便调用 二、效果如下 三、环境 VS2022 Net7 四、使用方式 1、安装nuget包:H.Con

ULTRAINTERACT 数据集与 EURUS 模型:推动开源大型语言模型在推理领域的新进展

在人工智能的浪潮中,大型语言模型(LLMs)已经成为推动自然语言处理技术发展的关键力量。它们在理解、生成语言以及执行复杂任务方面展现出了巨大的潜力。然而,尽管在特定领域内取得了显著进展,现有的开源LLMs在处理多样化和高难度的推理任务时,仍然难以与最前沿的专有模型相媲美。这一差距不仅限制了开源模型的应用范围,也阻碍了整个领域的发展和创新。 推理任务,特别是那些需要综合运用数学知识、编程技能和逻辑

开源低代码平台,JeecgBoot v3.7.0 里程碑版本发布

项目介绍 JeecgBoot是一款企业级的低代码平台!前后端分离架构 SpringBoot2.x,SpringCloud,Ant Design&Vue3,Mybatis-plus,Shiro,JWT 支持微服务。强大的代码生成器让前后端代码一键生成! JeecgBoot引领低代码开发模式(OnlineCoding-> 代码生成-> 手工MERGE), 帮助解决Java项目70%的重复工作,让开

web前端不可错过的开发工具–Adobe Brackets(开源、简洁强大的HTML、CSS和JavaScript集成开发环境)

Adobe Brackets是一个开源的基于HTML/CSS/JavaScript开发,运行在native shell上的集成开发环境。该项目由Adobe创建和维护,根据MIT许可证发布。提供Windows和OS X平台支持。 Brackets的特点是简约、快捷,没有很多的视图或者面板,它的核心目标是减少在开发过程中那些效率低下的重复性工作,例如浏览器刷新,修改元素的样式,搜索功能等等。

【LocalAI】(13):LocalAI最新版本支持Stable diffusion 3,20亿参数图像更加细腻了,可以继续研究下

最新版本v2.17.1 https://github.com/mudler/LocalAI/releases Stable diffusion 3 You can use Stable diffusion 3 by installing the model in the gallery (stable-diffusion-3-medium) or by placing this YAML fi

论坛开源项目推荐(12.25):菜单(Menu)

转自  http://www.cocoachina.com/applenews/devnews/2013/1225/7608.html 更多代码可到CocoaChina代码库查看:http://code.cocoachina.com/   SvpplyTable(可折叠可张开的菜单动画) 允许你简单地创建可折叠可张开的菜单动画效果,灵感来自于Svpply app。不同表格项

uni-CMS:全端开源内容管理系统的技术探索

摘要 本文介绍了uni-CMS,一个基于uniCloud开发的开源内容管理系统(CMS)。该系统旨在帮助开发者快速搭建并管理内容丰富的网站、小程序和移动应用。通过其全端渲染、内容安全检测、广告解锁付费内容以及AI生成文章等特性,uni-CMS不仅提高了开发效率,还促进了内容生产效率的提升和变现能力的增强。本文详细探讨了uni-CMS的技术架构、功能特性以及实施步骤,为开发者提供了一个全面的技术参

开源C++版AI画图大模型框架stable-diffusion.cpp开发使用初体验

stable-diffusion.cpp是一个C++编写的轻量级开源类AIGC大模型框架,可以支持在消费级普通设备上本地部署运行大模型进行AI画图,以及作为依赖库集成的到应用程序中提供类似于网页版stable-diffusion的功能。 以下基于stable-diffusion.cpp的源码利用C++ api来开发实例demo演示加载本地模型文件输入提示词生成画图,这里采用显卡CUDA加速计算,

Dash开源框架

Dash 是一个基于 Python 的开源框架,由 Plotly 开发,用于构建数据驱动的交互式 Web 应用程序。它结合了 Flask、Plotly 和 React.js 的强大功能,简化了数据可视化应用的开发过程。Dash 非常适合需要将数据科学和数据分析结果展示给非技术用户的情况。  Dash 的核心组件 1. **Dash 核心库**:    - 提供了构建 Dash 应用程序的基础结