Xformers介绍

2023-11-03 12:10
文章标签 介绍 xformers

本文主要是介绍Xformers介绍,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原基础环境配置:NVIDIA470.57.02支持的最高CUDA为11.4,实际CUDA为11.1。


最近在跑ResShift模型,是一个基于高效diffusion的图像超分扩散模型。在配置环境时,需要安装一个库xformers==0.0.20,然后就引发了一系列的版本问题:

1、xformer 0.0.20 需要的 torch版本为2.0.1左右

2、torch 2.0.1需要的cuda版本为11.7左右

3、cuda11.7需要的NVIDIA版本需要升级(CUDA版本不能超过NVIDIA支持的最高版本)

4、更新cuda后,对应的gcc版本可能也需要更新,而且以前的project环境可能会崩,呜呜呜~


Xformers作为facebook中的一个开源库,能够更加有效的实现transformer中的计算工作,能够对整体模型进行进一步的加速。注意,当处理高分辨率的图像时,xformers对于显存的降低效果更加明显。对于处理较低分辨率的图像时(如512*512)对显存没有明显优化。

另外需要注意,使用了xformers对训练过程进行优化后,模型推理时也必须要用存在xformers的环境进行推理,不然容易出现精度溢出导致的“黑图”问题。

GitHub - facebookresearch/xformers: Hackable and optimized Transformers building blocks, supporting a composable construction.Hackable and optimized Transformers building blocks, supporting a composable construction. - GitHub - facebookresearch/xformers: Hackable and optimized Transformers building blocks, supporting a composable construction.icon-default.png?t=N7T8https://github.com/facebookresearch/xformers对于xformers的详细介绍、代码中如何引入、效果和注意事项可以戳下面链接:

【stable-diffusion企业级教程04】EMA你走,拥抱16G显存!Xformers是未来! - 知乎1、回顾无所知:【stable-diffusion企业级教程03】FP16真香!(想说爱你不容易)上一讲我们成功的利用deepspeed框架,将sd模型以fp16的精度训练了起来,显存的消耗也降低到18G左右。 不过有小伙伴在下面评论,说手…icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/632607725



注意:代码中应该会在开头,定义一个全局变量,来确定是否需要使用xformers。若处理较小分辨率的图片,或者是觉得当前基础环境配置难以支持xformers,则直接卸載xformers即可,程序也能正常运行。(pip uninstall xformers)

截止20230924,所发布的xformers版本包括:(from versions: 0.0.1, 0.0.2, 0.0.3, 0.0.4, 0.0.5, 0.0.6, 0.0.7, 0.0.8, 0.0.9, 0.0.10, 0.0.11, 0.0.12, 0.0.13, 0.0.16rc424, 0.0.16rc425, 0.0.16, 0.0.17rc481, 0.0.17rc482, 0.0.17, 0.0.18, 0.0.19, 0.0.20, 0.0.21, 0.0.22.dev615, 0.0.22.dev616, 0.0.22.dev617, 0.0.22.dev627, 0.0.22.dev629)。

这篇关于Xformers介绍的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/338060

相关文章

Pytest多环境切换的常见方法介绍

《Pytest多环境切换的常见方法介绍》Pytest作为自动化测试的主力框架,如何实现本地、测试、预发、生产环境的灵活切换,本文总结了通过pytest框架实现自由环境切换的几种方法,大家可以根据需要进... 目录1.pytest-base-url2.hooks函数3.yml和fixture结论你是否也遇到过

MySQL中慢SQL优化的不同方式介绍

《MySQL中慢SQL优化的不同方式介绍》慢SQL的优化,主要从两个方面考虑,SQL语句本身的优化,以及数据库设计的优化,下面小编就来给大家介绍一下有哪些方式可以优化慢SQL吧... 目录避免不必要的列分页优化索引优化JOIN 的优化排序优化UNION 优化慢 SQL 的优化,主要从两个方面考虑,SQL 语

C++中函数模板与类模板的简单使用及区别介绍

《C++中函数模板与类模板的简单使用及区别介绍》这篇文章介绍了C++中的模板机制,包括函数模板和类模板的概念、语法和实际应用,函数模板通过类型参数实现泛型操作,而类模板允许创建可处理多种数据类型的类,... 目录一、函数模板定义语法真实示例二、类模板三、关键区别四、注意事项 ‌在C++中,模板是实现泛型编程

Python实现html转png的完美方案介绍

《Python实现html转png的完美方案介绍》这篇文章主要为大家详细介绍了如何使用Python实现html转png功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 1.增强稳定性与错误处理建议使用三层异常捕获结构:try: with sync_playwright(

Java使用多线程处理未知任务数的方案介绍

《Java使用多线程处理未知任务数的方案介绍》这篇文章主要为大家详细介绍了Java如何使用多线程实现处理未知任务数,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 知道任务个数,你可以定义好线程数规则,生成线程数去跑代码说明:1.虚拟线程池:使用 Executors.newVir

JAVA SE包装类和泛型详细介绍及说明方法

《JAVASE包装类和泛型详细介绍及说明方法》:本文主要介绍JAVASE包装类和泛型的相关资料,包括基本数据类型与包装类的对应关系,以及装箱和拆箱的概念,并重点讲解了自动装箱和自动拆箱的机制,文... 目录1. 包装类1.1 基本数据类型和对应的包装类1.2 装箱和拆箱1.3 自动装箱和自动拆箱2. 泛型2

四种Flutter子页面向父组件传递数据的方法介绍

《四种Flutter子页面向父组件传递数据的方法介绍》在Flutter中,如果父组件需要调用子组件的方法,可以通过常用的四种方式实现,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录方法 1:使用 GlobalKey 和 State 调用子组件方法方法 2:通过回调函数(Callb

Python进阶之Excel基本操作介绍

《Python进阶之Excel基本操作介绍》在现实中,很多工作都需要与数据打交道,Excel作为常用的数据处理工具,一直备受人们的青睐,本文主要为大家介绍了一些Python中Excel的基本操作,希望... 目录概述写入使用 xlwt使用 XlsxWriter读取修改概述在现实中,很多工作都需要与数据打交

java脚本使用不同版本jdk的说明介绍

《java脚本使用不同版本jdk的说明介绍》本文介绍了在Java中执行JavaScript脚本的几种方式,包括使用ScriptEngine、Nashorn和GraalVM,ScriptEngine适用... 目录Java脚本使用不同版本jdk的说明1.使用ScriptEngine执行javascript2.

Python实现NLP的完整流程介绍

《Python实现NLP的完整流程介绍》这篇文章主要为大家详细介绍了Python实现NLP的完整流程,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 编程安装和导入必要的库2. 文本数据准备3. 文本预处理3.1 小写化3.2 分词(Tokenizatio