trl专题

Trl SFT: llama2-7b-hf使用QLora 4bit量化后ds zero3加上flash atten v2单机多卡训练(笔记)

目录 一、环境   1.1、环境安装   1.2、安装flash atten 二、代码   2.1、bash脚本    2.2、utils.py 注释与优化   2.3、train.py 注释与优化   2.4、模型/参数相关     2.4.1、量化后的模型       2.4.1.1 量化后模型结构       2.4.1.2 量化后模型layers     2.4.2

Trl: llama2-7b-hf使用QLora 4bit量化后ds zero3加上flash atten v2单机多卡训练(笔记)

目录 一、环境   1.1、环境安装   1.2、安装flash atten 二、代码   2.1、bash脚本    2.2、utils.py 注释与优化   2.3、train.py 注释与优化   2.4、模型/参数相关     2.4.1、量化后的模型       a) 量化后模型结构       b) 量化后模型layers     2.4.2、参数