48g专题

QLoRA：高效的LLMs微调方法，48G内存可调65B 模型

文章：https://arxiv.org/pdf/2305.14314.pdf代码：https://github.com/artidoro/qlora 概括 QLORA是一种有效的微调方法，它减少了内存使用，足以在单个48GB GPU上微调65B参数模型，同时保留完整的16位微调任务性能。QLORA通过冻结的4位量化预训练语言模型将梯度反向传播到低秩适配器(Low Rank Adapter