本文主要是介绍垂域LLM训练经验之谈,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
文章目录
- 前言
- 一、全参 SFT
- 二、LORA SFT
- 三、LORA继续预训练
- 四、Llama pro 预训练 + SFT
- 总结
前言
本文将按以下几个部分进行叙述:
- 全参 SFT
- Lora SFT
- Lora 继续预训练
- Llama pro 预训练 + SFT
数据说明:
- 预训练数据:由SFT数据的Query 与 Answer 的拼接
- SFT数据:由GPT4根据垂域文档抽取问答对+人工挑选而来,大概20000条,其中包括公司的介绍
- 自我认知数据:大概200条,从公开的自我认知数据整理而来
- 通用数据:匠数科技大模型sft数据集
显卡
4 * A100 (40G)
训
这篇关于垂域LLM训练经验之谈的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!