zhixi专题

LLM-LLaMA中文衍生模型：LLaMA-ZhiXi【没有对词表进行扩增、全参数预训练、部分参数预训练、指令微调】

下图展示了我们的训练的整个流程和数据集构造。整个训练过程分为两个阶段：（1）全量预训练阶段。该阶段的目的是增强模型的中文能力和知识储备。（2）使用LoRA的指令微调阶段。该阶段让模型能够理解人类的指令并输出合适的内容。 3.1 预训练数据集构建为了在保留原来的代码能力和英语能力的前提下，来提升模型对于中文的理解能力，我们并没有对词表进行扩增，而是搜集了中文语料、英文语料和