camels专题

How Far Can Camels Go? Exploring the State of Instruction Tuning on Open Resources翻译

摘要在这项工作中，我们探索在一系列开源指令遵循数据集上进行指令微调的语言模型的最新进展。尽管最近声称开源模型可以与SOTA的私有模型相当，但这些观点通常伴随着有限的评估，因此很难全面比较模型并确定各种资源的实用性。我们提供大量包括从6.7B到65B参数的指令微调模型，这些模型在12个指令数据集中进行了训练，这些数据集通过手动设计（例如，OpenAssistant），合成或蒸馏（例如，Alpac