本文主要是介绍Unlearn What You Want to Forget: Efficient Unlearning for LLMs,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本文是LLM系列文章,针对《Unlearn What You Want to Forget: Efficient Unlearning for LLMs》的翻译。
遗忘你想忘记的东西:LLM的高效遗忘
- 摘要
- 1 引言
- 2 相关工作
- 3 LLM的高效遗忘
- 4 实验
- 5 结论
- 6 局限性
摘要
大型语言模型(LLM)在对各种文本数据进行预训练和记忆方面取得了重大进展,然而,这一过程可能会受到隐私问题和违反数据保护法规的影响。因此,从这样的模型中容易地删除与个人用户相关的数据,同时在删除后不恶化其预测质量的能力变得越来越重要。为了解决这些问题,在这项工作中,我们提出了一个有效的遗忘框架,通过在Transformer中引入以选择性师生目标学习的轻量级遗忘层,该框架可以有效地更新LLM,而不必在数据删除后对整个模型进行再训练。此外,我们引入了一种融合机制来有效地组合不同的遗忘层,学习遗忘不同的数据集来处理一系列遗忘操作。分类和生成任务的实验表明,与最先进的基线相比,我们提出的方法是有效的。
1 引言
2 相关工作
3 LLM的高效遗忘
4 实验
5 结论
在这项工作中,我们提出了EUL,这是一种有效的LLM遗忘方法,它可以通过选择性教师-学生目标学习遗忘层来有效地遗忘用户请求的数据。我们进一步引入了一种融合机制,可以将不同的遗忘层合并为一个统一的层,以动态地遗忘数据序列。在不同设置(不同的数据集、不同的模型大小、不同的遗忘集大小)上的实验证明了与最先进的基线相比,我们提出的EUL方法的有效性。
6 局限性
在这项工作中,我们主要在具有微调任务的T5 base/3b模型上进行实验。我们鼓励未来的工作探索如何更新更大尺寸的不同骨干模型,如LLAMA模型,甚至是像ChatGPT这样的近源模型,以忘记所需的数据,如预训练语料库中的隐私相关数据、有毒数据或错误信息。此外,我们主要遵循之前的工作,通过测试集、保留集和遗忘集的表现来衡量遗忘,以及MLM损失。未来的工作可能会探索如何更全面地评估遗忘方法,例如模型是否能回忆起遗忘的内容,或者方法是否能识别遗忘的数据。此外,我们在模拟环境中进行所有实验。未来的工作可能会将我们的方法应用于现实世界的应用程序,以处理实际用例,或者引入新的基准来评估遗忘方法。
这篇关于Unlearn What You Want to Forget: Efficient Unlearning for LLMs的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!