Prompt Tuning 和instruct tuning

2024-03-20 06:59

文章标签 prompt tuning instruct

本文主要是介绍Prompt Tuning 和instruct tuning，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Prompt Tuning 是啥？

prompt的思想是，把下游任务的输入转化为预训练模型的原始任务。

以bert作为举例，假设任务是文本分类。“今天天气很好。”我们想判断一下这句话的情感是正面还是负面

fine-tune的方法是在bert之后接一个head，然后调整整个模型。

prompt 的方法是把下游任务转化为预训练任务，我们知道bert的预训练任务是MLM，于是把

“今天天气很好。”转化为“今天天气很好。我很[mask][mask]”，我们希望bert预测出"开心"两个字。然后对“开心”映射到正面情感。

prompt-tuning：我们知道prompt的方法是把下游任务转化为预训练任务，但是怎么转化效果会好呢。比如如下几种prompt：

1.“今天天气很好。我很[mask][mask]”

2.“今天天气很好。我非常[mask][mask]”

3.“今天天气很好。我的心情是[mask][mask]”

我们并不知道哪种prompt是最好的，于是我们希望模型可以自己去学习，于是就提出了prompt-tuning（提示微调），该方法会固定预训练模型的参数（与fine-tune不同之处），增加额外的参数来训练，常见的方法有prompt-tuning, prefix-tuning, p-tuning，与fine-tune不同，可训练参数一般都是加载embbeding层，而不是加在最后

提示学习Prompt Tuning：面向研究综述 - 知乎

huggingface上的一篇博文也解释的很清楚