本文主要是介绍大模型RAG SFT,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
为什么需要RAG、SFT或者重训?为了拓展模型能力的边界
需要额外给大模型提供私域知识,不能每次都人工加入到prompt中,需要自动加,这就引出了RAG,RAG是让AI回答问题时看一本参考书。
输出不满足格式要求,例如想要一个用例包含固定的字段,但是生成结果不稳定,风格不固定,就要SFT,SFT是让AI的输出形式符合预期。
当需要模型深入理解某个概念或者进行联想和专业推理,例如方法或者方法论,重训会让AI学会知识,理解知识,重训是对AI模型的增强。
如何找到额外的信息是一个大活,信息找的越好,大模型回答的就越准确。但是大模型一次能处理的上下文长度有限,例如4k字符,那么就要把文章切割开,选取需要的部分。
需要langchain工程处理:
让Langchain与你的数据对话(一):数据加载与分割 https://zhuanlan.zhihu.com/p/644938147
让Langchain与你的数据对话(二):向量存储与嵌入 https://zhuanlan.zhihu.com/p/645655496
让Langchain与你的数据对话(三):检索(Retrieval) https://zhuanlan.zhihu.com/p/646433933
让Langchain与你的数据对话(四):问答(question answering) https://zhuanlan.zhihu.com/p/647599501
让Langchain与你的数据对话(五):聊天机器人 让Langchain与你的数据对话(五):聊天机器人 - 知乎
*不要被限制了,向量数据库也是数据库和sql数据库没有本质区别,仅是检索信息的方法不同
一文读懂:大模型RAG - 知乎
RAG案例:如何让 ChatGPT 读懂超长保险条款? - 知乎
SFT案例:工作台 - Heywhale.com
这篇关于大模型RAG SFT的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!