大模型RAG SFT

2024-02-28 19:28

文章标签 模型 rag sft

本文主要是介绍大模型RAG SFT，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

为什么需要RAG、SFT或者重训？为了拓展模型能力的边界

需要额外给大模型提供私域知识，不能每次都人工加入到prompt中，需要自动加，这就引出了RAG，RAG是让AI回答问题时看一本参考书。

输出不满足格式要求，例如想要一个用例包含固定的字段，但是生成结果不稳定，风格不固定，就要SFT，SFT是让AI的输出形式符合预期。

当需要模型深入理解某个概念或者进行联想和专业推理，例如方法或者方法论，重训会让AI学会知识，理解知识，重训是对AI模型的增强。

如何找到额外的信息是一个大活，信息找的越好，大模型回答的就越准确。但是大模型一次能处理的上下文长度有限，例如4k字符，那么就要把文章切割开，选取需要的部分。

需要langchain工程处理：

让Langchain与你的数据对话(一)：数据加载与分割 https://zhuanlan.zhihu.com/p/644938147

让Langchain与你的数据对话(二)：向量存储与嵌入 https://zhuanlan.zhihu.com/p/645655496

让Langchain与你的数据对话(三)：检索(Retrieval) https://zhuanlan.zhihu.com/p/646433933

让Langchain与你的数据对话(四)：问答(question answering) https://zhuanlan.zhihu.com/p/647599501

让Langchain与你的数据对话(五)：聊天机器人让Langchain与你的数据对话(五)：聊天机器人 - 知乎

*不要被限制了，向量数据库也是数据库和sql数据库没有本质区别，仅是检索信息的方法不同

一文读懂：大模型RAG - 知乎

RAG案例：如何让 ChatGPT 读懂超长保险条款？ - 知乎

SFT案例：工作台 - Heywhale.com

这篇关于大模型RAG SFT的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！