香豆专题

第三节课《香豆:搭建你的 RAG 智能助理》

一、笔记 RAG搜索引擎,用户输入就是搜索内容。 RAG三个部分:index、retrieval、generation。 将检索内容给和原问题一起作为提示prompt输入到LLM中 数据存储:将数据通过其他模型转换为固定长度的向量表示。 相似性检索:查询向量和数据库存储向量余弦相似性度量。 向量表示优化:与模型结果好坏息息相关 无关数据出现幻觉。 传统问答:提问query