第三节课《香豆：搭建你的 RAG 智能助理》

2024-04-14 08:44

文章标签 智能搭建助理 rag 三节课香豆

本文主要是介绍第三节课《香豆：搭建你的 RAG 智能助理》，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、笔记

RAG搜索引擎，用户输入就是搜索内容。

RAG三个部分：index、retrieval、generation。

将检索内容给和原问题一起作为提示prompt输入到LLM中

数据存储：将数据通过其他模型转换为固定长度的向量表示。

相似性检索：查询向量和数据库存储向量余弦相似性度量。

向量表示优化：与模型结果好坏息息相关

无关数据出现幻觉。

传统问答：提问query-->大模型LLM-->回答answer

RAG：提问query-->向量化embedding--->搜索indexing-->检索retieval->

问题+检索结果作为提示词prompts-->生成generation-->回答answer

不断更新向量数据库，就能不断的处理新的数据。

Naive RAG:只有索引、检索、生成。运用在问答系统和信息检索。

Advanced RAG：检索前后都进行增强，检索的问题路由扩展，检索到的信息进行重排序总结融合，运用在摘要生成和内容推荐。

Modular RAG: 将RAG基础部分和后续功能进行模块化，根据业务进行定制，完成多模态任务、对话系统等更高级的任务。

提升向量库的质量：

嵌入优化：增强嵌入性能

索引优化：提升索引质量

查询优化：更适应查询

上下文管理：减少冗余信息，提升大模型效率。

检索：

迭代检索：根据检索结果多次迭代检索知识，提供知识基础。

递归检索：改进检索结果的深度和相关性，

自适应检索：

LLM：定向微调、针对性微调。

微调、提示工程、RAG

任务对外部知识需求

任务对模型适配度的需求

提示工程：对外部知识和适配度都比较差，不能适应新的知识，同时对特定专业知识也很难专业的回复

微调：对外部数据需求不高，但对模型任务适配度很高。

RAG: 对外部数据需求高，但对模型任务适配度不高。

融合三种方法：

检索阶段、生成阶段分开评价

茴香豆

无需训练。

非有效数据，无法分析真实意图，结合LLM和RAG，提取有效信息

开源免费、本地部署、远端部署

知识库：实时更新的专业领域数据，多种文件格式，设置接受处理范围。

前端：回答平台

大模型：本地（书生浦语、千亿千问）、远端API

预处理：输入筛选，转换问询

拒答工作流：分析、比较相关性得分

回答工作流：相关性得分达到，开始回答

LLM scroing阈值设定问答助手回答的是话痨还是严谨技术专家。

保证回答内容准确性。

本地或者网络检索。

多重评分回答问题严谨性。

二、网页茴香豆

这里面很多文章应该是超过长度限制了，报错了几次

huixiangdou/repodir/huixiangdou/resource/HuixiangDou.pdf---

huixiangdou/repodir/huixiangdou/docs/add_wechat_accessibility_zh.md--

huixiangdou/repodir/huixiangdou/docs/add_wechat_group_zh.md---

这篇关于第三节课《香豆：搭建你的 RAG 智能助理》的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/902593。 23002807@qq.com

相关文章

Python实现word文档内容智能提取以及合成

Python实现word文档内容智能提取以及合成

《Python实现word文档内容智能提取以及合成》这篇文章主要为大家详细介绍了如何使用Python实现从10个左右的docx文档中抽取内容,再调整语言风格后生成新的文档,感兴趣的小伙伴可以了解一下... 目录核心思路技术路径实现步骤阶段一：准备工作阶段二：内容提取 (python 脚本)阶段三：语言风格调

阅读更多...

利用Python快速搭建Markdown笔记发布系统

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言：为什么要自建知识博客一、技术选型：极简主义开发栈二、系统架构设计三、核心代码实现（分步解析

阅读更多...

使用Python实现快速搭建本地HTTP服务器

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》：本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

阅读更多...

MySQL双主搭建+keepalived高可用的实现

MySQL双主搭建+keepalived高可用的实现

《MySQL双主搭建+keepalived高可用的实现》本文主要介绍了MySQL双主搭建+keepalived高可用的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、测试环境准备二、主从搭建1.创建复制用户2.创建复制关系3.开启复制，确认复制是否成功4.同

阅读更多...

使用DeepSeek搭建个人知识库(在笔记本电脑上)

使用DeepSeek搭建个人知识库(在笔记本电脑上)

《使用DeepSeek搭建个人知识库(在笔记本电脑上)》本文介绍了如何在笔记本电脑上使用DeepSeek和开源工具搭建个人知识库,通过安装DeepSeek和RAGFlow,并使用CherryStudi... 目录部署环境软件清单安装DeepSeek安装Cherry Studio安装RAGFlow设置知识库总

阅读更多...

Linux搭建Mysql主从同步的教程

Linux搭建Mysql主从同步的教程

《Linux搭建Mysql主从同步的教程》：本文主要介绍Linux搭建Mysql主从同步的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux搭建mysql主从同步1.启动mysql服务2.修改Mysql主库配置文件/etc/my.cnf3.重启主库my

阅读更多...

国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)

国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)

《国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)》本文给大家利用deepseek模型搭建私有知识问答库的详细步骤和遇到的问题及解决办法,感兴趣的朋友一起看看吧... 目录1. 第1步大家在安装完ollama后，需要到系统环境变量中添加两个变量2. 第3步 “在cmd中

阅读更多...

使用Python实现表格字段智能去重

使用Python实现表格字段智能去重

《使用Python实现表格字段智能去重》在数据分析和处理过程中,数据清洗是一个至关重要的步骤,其中字段去重是一个常见且关键的任务,下面我们看看如何使用Python进行表格字段智能去重吧... 目录一、引言二、数据重复问题的常见场景与影响三、python在数据清洗中的优势四、基于Python的表格字段智能去重

阅读更多...

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么？Spring AI 的主要功能包括1、环境准备2

阅读更多...

Spring AI与DeepSeek实战一之快速打造智能对话应用

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

阅读更多...