第三节课《香豆:搭建你的 RAG 智能助理》

2024-04-14 08:44

本文主要是介绍第三节课《香豆:搭建你的 RAG 智能助理》,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 一、笔记

RAG搜索引擎,用户输入就是搜索内容。

RAG三个部分:index、retrieval、generation。

将检索内容给和原问题一起作为提示prompt输入到LLM中

数据存储:将数据通过其他模型转换为固定长度的向量表示。

相似性检索:查询向量和数据库存储向量余弦相似性度量。

向量表示优化:与模型结果好坏息息相关

无关数据出现幻觉。

传统问答:提问query-->大模型LLM-->回答answer

RAG:提问query-->向量化embedding--->搜索indexing-->检索retieval->

            问题+检索结果作为提示词prompts-->生成generation-->回答answer

不断更新向量数据库,就能不断的处理新的数据。

Naive RAG:只有索引、检索、生成。运用在问答系统和信息检索。

Advanced RAG:检索前后都进行增强,检索的问题路由扩展,检索到的信息进行重排序总结融合,运用在摘要生成和内容推荐。

Modular RAG: 将RAG基础部分和后续功能进行模块化,根据业务进行定制,完成多模态任务、对话系统等更高级的任务。

提升向量库的质量:

        嵌入优化:增强嵌入性能

        索引优化:提升索引质量

查询优化:更适应查询

上下文管理:减少冗余信息,提升大模型效率。

检索:

        迭代检索:根据检索结果多次迭代检索知识,提供知识基础。

        递归检索:改进检索结果的深度和相关性,

        自适应检索:

LLM:定向微调、针对性微调。

 

微调、提示工程、RAG

任务对外部知识需求

任务对模型适配度的需求

提示工程:对外部知识和适配度都比较差,不能适应新的知识,同时对特定专业知识也很难专业的回复

微调:对外部数据需求不高,但对模型任务适配度很高。

RAG:  对外部数据需求高,但对模型任务适配度不高。

融合三种方法:

检索阶段、生成阶段分开评价

茴香豆

无需训练。

非有效数据,无法分析真实意图,结合LLM和RAG,提取有效信息

开源免费、本地部署、远端部署

知识库:实时更新的专业领域数据,多种文件格式,设置接受处理范围。

前端:回答平台

大模型:本地(书生浦语、千亿千问)、远端API

预处理:输入筛选,转换问询

拒答工作流:分析、比较相关性得分

回答工作流:相关性得分达到,开始回答

LLM scroing阈值设定问答助手回答的是话痨还是严谨技术专家。

保证回答内容准确性。

本地或者网络检索。

多重评分回答问题严谨性。

二、网页茴香豆

 

这里面很多文章应该是超过长度限制了,报错了几次

huixiangdou/repodir/huixiangdou/resource/HuixiangDou.pdf---

huixiangdou/repodir/huixiangdou/docs/add_wechat_accessibility_zh.md--

huixiangdou/repodir/huixiangdou/docs/add_wechat_group_zh.md---

这篇关于第三节课《香豆:搭建你的 RAG 智能助理》的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/902593

相关文章

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

【网络安全的神秘世界】搭建dvwa靶场

🌝博客主页:泥菩萨 💖专栏:Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 下载DVWA https://github.com/digininja/DVWA/blob/master/README.zh.md 安装DVWA 安装phpstudy https://editor.csdn.net/md/?articleId=1399043

基于 Java 实现的智能客服聊天工具模拟场景

服务端代码 import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.io.PrintWriter;import java.net.ServerSocket;import java.net.Socket;public class Serv

cocospod 搭建环境和使用

iOS 最新版 CocoaPods 的安装流程 1.移除现有Ruby默认源 $gem sources --remove https://rubygems.org/ 2.使用新的源 $gem sources -a https://ruby.taobao.org/ 3.验证新源是否替换成功 $gem sources -l 4.安装CocoaPods (1)  $sudo gem

江西电信联合实在智能举办RPA数字员工培训班,培养“人工智能+”电信人才

近日,江西电信与实在智能合作的2024年数字员工开发应用培训班圆满闭幕。包括省公司及11个分公司的核心业务部门,超过40名学员积极报名参与此次培训,江西电信企业信息化部门总监徐建军出席活动并致辞,风控支撑室主任黄剑主持此次培训活动。 在培训会开幕仪式上,徐建军强调,科创是电信企业发展的核心动力,学习RPA技术是实现数字化转型的关键,他阐述了RPA在提高效率、降低成本和优化资源方面的价值,并鼓励学

Apache2.4+PHP7.2环境搭建

Editplus生成码:http://www.jb51.net/tools/editplus/ 阿帕奇下载地址:https://www.apachehaus.com/cgi-bin/download.plx PHP下载地址:http://windows.php.net/download#php-7.2 1.打开阿帕奇的下载地址,点击下载。

Solr集群的搭建和使用(2)

1   什么是SolrCloud   SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发很高,这时需要使  用SolrCloud来满足这些需求。   SolrCloud是基于Solr和Zookeeper的分布式搜索

深度神经网络:解锁智能的密钥

深度神经网络:解锁智能的密钥 在人工智能的浩瀚星空中,深度神经网络(Deep Neural Networks, DNNs)无疑是最耀眼的那颗星。它以其强大的学习能力、高度的适应性和广泛的应用场景,成为了我们解锁智能世界的一把密钥。本文将带你走进深度神经网络的神秘世界,探讨其原理、应用以及实用操作技巧。 一、深度神经网络概述 深度神经网络,顾名思义,是一种具有多个隐藏层的神经网络。与传统的神经

基于LangChain框架搭建知识库

基于LangChain框架搭建知识库 说明流程1.数据加载2.数据清洗3.数据切分4.获取向量5.向量库保存到本地6.向量搜索7.汇总调用 说明 本文使用openai提供的embedding模型作为框架基础模型,知识库的搭建目的就是为了让大模型减少幻觉出现,实现起来也很简单,假如你要做一个大模型的客服问答系统,那么就把历史客服问答数据整理好,先做数据处理,在做数据向量化,最后保