今日分享丨浅谈RAG的技术特点及优势

2024-06-22 02:44

本文主要是介绍今日分享丨浅谈RAG的技术特点及优势,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、引言

随着AI技术的发展,我们见证了人工智能在理解和处理自然语言方面取得的巨大进步。特别是结合了检索增强生成(Retrieval-Augmented Generation, RAG)和大语言模型(Large Language Model, LLM)的系统,为解决复杂查询和提供精确答案提供了强大的工具。RAG通过检索相关信息,增强了大模型的对问题的理解能力,利用RAG的优势,提供了广泛的知识覆盖和深入的分析能力。这种结合不仅提升了回答的准确性,也极大地丰富了交互的深度和广度。

在这一背景下,我们探索了RAG的技术特点,旨在创建一个能够理解复杂问题、检索相关信息,并以自然、准确的方式生成回答的智能系统。通过这种结合,我们希望能够更好地服务于用户,无论是在信息检索、问题解答还是数据分析等方面,都能提供更加智能化和个性化的服务体验。

二、RAG的优势,为什么用RAG?

LLM底层的设计机制决定了它所生成的回答本质是基于概率的而非既定事实的,生成内容基于训练数据并按照一定概率生成,因此生成内容会有偏差而其又不具备自我校验的能力,所以有时候会出现答非所问的情况。所以可以通过RAG检索到与问题相关的内容让大模型理解和学习,进而提高大模型的回答精度。

当使用像ChatGPT-3.5这种大模型时,它通常会指出其知识截止日期为2021年。这意味着模型可能无法访问或理解在此日期之后发生的事件或发展的信息。这种局限性可能会减少模型在某些应用场景中的有效性,因为现实世界是不断变化的,而最新的信息对于许多任务来说至关重要,所以通过RAG外挂最新的知识,既可以让大模型学习到最新的知识,又可以节约训练资源和成本。

企业通常不会将敏感的私有数据上传至公共网络中的大模型,如果这样做虽然可以利用大模型解决某些问题,但同时也存在数据泄露的风险。因此,企业需要寻找既能保护数据安全,又能利用大模型优势的解决方案。运用RAG外挂企业私有知识数据,可以让大模型根据企业知识回答问题,而不会有泄露私有数据的风险。

三、RAG的介绍

3.1 RAG整体流程

RAG是一种先进的文本生成技术,它通过结合检索(Retrieval)和生成(Generation)两个阶段,使得大型语言模型在输出答案时能够参考额外的数据资源。这种技术可以显著提升生成答案的相关性和精确度。RAG的整体流程图如下:

3.2 RAG文档预处理

RAG知识库的构建大部分情况需要将文档做一些预处理操作,其中包括文档的读取切分、向量化操作、向量数据库导入数据等。文档切分、向量化和存入向量数据库是RAG中的几个关键步骤:

文档切分:将文档分割成更小的单元,如句子或段落,以便于检索和处理。

向量化:将切分后的文档单元转换为数值向量,这通常通过使用诸如BERT、TF-IDF或其他词嵌入技术来实现。

存入向量数据库:将向量化后的文档单元存储在向量数据库中,以便于快速检索。向量数据库如Milvus、Faiss等,专门设计用来高效地存储和检索高维向量数据。

流程图如下所示:

3.3 RAG检索模块

在RAG流程中,采用多种相似度算法(例如欧式距离、余弦相似度等),我们先将用户问题转换为向量形式,并在向量数据库中寻找与该问题向量相似度最高的若干个内容片段。这种方式为RAG检索模块的主要检索方式,流程如下图所示:

添加图片注释,不超过 140 字(可选)

RAG其实也可以运用传统的关键词检索方式,例如ES、whoosh等,这样就可以不进行向量化操作,直接从文本知识库中搜索匹配到最相关的文档内容。

四、总结

RAG通过检索系统从大规模数据集中找到与输入查询相关的文档,然后将这些文档作为上下文信息,输入到大模型中,生成更加丰富和准确的回复。大模型利用RAG技术,可以更有效地理解和回答用户的问题。它不仅能够从大量数据中检索到相关信息,还能结合这些信息生成更加自然和准确的回答。这种技术的应用,极大地提高了问答系统的智能性和准确性,为用户提供了更好的交互体验。

写在最后,欢迎大家下载我们的inBuilder开源社区版,可免费下载使用,加入我们,开启开发之旅!

这篇关于今日分享丨浅谈RAG的技术特点及优势的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1083067

相关文章

[职场] 护理专业简历怎么写 #经验分享#微信

护理专业简历怎么写   很多想成为一名护理方面的从业者,但是又不知道应该怎么制作一份简历,现在这里分享了一份护理方面的简历模板供大家参考。   蓝山山   年龄:24   号码:12345678910   地址:上海市 邮箱:jianli@jianli.com   教育背景   时间:2011-09到2015-06   学校:蓝山大学   专业:护理学   学历:本科

乐鑫 Matter 技术体验日|快速落地 Matter 产品,引领智能家居生态新发展

随着 Matter 协议的推广和普及,智能家居行业正迎来新的发展机遇,众多厂商纷纷投身于 Matter 产品的研发与验证。然而,开发者普遍面临技术门槛高、认证流程繁琐、生产管理复杂等诸多挑战。  乐鑫信息科技 (688018.SH) 凭借深厚的研发实力与行业洞察力,推出了全面的 Matter 解决方案,包含基于乐鑫 SoC 的 Matter 硬件平台、基于开源 ESP-Matter SDK 的一

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

大学湖北中医药大学法医学试题及答案,分享几个实用搜题和学习工具 #微信#学习方法#职场发展

今天分享拥有拍照搜题、文字搜题、语音搜题、多重搜题等搜题模式,可以快速查找问题解析,加深对题目答案的理解。 1.快练题 这是一个网站 找题的网站海量题库,在线搜题,快速刷题~为您提供百万优质题库,直接搜索题库名称,支持多种刷题模式:顺序练习、语音听题、本地搜题、顺序阅读、模拟考试、组卷考试、赶快下载吧! 2.彩虹搜题 这是个老公众号了 支持手写输入,截图搜题,详细步骤,解题必备

持久层 技术选型如何决策?JPA,Hibernate,ibatis(mybatis)

转自:http://t.51jdy.cn/thread-259-1-1.html 持久层 是一个项目 后台 最重要的部分。他直接 决定了 数据读写的性能,业务编写的复杂度,数据结构(对象结构)等问题。 因此 架构师在考虑 使用那个持久层框架的时候 要考虑清楚。 选择的 标准: 1,项目的场景。 2,团队的技能掌握情况。 3,开发周期(开发效率)。 传统的 业务系统,通常业

[职场] 公务员的利弊分析 #知识分享#经验分享#其他

公务员的利弊分析     公务员作为一种稳定的职业选择,一直备受人们的关注。然而,就像任何其他职业一样,公务员职位也有其利与弊。本文将对公务员的利弊进行分析,帮助读者更好地了解这一职业的特点。 利: 1. 稳定的职业:公务员职位通常具有较高的稳定性,一旦进入公务员队伍,往往可以享受到稳定的工作环境和薪资待遇。这对于那些追求稳定的人来说,是一个很大的优势。 2. 薪资福利优厚:公务员的薪资和

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

android一键分享功能部分实现

为什么叫做部分实现呢,其实是我只实现一部分的分享。如新浪微博,那还有没去实现的是微信分享。还有一部分奇怪的问题:我QQ分享跟QQ空间的分享功能,我都没配置key那些都是原本集成就有的key也可以实现分享,谁清楚的麻烦详解下。 实现分享功能我们可以去www.mob.com这个网站集成。免费的,而且还有短信验证功能。等这分享研究完后就研究下短信验证功能。 开始实现步骤(新浪分享,以下是本人自己实现

【杂记-浅谈DHCP动态主机配置协议】

DHCP动态主机配置协议 一、DHCP概述1、定义2、作用3、报文类型 二、DHCP的工作原理三、DHCP服务器的配置和管理 一、DHCP概述 1、定义 DHCP,Dynamic Host Configuration Protocol,动态主机配置协议,是一种网络协议,主要用于在IP网络中自动分配和管理IP地址以及其他网络配置参数。 2、作用 DHCP允许计算机和其他设备通

浅谈 MySQL for excel

欢迎关注微信公众号“Python生态智联”  MySQL for excel是一个大小只有几兆的MySQL附件,它能让我们在Microsoft excel中处理MySQL数据。小编用了两天时间浏览了MySQL for excel的使用指南并按demo演示了一遍(手册地址https://dev.mysql.com/doc/mysql-for-excel/en/),现从功能和局限两方面对MySQL