RAG_Example

2024-06-14 09:28

文章标签 example rag

本文主要是介绍RAG_Example，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

今天尝试基于langchain进行LLM RAG搭建，感觉使用难度没有想象中大。具体流程参考末尾链接。

主要流程包括下面几个模块，每一个模块都有很多选择，而不是唯一解。

但这里可以感受到潜在的几个问题

1. 文本转换过程中，PDF的信息可能会丢失和损坏。比如对于一个只包含很多小标题的文档，我怀疑是否能够获得足够多的有效信息。此外，一些文档中的信息，是通过图文结合的方式，这种信息是否能有效获取呢？

2. LLM基座模型的选择比较重要，目前来看，模型可以理解中文，但是不能说中文，这是一个问题，想到的解决方案就是替代基座模型。

3. 目前由于使用不够充分，无法给出结论，但是目前感觉每个环节都可能会出问题。

https://medium.com/@cch.chichieh/rag%E5%AF%A6%E4%BD%9C%E6%95%99%E5%AD%B8-langchain-llama2-%E5%89%B5%E9%80%A0%E4%BD%A0%E7%9A%84%E5%80%8B%E4%BA%BAllm-d6838febf8c4

这篇关于RAG_Example的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/1060009。 23002807@qq.com

相关文章

我的第2个AI项目-RAG with Gemma hosted on HuggingFace and Weaviate in DSPy

我的第2个AI项目-RAG with Gemma hosted on HuggingFace and Weaviate in DSPy

目录项目简介概述时间kaggle地址主要工作和收获技术栈数据集模型表现未来项目说明思路和原则为什么不把现在的项目做深一点？博客风格转变 bug修复版本兼容问题项目简介概述本项目简要介绍了如何使用 DSPy 构建一个简单的 RAG 管道，且利用了托管在 Hugging Face 上的 Gemma LLM模型和 Weaviate 向量数据库。时间 2024.09

阅读更多...

jmeter压力测试，通过LLM利用RAG实现知识库问答，NEO4J部署，GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答（9/7）

jmeter压力测试，通过LLM利用RAG实现知识库问答，NEO4J部署，GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答（9/7）

前言这周也是杂七杂八的一天（高情商：我是一块砖，哪里需要往哪里搬），首先是接触了jemter这个压力测试工具，然后帮公司的AIGC项目编写使用手册和问答手册的第一版，并通过这个平台的智能体实现知识库问答的功能展示，以及部分个人扩展和思考（NEO4J创建知识图谱的GraphRAG）。 Jmeter Jmeter是一个压力测试工具，一开始导师叫我熟悉的时候我还说

阅读更多...

深入RAG优化：BGE词嵌入全解析与Landmark Embedding新突破

深入RAG优化：BGE词嵌入全解析与Landmark Embedding新突破

前面已经写过一篇关于Embedding选型的文章，《如何高效选择RAG的中文Embedding模型？揭秘最佳实践与关键标准！》，主要介绍通过开源网站的下载量和测评效果选择Embedding模型。一、Embedding选型建议与结果选型建议： 1、大部分模型的序列长度是 512 tokens。8192 可尝试 tao-8k，1024 可尝试 stella。 2、在专业数据领域上，嵌入

阅读更多...

langchain 《斗破苍穹》智谱 RAG 问题搜索

langchain 《斗破苍穹》智谱 RAG 问题搜索

目录代码项目介绍模型对比实验分块方法对比检索方法对比结果 10条问题 15条问题局限性代码 https://github.com/5zjk5/prompt-engineering/tree/master 项目介绍《斗破苍穹》小说 RAG 问答，爬虫爬取整部小说章节，并分别保存到不同的数据源中。 txt，pdf，markdown，word。

阅读更多...

提升LLM结果：何时使用知识图谱RAG

提升LLM结果：何时使用知识图谱RAG

通过知识图谱增强 RAG 可以帮助检索，使系统能够更深入地挖掘数据集以提供详细的响应。有时，检索增强生成 (RAG) 系统无法深入文档集以找到所需的答案。我们可能会得到泛泛的或肤浅的回复，或者我们可能会得到回复，其中 RAG 系统检索到的细节很少，然后用不相关或不正确的信息填补空白——这被称为“幻觉”。深度知识库和文档集可能包含我们用 RAG 提示回答问题所需的所有信息，但 RAG 系统

阅读更多...

使用Cloudflare构建RAG应用；端到端语音开源大模型；AI幻灯片生成器，等六个开源项目

使用Cloudflare构建RAG应用；端到端语音开源大模型；AI幻灯片生成器，等六个开源项目

✨ 1: Cloudflare RAG 如何使用Cloudflare构建一个完整的RAG应用，结合多种搜索技术和AI服务。 Cloudflare RAG（Retrieval Augmented Generation）是一个全栈示例，展示如何使用 Cloudflare 构建 RAG 应用程序。该项目结合了 Cloudflare Workers、Pages、D1、KV、R2、AI Gate

阅读更多...

风趣图解LLMs RAG的15种设计模式-第二课

风趣图解LLMs RAG的15种设计模式-第二课

全部用的是Midjourney连续性一致性绘图画成

阅读更多...

LlamaIndex结合DSPy，进一步优化RAG系统

LlamaIndex结合DSPy，进一步优化RAG系统

大家好，本文将介绍如何运用LlamaIndex和DSPy这两个工具来构建和优化检索增强型生成（Retrieval-Augmented Generation, RAG）系统。通过这两个框架的无缝结合，不仅能够简化开发过程，还能显著提高RAG系统的整体性能。接下来，将详细解析LlamaIndex与DSPy如何高效协同，带来1+1>2的效果。 1.LlamaIndex LlamaIndex 是用于构

阅读更多...

增强RAG：选择最佳的嵌入和重排模型

增强RAG：选择最佳的嵌入和重排模型

对于如何选择最佳的嵌入模型和重排模型，给出了详细的步骤和代码。在构建检索增强生成（RAG）管道时，关键组件之一是检索器。我们有多种嵌入模型可供选择，包括 OpenAI、CohereAI 和开源的sentence transformers。此外，还有来自 CohereAI 和sentence transformers的几种重排器可供选择。但是，在所有这些选项中，我们如何确定最佳组合以获得顶级

阅读更多...

企业级RAG应用优化整合贴【上】：数据索引阶段的8个必知技巧｜建议收藏

企业级RAG应用优化整合贴【上】：数据索引阶段的8个必知技巧｜建议收藏

基于大模型的RAG应用，一个普遍的认识是：做原型很简单，投入生产很难为什么我的RAG应用很难按预期工作？在之前的文章中我们曾经陆续的对RAG应用优化做过零星与局部的探讨，如融合检索、查询转换、多模态处理、Agentic RAG等。接下来我们将结合之前的方法与实践，总结形成更完整的企业级RAG应用的优化建议以供参考。本篇将首先专注在RAG应用的索引阶段：让数据更容易被拆分成可理解的

阅读更多...