jmeter压力测试,通过LLM利用RAG实现知识库问答,NEO4J部署,GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答(9/7)

本文主要是介绍jmeter压力测试,通过LLM利用RAG实现知识库问答,NEO4J部署,GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答(9/7),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

        这周也是杂七杂八的一天(高情商:我是一块砖,哪里需要往哪里搬),首先是接触了jemter这个压力测试工具,然后帮公司的AIGC项目编写使用手册和问答手册的第一版,并通过这个平台的智能体实现知识库问答的功能展示,以及部分个人扩展和思考(NEO4J创建知识图谱的GraphRAG)。

Jmeter

        Jmeter是一个压力测试工具,一开始导师叫我熟悉的时候我还说这和postman差不多吗,但实际用下来,Jmeter的压力测试提供了很多自定义的请求内容和方法,和postman差别是很大的。虽然说因为公司这边和学校是有对接项目的,所以开学这段时间,有些项目他们那边的运维搞不定就又到我们这边了,虽然我感觉再给我压力跑跑也没什么太大的实际上的有用。。。

        jmeter去官网下载后,如果你的本地的java环境已经部署好的话,是可以直接跑的比较全的教程,包含配置环境 如果想尝试的,其实可以通过本地部署若依的网站进行测试(强烈建议不要在部署环境运行jmeter的测试),当然你也可以用其他的网站实现。

        在很多的网站中,其实在用户登入的过程中,不仅后台要忙前忙后,不知道呆在哪的数据库也有的慢,通常同一时间的并发实现登入过程,是对整个体系很大挑战,同理像学生选课需要频繁与数据库沟通也是如此,但一般情况下不会有这么大的同一时间访问量,但我相信大家都经历过四六级和选课。此时一般来说暂时的增加算力和流量都是一个不错的方法。

        在若依的网站中,通过登入界面来测试这个过程其实是一个不错的方法,首先摆在我们面前的就是验证码,其实这也是一个很好的保护措施,你也不想未来有一天你的网站数据库因为别人的自动化工具跑暴力解密跑死或者泄密吧。

        通过对项目内查询该网页的组件可以找到相应的功能模块https://blog.csdn.net/Li_Ning21/article/details/136713227 关停验证码功能

        我们在ruoyi-admin\src\main\java\com\ruoyi\web\controller\common\CaptchaController.java文件里面看到验证码的生成过程,是先生成验证码,再通过验证码生成图片,图片再通过流传输发送信息给前端。所以想要压力测试登入界面,就得关停验证码功能。

其他相关测试(JSEncrypt加密登录,类似的思路可以测试RAS,就是之前提到的若依的数据监控密码)

        【jmeter参数化--json格式非扁平化(存在嵌套)

        注意我们可能会在测试时发现,大量的sql请求可能使数据库反应不过来,因为超出了设置的最大请求数和缓存量等,这就需要更改相关的配置(conf)。(csdn很多相关教程,这里不再赘述)

通过LLM利用RAG实现知识库问答

        讲实话,其实并不是通过自己所写代码实现的(当然不),而是利用公司这个项目中的AIGC功能实现该项目自身使用手册进行装载,实现平台使用小助手的功能。

        其实该功能类似于coze以及文擎毕昇(就是用它的开源),一开始首先是通过简单将文档载入实现知识库的创建,以及知识的分片。但实际效果并不理想,回复不可控,容易出现不相关内容,容易胡说,失忆给定限定和角色。

        对于这些问题,尝试通过知识库增加提取限定关键词,预防胡说,对问题语义分析,实现检索召回对用户输入的问题生成3-4个含义相同但表述有差别的问题,再对这几个问题分别进行检索,实现回答内容的更大相关性和准确性,通过加入记忆器,存储之前的对话,尽可能避免出现失忆,限定token量。

        但实际情况下token量仍然不小,对后台的压力也不小,大量的访问估计很能顶住,而且模型的不同,对效果的实现也有不同,虽然通过多次限定和调整,但4o的能力仍然比其他国内大模型更强。原先通过构建智能体实现网页平台小助手的挂件功能估计也不会最后在未来的正式版中出现,可能以功能展示的方式展示。

        

 题外话:NEO4J创建知识图谱的GraphRAG

        这东西说来也奇妙,上面这些东西和主管交流后,主管说这些情况也比较正常,现在能比较好实现效果的也是微软开源的GraphRAG。

        说来也奇妙,看完相关的博客和文章后,有一种深深的熟悉感,在前几个月的课设,我的舍友拿着他不知道拿来的py项目问我会不会搞,没办法,当时确实不会搞,但是现在拿出来把这个项目自己过一遍,发现还真是GraphRAG🤣,幸好没搞好,真成了我都不知道老师看到这个会是什么表情,毕竟上课都没讲这些。

        因为这是别人的项目,我也不好直接放出。我只能说一下思路。

        加载(技能类别和职责类别的)特征词,并构建用于匹配这些特征词的 AC 自动机(Aho-Corasick automaton)。AC 自动机来识别问题中的特征词,并构建一个包含这些特征词及其类型的字典。

比如说,职位招聘公告问答流程

  1. 用户输入问题

    用户通过界面提出关于职位招聘的问题,例如“信息工程师需要哪些技能?”或“信息工程师的主要职责是什么?”
  2. 系统通过分类器识别问题类型

    利用自然语言处理技术,系统识别问题中的关键字和意图。例如,通过识别“技能”、“职责”等词汇,系统可以判断问题关注的是职位的技能要求还是工作内容。
  3. 分析器构建查询语句

    根据问题类型,系统构建相应的查询语句。在知识图谱中,这可能涉及到构建针对特定实体(如“信息工程师”)及其属性或关系的查询。
  4. 在数据库中检索答案

    使用构建的查询语句在知识图谱数据库中检索信息。知识图谱存储了丰富的实体和关系数据,使得系统能够快速找到相关的信息。
  5. 格式化答案并呈现给用户

    检索到的信息需要被格式化,以清晰、易于理解的方式呈现给用户。这可能包括整理数据结构、优化语言表达等。

知识图谱(KG)的应用

        与普通的RGA不同点在于,图的关系,在我们熟悉的E-R图中,圆圈为属性,方块为实体,而知识图谱则是着重体现每个实体之间的关系,他们之间的关系用有方向的线链接,知识图谱强调实体之间的关系,这使得它在处理复杂的、关系密集的数据时更为有效。如果图中信息工程师是一个实体,它连接着技能和职责两个实体,在职位招聘的场景中,知识图谱可以快速的锁定所需要回答答案,他不会因为像普通的RGA一样将大量的文本片段向量化去寻找关键词,而是确定关键词,分析所提问的是该关键词的下沿哪一个实体,然后再去询问数据库,不会产生大量的token数,也不会让LLM在大量的文本中迷失。

(镇帖图)

这篇关于jmeter压力测试,通过LLM利用RAG实现知识库问答,NEO4J部署,GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答(9/7)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1143685

相关文章

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

部署Vue项目到服务器后404错误的原因及解决方案

《部署Vue项目到服务器后404错误的原因及解决方案》文章介绍了Vue项目部署步骤以及404错误的解决方案,部署步骤包括构建项目、上传文件、配置Web服务器、重启Nginx和访问域名,404错误通常是... 目录一、vue项目部署步骤二、404错误原因及解决方案错误场景原因分析解决方案一、Vue项目部署步骤

如何使用Java实现请求deepseek

《如何使用Java实现请求deepseek》这篇文章主要为大家详细介绍了如何使用Java实现请求deepseek功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1.deepseek的api创建2.Java实现请求deepseek2.1 pom文件2.2 json转化文件2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

如何通过Python实现一个消息队列

《如何通过Python实现一个消息队列》这篇文章主要为大家详细介绍了如何通过Python实现一个简单的消息队列,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录如何通过 python 实现消息队列如何把 http 请求放在队列中执行1. 使用 queue.Queue 和 reque

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

使用Python快速实现链接转word文档

《使用Python快速实现链接转word文档》这篇文章主要为大家详细介绍了如何使用Python快速实现链接转word文档功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 演示代码展示from newspaper import Articlefrom docx import

前端原生js实现拖拽排课效果实例

《前端原生js实现拖拽排课效果实例》:本文主要介绍如何实现一个简单的课程表拖拽功能,通过HTML、CSS和JavaScript的配合,我们实现了课程项的拖拽、放置和显示功能,文中通过实例代码介绍的... 目录1. 效果展示2. 效果分析2.1 关键点2.2 实现方法3. 代码实现3.1 html部分3.2