jmeter压力测试,通过LLM利用RAG实现知识库问答,NEO4J部署,GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答(9/7)

本文主要是介绍jmeter压力测试,通过LLM利用RAG实现知识库问答,NEO4J部署,GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答(9/7),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

        这周也是杂七杂八的一天(高情商:我是一块砖,哪里需要往哪里搬),首先是接触了jemter这个压力测试工具,然后帮公司的AIGC项目编写使用手册和问答手册的第一版,并通过这个平台的智能体实现知识库问答的功能展示,以及部分个人扩展和思考(NEO4J创建知识图谱的GraphRAG)。

Jmeter

        Jmeter是一个压力测试工具,一开始导师叫我熟悉的时候我还说这和postman差不多吗,但实际用下来,Jmeter的压力测试提供了很多自定义的请求内容和方法,和postman差别是很大的。虽然说因为公司这边和学校是有对接项目的,所以开学这段时间,有些项目他们那边的运维搞不定就又到我们这边了,虽然我感觉再给我压力跑跑也没什么太大的实际上的有用。。。

        jmeter去官网下载后,如果你的本地的java环境已经部署好的话,是可以直接跑的比较全的教程,包含配置环境 如果想尝试的,其实可以通过本地部署若依的网站进行测试(强烈建议不要在部署环境运行jmeter的测试),当然你也可以用其他的网站实现。

        在很多的网站中,其实在用户登入的过程中,不仅后台要忙前忙后,不知道呆在哪的数据库也有的慢,通常同一时间的并发实现登入过程,是对整个体系很大挑战,同理像学生选课需要频繁与数据库沟通也是如此,但一般情况下不会有这么大的同一时间访问量,但我相信大家都经历过四六级和选课。此时一般来说暂时的增加算力和流量都是一个不错的方法。

        在若依的网站中,通过登入界面来测试这个过程其实是一个不错的方法,首先摆在我们面前的就是验证码,其实这也是一个很好的保护措施,你也不想未来有一天你的网站数据库因为别人的自动化工具跑暴力解密跑死或者泄密吧。

        通过对项目内查询该网页的组件可以找到相应的功能模块https://blog.csdn.net/Li_Ning21/article/details/136713227 关停验证码功能

        我们在ruoyi-admin\src\main\java\com\ruoyi\web\controller\common\CaptchaController.java文件里面看到验证码的生成过程,是先生成验证码,再通过验证码生成图片,图片再通过流传输发送信息给前端。所以想要压力测试登入界面,就得关停验证码功能。

其他相关测试(JSEncrypt加密登录,类似的思路可以测试RAS,就是之前提到的若依的数据监控密码)

        【jmeter参数化--json格式非扁平化(存在嵌套)

        注意我们可能会在测试时发现,大量的sql请求可能使数据库反应不过来,因为超出了设置的最大请求数和缓存量等,这就需要更改相关的配置(conf)。(csdn很多相关教程,这里不再赘述)

通过LLM利用RAG实现知识库问答

        讲实话,其实并不是通过自己所写代码实现的(当然不),而是利用公司这个项目中的AIGC功能实现该项目自身使用手册进行装载,实现平台使用小助手的功能。

        其实该功能类似于coze以及文擎毕昇(就是用它的开源),一开始首先是通过简单将文档载入实现知识库的创建,以及知识的分片。但实际效果并不理想,回复不可控,容易出现不相关内容,容易胡说,失忆给定限定和角色。

        对于这些问题,尝试通过知识库增加提取限定关键词,预防胡说,对问题语义分析,实现检索召回对用户输入的问题生成3-4个含义相同但表述有差别的问题,再对这几个问题分别进行检索,实现回答内容的更大相关性和准确性,通过加入记忆器,存储之前的对话,尽可能避免出现失忆,限定token量。

        但实际情况下token量仍然不小,对后台的压力也不小,大量的访问估计很能顶住,而且模型的不同,对效果的实现也有不同,虽然通过多次限定和调整,但4o的能力仍然比其他国内大模型更强。原先通过构建智能体实现网页平台小助手的挂件功能估计也不会最后在未来的正式版中出现,可能以功能展示的方式展示。

        

 题外话:NEO4J创建知识图谱的GraphRAG

        这东西说来也奇妙,上面这些东西和主管交流后,主管说这些情况也比较正常,现在能比较好实现效果的也是微软开源的GraphRAG。

        说来也奇妙,看完相关的博客和文章后,有一种深深的熟悉感,在前几个月的课设,我的舍友拿着他不知道拿来的py项目问我会不会搞,没办法,当时确实不会搞,但是现在拿出来把这个项目自己过一遍,发现还真是GraphRAG🤣,幸好没搞好,真成了我都不知道老师看到这个会是什么表情,毕竟上课都没讲这些。

        因为这是别人的项目,我也不好直接放出。我只能说一下思路。

        加载(技能类别和职责类别的)特征词,并构建用于匹配这些特征词的 AC 自动机(Aho-Corasick automaton)。AC 自动机来识别问题中的特征词,并构建一个包含这些特征词及其类型的字典。

比如说,职位招聘公告问答流程

  1. 用户输入问题

    用户通过界面提出关于职位招聘的问题,例如“信息工程师需要哪些技能?”或“信息工程师的主要职责是什么?”
  2. 系统通过分类器识别问题类型

    利用自然语言处理技术,系统识别问题中的关键字和意图。例如,通过识别“技能”、“职责”等词汇,系统可以判断问题关注的是职位的技能要求还是工作内容。
  3. 分析器构建查询语句

    根据问题类型,系统构建相应的查询语句。在知识图谱中,这可能涉及到构建针对特定实体(如“信息工程师”)及其属性或关系的查询。
  4. 在数据库中检索答案

    使用构建的查询语句在知识图谱数据库中检索信息。知识图谱存储了丰富的实体和关系数据,使得系统能够快速找到相关的信息。
  5. 格式化答案并呈现给用户

    检索到的信息需要被格式化,以清晰、易于理解的方式呈现给用户。这可能包括整理数据结构、优化语言表达等。

知识图谱(KG)的应用

        与普通的RGA不同点在于,图的关系,在我们熟悉的E-R图中,圆圈为属性,方块为实体,而知识图谱则是着重体现每个实体之间的关系,他们之间的关系用有方向的线链接,知识图谱强调实体之间的关系,这使得它在处理复杂的、关系密集的数据时更为有效。如果图中信息工程师是一个实体,它连接着技能和职责两个实体,在职位招聘的场景中,知识图谱可以快速的锁定所需要回答答案,他不会因为像普通的RGA一样将大量的文本片段向量化去寻找关键词,而是确定关键词,分析所提问的是该关键词的下沿哪一个实体,然后再去询问数据库,不会产生大量的token数,也不会让LLM在大量的文本中迷失。

(镇帖图)

这篇关于jmeter压力测试,通过LLM利用RAG实现知识库问答,NEO4J部署,GraphRAG以知识图谱在查询时增强提示实现更准确的知识库问答(9/7)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1143685

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

闲置电脑也能活出第二春?鲁大师AiNAS让你动动手指就能轻松部署

对于大多数人而言,在这个“数据爆炸”的时代或多或少都遇到过存储告急的情况,这使得“存储焦虑”不再是个别现象,而将会是随着软件的不断臃肿而越来越普遍的情况。从不少手机厂商都开始将存储上限提升至1TB可以见得,我们似乎正处在互联网信息飞速增长的阶段,对于存储的需求也将会不断扩大。对于苹果用户而言,这一问题愈发严峻,毕竟512GB和1TB版本的iPhone可不是人人都消费得起的,因此成熟的外置存储方案开

Java架构师知识体认识

源码分析 常用设计模式 Proxy代理模式Factory工厂模式Singleton单例模式Delegate委派模式Strategy策略模式Prototype原型模式Template模板模式 Spring5 beans 接口实例化代理Bean操作 Context Ioc容器设计原理及高级特性Aop设计原理Factorybean与Beanfactory Transaction 声明式事物

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

sqlite3 相关知识

WAL 模式 VS 回滚模式 特性WAL 模式回滚模式(Rollback Journal)定义使用写前日志来记录变更。使用回滚日志来记录事务的所有修改。特点更高的并发性和性能;支持多读者和单写者。支持安全的事务回滚,但并发性较低。性能写入性能更好,尤其是读多写少的场景。写操作会造成较大的性能开销,尤其是在事务开始时。写入流程数据首先写入 WAL 文件,然后才从 WAL 刷新到主数据库。数据在开始

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi