搜索中关于稀疏检索和稠密向量检索的召回效果比较

2024-02-22 00:04

文章标签 比较搜索效果检索召回向量稀疏稠密

本文主要是介绍搜索中关于稀疏检索和稠密向量检索的召回效果比较，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

不同检索方式说明

最近在做搜索召回提升相关的研究工作。对比了稀疏检索和稠密向量检索的效果。其中使用的搜索引擎为elasticsearch8.x版本。稀疏检索包括BM25的检索方式，以及es官方在8.8之后版本提供的稀疏向量模型的方式。稠密向量检索，是指借助机器学习的模型做文本嵌入，然后用es8.x以后版本提供的向量检索。

测试数据说明

测试数据包括了中文和英文，涉及了法律和新闻数据。

一、先说结论

相比较BM25检索，借助机器学习模型做文本嵌入的向量检索方式，有不错的效果。

同时，ES的稀疏向量模型，在英文场景下，相比较BM25和向量检索，仍然取得了更好的召回率提升效果。

BM25和向量检索以及稀疏向量检索之间的关系？

从测试数据来看，三者之间是互补的。

二、三种不同召回方式成功召回率对比效果

声明：这里取top50，如果命中标准答案则认为召回。

以一个测试集为例（法律数据），该测试集是有人工整理的198个问题，包含了问题和答案，相对质量较高。

在下图中，可以看到BM25成功召回177（89%）。

向量检索成功召回156个（79%）

稀疏向量成功召回187个（ 94%）

结论一：稀疏向量召回率 >BM25 > 稠密向量

只看每一种召回方式，召回效果。

稀疏向量成功召回187（ 94%） > BM25 成功召回177（89%）> 稠密向量成功召回156 （79%）

请注意这个结论！！! 其中向量检索的效果，会和向量模型有着非常密切的关系，会和测试数据集有非常密切的关系。关于BM25的召回效果好于向量检索，我自己也是不认可的。请看结论四。

结论二：三者是可以互补的

再看三路混合检索整体的召回效果，成功召回189，召回率95%，整体大于任何一个单个检索方式。

结论三：BM25 和稠密向量可以互补。

稀疏向量是收费才能使用的功能，且只针对英文效果出色。所以这里只看Bm25和稠密向量的方式。

统计1：其中BM25召回成功的，向量检索召回失败的有27个。13%

统计2：其中向量召回成功，但是BM25召回失败的有6个。3%

结论四：BM25是否真的好于向量检索？

其中向量检索，严重依赖外部的文本嵌入的模型，假如模型没有训练过某个领域的知识，则在向量embedding过程中，一定会都是语义，所以效果表现不佳，甚至是低于Bm25的召回效果。

于是又对比了不同的测试数据集: 这次是中文的新闻数据。共1704个case。向量召回率98% >bm

25召回率 95%

即使这样，我依然无法下一个结论说向量检索效果比BM25好，或者说差。还是取决于文本嵌入模型的能力，以及测试集样本。但是总是可以得出，而知没有绝对的谁领先，而是互补，1+1 >2的效果!

其中BM25 成功召回 1619，召回率95%。

其中向量成功召回 1675，召回率98.2%。

整体召回率，98.8%。两者可以互补的结论依然成立。

三、稀疏向量的提升效果

这是一个全新的测试数据集。也是法律数据和法律问题。与上边的测试集不同的是，这是人工整理的，没有杂质数据的干扰。

在英文场景下，稀疏向量的召回率相比较BM25，提升明显！提升到了100%，提升了14%

topK召回率有很大提升，top1提升了31%，top5提升了28.5%，top10提升了22%

四、应该如何选用召回方式

其中Bm25 是花费资源最少得检索方式。向量检索是花费资源最多的方式，因为要使用模型，其并发能力会受到资源限制。稀疏向量需要依赖官方提供的模型，是收费的功能，并且价格昂贵，且只支持英文场景，无法做多语言的混合场景，亲测中英混合的情况下，效果下降明显。

这篇关于搜索中关于稀疏检索和稠密向量检索的召回效果比较的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/733519。 23002807@qq.com

相关文章

Python使用DeepSeek进行联网搜索功能详解

Python使用DeepSeek进行联网搜索功能详解

《Python使用DeepSeek进行联网搜索功能详解》Python作为一种非常流行的编程语言,结合DeepSeek这一高性能的深度学习工具包,可以方便地处理各种深度学习任务,本文将介绍一下如何使用P... 目录一、环境准备与依赖安装二、DeepSeek简介三、联网搜索与数据集准备四、实践示例：图像分类1.

阅读更多...

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)

《Vue项目的甘特图组件之dhtmlx-gantt使用教程和实现效果展示(推荐)》文章介绍了如何使用dhtmlx-gantt组件来实现公司的甘特图需求,并提供了一个简单的Vue组件示例,文章还分享了一... 目录一、首先 npm 安装插件二、创建一个vue组件三、业务页面内引用自定义组件：四、dhtmlx

阅读更多...

前端原生js实现拖拽排课效果实例

前端原生js实现拖拽排课效果实例

《前端原生js实现拖拽排课效果实例》：本文主要介绍如何实现一个简单的课程表拖拽功能,通过HTML、CSS和JavaScript的配合,我们实现了课程项的拖拽、放置和显示功能,文中通过实例代码介绍的... 目录1. 效果展示2. 效果分析2.1 关键点2.2 实现方法3. 代码实现3.1 html部分3.2

阅读更多...

Redis存储的列表分页和检索的实现方法

Redis存储的列表分页和检索的实现方法

《Redis存储的列表分页和检索的实现方法》在Redis中,列表（List）是一种有序的数据结构,通常用于存储一系列元素,由于列表是有序的,可以通过索引来访问元素,因此可以很方便地实现分页和检索功能,... 目录一、Redis 列表的基本操作二、分页实现三、检索实现3.1 方法 1：客户端过滤3.2 方法

阅读更多...

C#比较两个List集合内容是否相同的几种方法

C#比较两个List集合内容是否相同的几种方法

《C#比较两个List集合内容是否相同的几种方法》本文详细介绍了在C#中比较两个List集合内容是否相同的方法,包括非自定义类和自定义类的元素比较,对于非自定义类,可以使用SequenceEqual、... 目录一、非自定义类的元素比较1. 使用 SequenceEqual 方法（顺序和内容都相等）2.

阅读更多...

对postgresql日期和时间的比较

对postgresql日期和时间的比较

《对postgresql日期和时间的比较》文章介绍了在数据库中处理日期和时间类型时的一些注意事项,包括如何将字符串转换为日期或时间类型,以及在比较时自动转换的情况,作者建议在使用数据库时,根据具体情况... 目录PostgreSQL日期和时间比较DB里保存到时分秒，需要和年月日比较db里存储date或者ti

阅读更多...

基于Python实现PDF动画翻页效果的阅读器

基于Python实现PDF动画翻页效果的阅读器

《基于Python实现PDF动画翻页效果的阅读器》在这篇博客中,我们将深入分析一个基于wxPython实现的PDF阅读器程序,该程序支持加载PDF文件并显示页面内容,同时支持页面切换动画效果,文中有详... 目录全部代码代码结构初始化 UI 界面加载 PDF 文件显示 PDF 页面页面切换动画运行效果总结主

阅读更多...

React实现原生APP切换效果

React实现原生APP切换效果

《React实现原生APP切换效果》最近需要使用Hybrid的方式开发一个APP,交互和原生APP相似并且需要IM通信,本文给大家介绍了使用React实现原生APP切换效果,文中通过代码示例讲解的非常... 目录背景需求概览技术栈实现步骤根据 react-router-dom 文档配置好路由添加过渡动画使用

阅读更多...

使用Python实现生命之轮Wheel of life效果

使用Python实现生命之轮Wheel of life效果

《使用Python实现生命之轮Wheeloflife效果》生命之轮Wheeloflife这一概念最初由SuccessMotivation®Institute,Inc.的创始人PaulJ.Meyer... 最近看一个生命之轮的视频，让我们珍惜时间，因为一生是有限的。使用python创建生命倒计时图表，珍惜时间

阅读更多...

C# ComboBox下拉框实现搜索方式

C# ComboBox下拉框实现搜索方式

《C#ComboBox下拉框实现搜索方式》文章介绍了如何在加载窗口时实现一个功能,并在ComboBox下拉框中添加键盘事件以实现搜索功能,由于数据不方便公开,作者表示理解并希望得到大家的指教... 目录C# ComboBox下拉框实现搜索步骤一步骤二步骤三总结C# ComboBox下拉框实现搜索步骤一这

阅读更多...