期待一下elasticsearch还未发布的8.12版本，由lucene底层带来的大幅度提升

2023-12-10 15:20

文章标签 elasticsearch 发布版本底层提升一下 lucene 带来期待大幅度 8.12

本文主要是介绍期待一下elasticsearch还未发布的8.12版本，由lucene底层带来的大幅度提升，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

现在是北京时间23年12月10日。当前es最新版本还是es8.11版本。我们可以期待一下不久的将来，es的8.12版本看到大幅度的检索性能提升。受益于 Lucene 9.9版本，内核带来的大幅提升！

此次向量检索利用底层指令fma会性能提升5%。并且还提供了向量点积的能力。重点较大幅度提升了多关键词匹配topK的搜索场景。

核心提升两个场景

一次检索中。很多个检索关键词（例如（term_1 OR term_2 OR ... OR term_n）），之间and或者or操作的检索在topK召回的时候大幅提速。
向量线索提速。

详细提升细节

以下两点，是提升搜索性能的细节。其主要思路是，跳过更多的数据。（这里就不翻译提取来。害怕误人子弟。大家想了解为什么，一定要看下边的原文）

使用许多和/或高频术语（注释 FK）为 top-k 查询带来加速
使用 block-max MAXSCORE 进行更多跳跃（注释 FU）

以下两点，是向量检索的提升细节。

使用 SIMD 指令加速矢量搜索
FMA 式向量相似度计算

基准测试结果对比

以下是基准测试在 Lucene 9.6（2023 年 5 月）和 Lucene 9.9（2023 年 12 月）之间观察到的一些加速：

AndHighHigh：快 35%
AndHighMed：快 15%
OrHighHigh：快 60%
OrHighMed：快 38%
CountAndHighHigh：快 15%
CountAndHighMed：快 11%
CountOrHighHigh：快 145%
CountOrHighMed：快 155%
TermDTSort：快 24%
TermTitleSort：快 290%（不是拼写错误！）
TermMonthSort：快 7%
DayOfYearSort：快 25%
矢量搜索：速度提高 5%

这里可以看到lucene所有的基准测试结果：

Lucene nightly benchmarks

参考es官方博客：Apache Lucene 9.9, the fastest Lucene release ever — Elastic Search Labs

这篇关于期待一下elasticsearch还未发布的8.12版本，由lucene底层带来的大幅度提升的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/477494。 23002807@qq.com

相关文章

利用Python快速搭建Markdown笔记发布系统

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言：为什么要自建知识博客一、技术选型：极简主义开发栈二、系统架构设计三、核心代码实现（分步解析

阅读更多...

浅谈配置MMCV环境,解决报错,版本不匹配问题

浅谈配置MMCV环境,解决报错,版本不匹配问题

《浅谈配置MMCV环境,解决报错,版本不匹配问题》：本文主要介绍浅谈配置MMCV环境,解决报错,版本不匹配问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录配置MMCV环境,解决报错,版本不匹配错误示例正确示例总结配置MMCV环境,解决报错,版本不匹配在col

阅读更多...

微信公众号脚本-获取热搜自动新建草稿并发布文章

微信公众号脚本-获取热搜自动新建草稿并发布文章

《微信公众号脚本-获取热搜自动新建草稿并发布文章》本来想写一个自动化发布微信公众号的小绿书的脚本,但是微信公众号官网没有小绿书的接口,那就写一个获取热搜微信普通文章的脚本吧,：本文主要介绍微信公众... 目录介绍思路前期准备环境要求获取接口token获取热搜获取热搜数据下载热搜图片给图片加上标题文字上传图片

阅读更多...

Elasticsearch 在 Java 中的使用教程

Elasticsearch 在 Java 中的使用教程

《Elasticsearch在Java中的使用教程》Elasticsearch是一个分布式搜索和分析引擎,基于ApacheLucene构建,能够实现实时数据的存储、搜索、和分析,它广泛应用于全文... 目录1. Elasticsearch 简介2. 环境准备2.1 安装 Elasticsearch2.2 J

阅读更多...

Linux卸载自带jdk并安装新jdk版本的图文教程

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

阅读更多...

SpringKafka消息发布之KafkaTemplate与事务支持功能

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优

阅读更多...

Tomcat版本与Java版本的关系及说明

Tomcat版本与Java版本的关系及说明

《Tomcat版本与Java版本的关系及说明》：本文主要介绍Tomcat版本与Java版本的关系及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Tomcat版本与Java版本的关系Tomcat历史版本对应的Java版本Tomcat支持哪些版本的pythonJ

阅读更多...

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

《新特性抢先看!Ubuntu25.04Beta发布:Linux6.14内核》Canonical公司近日发布了Ubuntu25.04Beta版，这一版本被赋予了一个活泼的代号——“Plu... Canonical 昨日（3 月 27 日）放出了 Beta 版 Ubuntu 25.04 系统镜像，代号“Pluc

阅读更多...

IDEA中Git版本回退的两种实现方案

IDEA中Git版本回退的两种实现方案

《IDEA中Git版本回退的两种实现方案》作为开发者,代码版本回退是日常高频操作,IntelliJIDEA集成了强大的Git工具链,但面对reset和revert两种核心回退方案,许多开发者仍存在选择... 目录一、版本回退前置知识二、Reset方案：整体改写历史1、IDEA图形化操作（推荐）1.1、查看提

阅读更多...

JDK多版本共存并自由切换的操作指南(本文为JDK8和JDK17)

JDK多版本共存并自由切换的操作指南(本文为JDK8和JDK17)

《JDK多版本共存并自由切换的操作指南(本文为JDK8和JDK17)》本文介绍了如何在Windows系统上配置多版本JDK（以JDK8和JDK17为例）,并通过图文结合的方式给大家讲解了详细步骤,具有... 目录第一步下载安装JDK第二步配置环境变量第三步切换JDK版本并验证可能遇到的问题前提：公司常

阅读更多...