创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习

本文主要是介绍创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

昨天实现了句子的搜索,并且简单的更换了分词器,优化一下查询的结果,今天准备学习一下搜索提示的实现,并且设计一下如何使用java api实现搜索提示。

Suggest的学习

在查看官方文档之后,发现ElasticSearch的Suggest总共有四种类型

文档链接:http://doc.codingdict.com/elasticsearch/123/

  • Term Suggester
  • Phrase Suggester
  • Completion Suggester
  • Context Suggester
    然后我就一一了解了一下
    (1)Term suggester
    term 词项建议器,对给入的文本进行分词,为每个词进行模糊查询提供词项建议。对于在索引中存在词默认不提供建议词,不存在的词则根据模糊查询结果进行排序后取一定数量的建议词。
    常用的建议选项:
    在这里插入图片描述
    (2)phrase suggester
    phrase 短语建议,在term的基础上,会考量多个term之间的关系,比如是否同时出现在索引的原文里,相邻程度,以及词频等
    (3)Completion Suggester
    针对自动补全场景而设计的建议器。此场景下用户每输入一个字符的时候,就需要即时发送一次查询请求到后端查找匹配项,在用户输入速度较高的情况下对后端响应速度要求比较苛刻。因此实现上它和其他Suggester采用了不同的数据结构,索引并非通过倒排来完成,而是将analyze过的数据编码成FST和索引一起存放。对于一个open状态的索引,FST会被ES整个装载到内存里的,进行前缀查找速度极快。但是FST只能用于前缀查找,这也是Completion Suggester的局限所在。
    这个是我准备重点使用的Suggester
    注意:使用这个需要在被搜索的字段中设置type为completion,analyzer按情况设置分析器。才能实现自动的补全
    (4)Context Suggester
    好像能通过设置字段,实现上下文的映射。 有两种类型: category 和 geo 。 上下文映射在字段映射中的 contexts 参数下配置。看了半天文档没看明白,好像是能实现:设置地理位置的上下文然后进行地理映射
    具体文档http://doc.codingdict.com/elasticsearch/124/

设计

通过简单的了解,感觉使用ES实现搜索框的补全/纠错功能应该以如下的方式设计:
(1)在用户刚开始输入的过程中,使用Completion Suggester进行关键词前缀匹配,刚开始匹配项会比较多,随着用户输入字符增多,匹配项越来越少。如果用户输入比较精准,可能Completion Suggester的结果已经够好,用户已经可以看到理想的备选项了。
(2)如果Completion Suggester已经到了零匹配,那么可以猜测是否用户有输入错误,这时候可以尝试一下Phrase Suggester。
(3)如果Phrase Suggester没有找到任何option,开始尝试term Suggester。
最后一个Context Suggester,还是不知道该怎么用。。。。。

Completion Suggester的尝试

了解到如果使用 Completion Suggester的话,需要在建立索引的时候,设置field重的suggest的type和analyzer,所以打算找一个demo先学习一下。

参考链接:https://zq99299.github.io/note-book/elasticsearch-senior/es-high/76-completion-suggest.html#什么是-completion-suggest-?

(1)新建索引

PUT /news_website
{"mappings": {"news" : {"properties" : {"title" : {"type": "text","analyzer": "ik_max_word","fields": {"suggest" : {"type" : "completion","analyzer": "ik_max_word"}}},"content": {"type": "text","analyzer": "ik_max_word"}}}}
}

在这里插入图片描述
发现关键的配置是:
在这里插入图片描述
有了这个才能实现自动补全
(2)插入测试数据

PUT /news_website/news/1
{"title": "大话西游电影","content": "大话西游的电影时隔20年即将在2017年4月重映"
}
PUT /news_website/news/2
{"title": "大话西游小说","content": "某知名网络小说作家已经完成了大话西游同名小说的出版"
}
PUT /news_website/news/3
{"title": "大话西游手游","content": "网易游戏近日出品了大话西游经典IP的手游,正在火爆内测中"
}

在这里插入图片描述
(3)尝试进行搜索

GET /news_website/news/_search
{"suggest": {"my-suggest" : {"prefix" : "大话西游","completion" : {"field" : "title.suggest"}}}
}

在这里插入图片描述
注意到结果自动匹配到了三条数据
并且发现搜索的field也有讲究:
在这里插入图片描述

总结

在学习了Suggester之后,我发现自己需要重新按Completion Suggester的要求建立索引,最终才能实现搜索提示。

这篇关于创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/685445

相关文章

C#实现将Excel表格转换为图片(JPG/ PNG)

《C#实现将Excel表格转换为图片(JPG/PNG)》Excel表格可能会因为不同设备或字体缺失等问题,导致格式错乱或数据显示异常,转换为图片后,能确保数据的排版等保持一致,下面我们看看如何使用C... 目录通过C# 转换Excel工作表到图片通过C# 转换指定单元格区域到图片知识扩展C# 将 Excel

Java使用ANTLR4对Lua脚本语法校验详解

《Java使用ANTLR4对Lua脚本语法校验详解》ANTLR是一个强大的解析器生成器,用于读取、处理、执行或翻译结构化文本或二进制文件,下面就跟随小编一起看看Java如何使用ANTLR4对Lua脚本... 目录什么是ANTLR?第一个例子ANTLR4 的工作流程Lua脚本语法校验准备一个Lua Gramm

Java Optional的使用技巧与最佳实践

《JavaOptional的使用技巧与最佳实践》在Java中,Optional是用于优雅处理null的容器类,其核心目标是显式提醒开发者处理空值场景,避免NullPointerExce... 目录一、Optional 的核心用途二、使用技巧与最佳实践三、常见误区与反模式四、替代方案与扩展五、总结在 Java

基于Java实现回调监听工具类

《基于Java实现回调监听工具类》这篇文章主要为大家详细介绍了如何基于Java实现一个回调监听工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录监听接口类 Listenable实际用法打印结果首先,会用到 函数式接口 Consumer, 通过这个可以解耦回调方法,下面先写一个

使用Java将DOCX文档解析为Markdown文档的代码实现

《使用Java将DOCX文档解析为Markdown文档的代码实现》在现代文档处理中,Markdown(MD)因其简洁的语法和良好的可读性,逐渐成为开发者、技术写作者和内容创作者的首选格式,然而,许多文... 目录引言1. 工具和库介绍2. 安装依赖库3. 使用Apache POI解析DOCX文档4. 将解析

Qt中QGroupBox控件的实现

《Qt中QGroupBox控件的实现》QGroupBox是Qt框架中一个非常有用的控件,它主要用于组织和管理一组相关的控件,本文主要介绍了Qt中QGroupBox控件的实现,具有一定的参考价值,感兴趣... 目录引言一、基本属性二、常用方法2.1 构造函数 2.2 设置标题2.3 设置复选框模式2.4 是否

Qt中QUndoView控件的具体使用

《Qt中QUndoView控件的具体使用》QUndoView是Qt框架中用于可视化显示QUndoStack内容的控件,本文主要介绍了Qt中QUndoView控件的具体使用,具有一定的参考价值,感兴趣的... 目录引言一、QUndoView 的用途二、工作原理三、 如何与 QUnDOStack 配合使用四、自

C++使用printf语句实现进制转换的示例代码

《C++使用printf语句实现进制转换的示例代码》在C语言中,printf函数可以直接实现部分进制转换功能,通过格式说明符(formatspecifier)快速输出不同进制的数值,下面给大家分享C+... 目录一、printf 原生支持的进制转换1. 十进制、八进制、十六进制转换2. 显示进制前缀3. 指

springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法

《springboot整合阿里云百炼DeepSeek实现sse流式打印的操作方法》:本文主要介绍springboot整合阿里云百炼DeepSeek实现sse流式打印,本文给大家介绍的非常详细,对大... 目录1.开通阿里云百炼,获取到key2.新建SpringBoot项目3.工具类4.启动类5.测试类6.测

Python运行中频繁出现Restart提示的解决办法

《Python运行中频繁出现Restart提示的解决办法》在编程的世界里,遇到各种奇怪的问题是家常便饭,但是,当你的Python程序在运行过程中频繁出现“Restart”提示时,这可能不仅仅是令人头疼... 目录问题描述代码示例无限循环递归调用内存泄漏解决方案1. 检查代码逻辑无限循环递归调用内存泄漏2.